Todo mundo que faz SEO sabe que o segredo é que o site seja incluído no mecanismo de busca. Se o seu site não estiver incluído no mecanismo de busca, então o SEO está fora de questão. Portanto, se você deseja que seu site seja descoberto pelos mecanismos de pesquisa e que suas páginas da web sejam indexadas adequadamente pelos mecanismos de pesquisa, você deve primeiro tornar seu site fácil de ser rastreado por spiders. As ferramentas usadas pelos motores de busca para rastrear páginas da web são chamadas de spiders ou robôs rastreadores, e seu nome em inglês é robot. Esses spiders rastreiam muitas de nossas páginas ao longo dos hiperlinks, mas algumas páginas não podem ser rastreadas. Algumas delas ocorrem porque o próprio site tem alguns problemas que não conduzem ao rastreamento de spiders, dificultando a indexação das páginas correspondentes pelos mecanismos de pesquisa. , formando assim uma "" Armadilha de aranha "geralmente se refere a tecnologias de produção de sites que não são amigáveis para os mecanismos de pesquisa. Essas tecnologias não conduzem ao rastreamento de aranhas em nossas páginas. Para evitar essa situação, Xiaowuming resumiu os seguintes fatores para evitar que aranhas entrando na armadilha.
1: Páginas que usam IDs de sessão Alguns sites de vendas usarão IDs de sessão para rastrear usuários a fim de analisar determinadas informações do usuário. Ao acessar o site, cada usuário adicionará um ID de sessão ao URL. tratado como um novo usuário. Cada vez que o spider visitar o URL, um ID de sessão será adicionado. Isso resultará na mesma página, mas em URLs diferentes, resultando em páginas de conteúdo altamente repetitivas. também é uma das armadilhas para aranhas mais comuns. Por exemplo, para melhorar o desempenho de vendas, alguns sites realizam conversas pop-up, como olá amigos do XXX, etc.
2: Armadilhas de aranha de bom senso que usam registro ou login forçado para acessar páginas Isso é bastante difícil para os spiders, porque os spiders não podem enviar o registro e não podem inserir nomes de usuário e senhas para fazer login e visualizar o conteúdo. clicar para visualizar diretamente também é o conteúdo que os spiders podem ver.
3: Gosto de sites que usam Flash A razão pela qual digo que gosto de sites que usam Flash é porque para algumas pequenas e médias empresas, porque o próprio Flash pode fazer muitos tipos de efeitos, especialmente quando é usado na navegação, ele. tem um forte efeito visual, por isso muitos sites de empresas gostam de usar flash para mostrar a força, cultura, produtos de suas empresas, etc. Até mesmo a página inicial de alguns sites corporativos é um flash, seja saltando para outra página através do flash após um determinado período de vez ou usando flash, os links permitem que os usuários cliquem para entrar em uma nova página, mas é difícil para os spiders lerem o conteúdo em flash, por isso também é difícil para os spiders clicarem nos links em flash.
4: URL dinâmico, adição de muitos símbolos ou parâmetros de URL ao URL, etc. Esse tipo de armadilha de aranha que mencionei na otimização de URL, embora com o desenvolvimento tecnológico dos mecanismos de pesquisa, URLs dinâmicos sejam menos eficazes para os spiders rastreá-lo. está se tornando cada vez menos problemático, mas em termos de facilidade de uso dos mecanismos de pesquisa, URLs estáticos ou mesmo pseudoestáticos são relativamente melhores do que URLs dinâmicos. Você pode dar uma olhada em quantos colegas de SEO lidam com URLs.
5: Frames No início, os frames eram amplamente usados em todos os lugares, mas agora muitos sites em páginas da web raramente os usavam. Primeiro, com o desenvolvimento dos principais sistemas CMS, a manutenção do site tornou-se relativamente mais fácil. frames são usados é porque é conveniente para a manutenção das páginas do site. Além disso, não é propício à inclusão em mecanismos de pesquisa e é uma das razões pelas quais os frames são cada vez menos usados.
6: JS, embora os mecanismos de pesquisa agora possam rastrear e até mesmo tentar desmontar e analisar links em JavaScript, é melhor não esperar que os mecanismos de pesquisa superem as dificuldades por conta própria. Embora alguma navegação eficaz possa ser feita por meio de JS, mas CSS também pode. faça isso; para melhorar a simpatia do site para os mecanismos de busca, é recomendado tornar a página web melhor rastreável por spiders, tente não usar js. Claro que em seo, uma vantagem do js é que o webmaster usa. não deseja que as páginas sejam incluídas ou links amigáveis podem usar js. Outra maneira de eliminar as armadilhas de aranha Javascript é usar a tag <noscript>. A tag <noscript> fornece código alternativo para navegadores que não suportam JavaScript. Os spiders não executam JavaScript, então, em vez disso, processam o código <noscript>.
7: Páginas da web profundas, algumas das quais não têm entrada e estão longe da página inicial do site, são relativamente difíceis de serem rastreadas pelos spiders. Claro, pode ser uma questão diferente para sites com alto peso. Para que uma página de site seja incluída, ela deve primeiro ter um peso básico. O peso da página inicial é geralmente o mais alto e, em seguida, o peso da página inicial pode ser passado para as páginas internas. sobe até o limite que pode ser incluído, a página irá. De acordo com esta teoria, a transferência de peso entre as páginas diminuirá. Portanto, quanto mais próxima for a distância do clique entre a página interna e a página inicial, mais fácil será obter mais peso. transferência na página inicial. Uma boa estrutura de site pode permitir a inclusão de mais páginas do site.
8: O uso forçado de cookies equivale à desativação direta de cookies para mecanismos de pesquisa. Alguns sites usarão cookies forçados para realizar determinadas funções, como rastrear caminhos de acesso do usuário, lembrar informações do usuário ou até mesmo roubar privacidade do usuário, etc. se o usuário não habilitar os cookies ao visitar tais sites, a página exibida será anormal, de forma que a mesma página web não poderá ser acessada normalmente pelos spiders.
9: Várias formas de saltos. Acredito que muitas crianças de SEO já estão familiarizadas com os redirecionamentos 301. No entanto, os spiders estão muito enojados com outros 302, ou saltos como meta atualização, javascript, flash, etc., e 301 não é o último. resort Quando usado, qualquer salto causará obstáculos ao rastejamento da aranha até certo ponto, então você sabe.
10: Erros de escrita de Robots.txt e várias técnicas de trapaça, como texto oculto, links ocultos, etc., usando páginas da web disfarçadas para exibir diferentes páginas da web para determinar se o visitante é um spider ou um navegador comum e usando o erro padrão 404 páginas, etc., também causarão obstáculos de rastreamento para aranhas. Fonte deste artigo: Site Shenzhen SEO: http://www.zhsem.com/ Respeite a originalidade, indique ao reimprimir, obrigado!
O espaço pessoal do autor Xiao Wuming