1. robots.txt e meta-robôs
A maioria dos sites agora usa CMS, e deve existir conteúdo que não precise ser indexado, portanto, o robots.txt é extremamente importante. Além disso, o conteúdo que não pode ser totalmente controlado pelo robots.txt é melhor bloqueado por meta-robôs da indexação do mecanismo de pesquisa. Não pense que quanto mais incluído, melhor. Quanto mais conteúdo irrelevante um mecanismo de busca incluir de um site, maior será a possibilidade de dispersão do peso do conteúdo relevante.
2. Redirecionamento 301 e unificação de nomes de domínio
O conteúdo que precisa ser redirecionado deve usar o redirecionamento 301. O 302 é relativamente sensível ao Google e pode ser facilmente considerado trapaça. Em relação à questão da unificação dos nomes de domínio, além de redirecionar www.xxx.com para xxx.com, devemos também garantir que www.xxx.com/a.html possa ser redirecionado com sucesso para xxx.com/a.html. Esse problema é principalmente para o Baidu, e o Google pode resolvê-lo disfarçadamente por meio de ferramentas para webmasters.
3. Caminhos relativos e entradas de gerenciamento
Conforme mencionado anteriormente, a maioria dos sites usa cms. É melhor usar caminhos absolutos para alguns links no modelo CMS, caso contrário, haverá muito mais erros 404 à medida que os caminhos mudam. Muitos CMS têm entradas de login de administrador reservadas, que serão rastreadas pelos mecanismos de pesquisa se essa entrada for deixada na página; ., mesmo que sua indexação seja bloqueada, mecanismos de busca como Yahoo e Baidu irão ocasionalmente incluí-lo no escopo de inclusão. Portanto, é melhor garantir o isolamento dos links relacionados ao segundo plano, ou seja, excluir a entrada do. plano de fundo da página. Ao mesmo tempo, reservar o link do administrador também é um risco à segurança e pode ser facilmente explorado por pessoas com segundas intenções.
Fonte: http://yeeseo.com/html/3-neglected-seo-details.html