Em 25 de junho, o autor publicou um artigo "Usando redirecionamentos 301 de maneira inteligente para converter erros 404 em links externos de sites" e falou sobre como usar redirecionamentos 301 para converter URLs de erro obtidos de fora em URLs acessíveis, de modo a alcançar o. transferência de artigos ponderados.
Hoje vi um artigo no A5 chamado "Uma breve discussão sobre os perigos de usar o redirecionamento 301 para transferir páginas 404 para seus próprios links externos", que refutou as opiniões do meu artigo anterior. Acho que é muito bom. A indústria de SEO deveria ter esse tipo de espírito questionador e a capacidade de pensar de forma independente. Li o artigo com atenção e descobri que o autor não entendeu meu significado. Portanto, escreverei outro artigo para esclarecer o ponto de vista e apresentar a função do redirecionamento 301. Primeiramente, esclareço duas ideias no artigo “Usando o redirecionamento 301 para converter erros 404 em links externos de sites”:
O artigo fala sobre como redirecionar o URL do erro 404 de volta para o URL original por meio do 301. Este ponto precisa ser explicado. Não mencionei nenhum 301 para a página inicial ou outras páginas do artigo. O exemplo do artigo é sobre links de um site externo (site B) para seu próprio site (site A). podem ocorrer erros ortográficos de URL, adições de links incorretas ou até mesmo a geração intencional de URLs errados. Em vez de um erro 404 no próprio site A.
O texto original está sempre lá e os amigos que tiverem dúvidas podem lê-lo com atenção. Deixe-me refutar o ponto de vista deste amigo abaixo (as palavras em azul são as opiniões de amigos que têm opiniões refutáveis):
Refute o primeiro parágrafo
O autor original atribuiu os erros 404 no link externo apontando para fora do site. Esta frase é compreensível, porém, a ocorrência desse erro 404 também é determinada pelo próprio programa do site. escape, como Também pode haver muitas páginas 404 com sufixos como este ou aquele na página A5. Basta adicionar 1.html e 2.html diretamente no final, e pronto. como essas páginas da Web, isso também é para trazer links para o site, só isso, vai gerar uma página 404 e nada mais.
Se ocorrer um erro 404 no site, não é necessariamente um problema com o programa interno do site. Se o spider rastrear até seu próprio site (tome o site A como exemplo) por meio de um URL errado em um site externo (tome o site B como exemplo), também causará um erro 404, ou seja, o URL errado leva ao página errada. O spider não se importa se o URL vinculado existe dentro ou fora do site. Contanto que ocorra uma "página não existe" durante o rastreamento ao longo do URL, um erro 404 será registrado.
Podemos ver isso claramente na coluna "Status da operação" - "Erros de rastreamento" - "Não encontrado" das Ferramentas do administrador do Google. Os erros 404 são divididos pelo Google em duas categorias: “no mapa do site” (causa interna) e “domínio vinculado à página do seu site” (causa externa).
Como o nome sugere, o “domínio com link para a página do seu site” refere-se ao URL que liga o site B ao site A.
Segundo parágrafo da refutação
O autor original quer entender o peso desse aspecto e quer devolver diretamente o peso desse link externo em vez de deixá-lo ir. Aqui, o autor também tem seu próprio ponto de vista sobre esse tipo de link externo "http. :/ /www.xxxxx.com/rich-snippets.htmlGFQ", este tipo de link externo leva a páginas 404. Se você 301 essas páginas, esta situação será a mesma que um grande número de páginas 404 no site, e então diretamente A situação de 404 páginas e 301 para uma página é a mesma então se o seu site tem 404 páginas, para evitar a perda desses pesos, todas essas páginas deveriam ser 301 para a página inicial; requisitos dos motores de busca. Se você quiser Se você sabe disso claramente, basta pesquisar "Os perigos da página 404 301 para a página inicial" no Baidu e você saberá mais.
Em primeiro lugar, os motores de busca obviamente têm uma distinção clara entre “comportamento próprio” e “comportamento externo”. Tomemos como exemplo o link building. Links internos e links externos têm efeitos diferentes em termos de peso. Todo mundo sabe disso. A ideia central é que os links externos estão além do controle do webmaster, enquanto os links internos podem ser definidos pelo webmaster. Embora no processo de desenvolvimento dos motores de busca tenha surgido o fator “links externos que podem ser controlados pelo webmaster” (ou seja, construção comum de links externos). Mas independentemente de ser controlável ou incontrolável, uma ideia é clara, ou seja, ninguém enviará a URL errada sob a premissa de que sites de outras pessoas podem publicar a URL correta, fazendo com que os usuários não consigam acessar seu próprio site normalmente ou não conseguirem acessar seu próprio site. As palavras "Esta página não existe" aparecem no site.
Em segundo lugar, se 301 vai para a página original ou 301 vai para a página inicial. Não quero falar mais sobre isso, todos podem entender o que quero dizer lendo o texto original. O que quero dizer aqui são alguns sinais de como os motores de busca identificam a fonte do texto original:
Onde os mecanismos de pesquisa veem o conteúdo pela primeira vez
Confiabilidade de nomes de domínio com muitos conteúdos semelhantes
Onde há mais links (links internos no texto original)
Se a cópia está vinculada à fonte original (link de direitos autorais)
Devido à existência do segundo sinal, muitos dos conteúdos publicados ou reimpressos em outros sites pelos nossos autores originais não conseguem obter boas classificações. Muitos autores também reclamaram disso. Mas podemos utilizar os sinais de 1, 3 e 4 pontos para corrigir este erro.
O Baidu não é muito bom nisso, mas o Google pode identificar com rapidez e precisão a fonte do texto original. Isto se deve aos 3 pontos acima. O fator "se a cópia direciona de volta para a fonte original" também é um dos propósitos explicados em meu artigo "Usando o redirecionamento 301 para converter erros 404 em links externos de sites". o peso.
Por fim, redirecione um URL incorreto que o usuário não consegue acessar para o URL correto por meio de 301 de maneira razoável. Também ajuda na experiência do usuário. Também vemos esta frase nos "Erros de rastreamento" das Ferramentas de administração do Google.
O Googlebot não consegue rastrear o URL porque ele aponta para uma página que não existe. Normalmente, um erro 404 não afetará a classificação do seu site nos resultados de pesquisa, mas você pode usá-lo para melhorar a experiência do usuário.
A única maneira de resolver erros 404 é bloquear o robots.txt ou usar redirecionamentos 301. Não acho que o bloqueio melhore a experiência do usuário. A abordagem robots.txt só pode melhorar a experiência do spider. Porque depois que o usuário clica na URL errada, ele ainda acessa uma página que não existe e vê um erro 404.
Refute o terceiro parágrafo
Copie diretamente as palavras originais "Se um código diferente de 404 ou 410 for retornado para uma página da web inexistente (ou o usuário for redirecionado para outras páginas da web, como a página inicial, em vez de retornar 404), poderão ocorrer problemas. Primeiro de tudo , isso equivale a informar o mecanismo de pesquisa. Como resultado, os mecanismos de pesquisa podem rastrear esse URL e indexar seu conteúdo porque o Googlebot gasta muito tempo processando páginas inexistentes e pode não conseguir encontrar seu URL de forma rápida ou frequente. esses URLs, você não poderá visitá-los com frequência suficiente para impactar o rastreamento do conteúdo do seu site (além disso, você não deseja que seu site apareça com frequência em consultas de pesquisa para "Arquivo não encontrado"). Página 404, se você não continuar pulando para a página de erro conforme necessário, o que pode acontecer é que seu site terá um grande número de páginas iguais, o mesmo título, a mesma descrição, o mesmo conteúdo, etc. , e então isso é diferente A história entre o URL e o mesmo conteúdo Quanto ao que acontecerá no futuro Você pode ir ao Baidu ou pesquisar no Google para descobrir.
Como o amigo refutado mencionou as Diretrizes para Administradores do Google, não se esqueça de extrair outro parágrafo:
De modo geral, os erros 404 não afetarão a classificação do seu site no Google, então você pode ignorá-los com segurança. Esses erros geralmente são resultado de erros ortográficos, configurações incorretas (como links gerados automaticamente por sistemas de gerenciamento de conteúdo) ou esforços crescentes do Google para identificar e rastrear links em conteúdo incorporado, como javascript.
Para ver a origem de um link inativo, clique no URL em questão. Na caixa de diálogo de erro, clique na guia Link da página seguinte. Se links relevantes vierem do seu site, corrija-os ou remova-os. Se esses links vierem de sites externos, você poderá usar esses dados para melhorar a experiência do usuário em seu site. Por exemplo, se alguém quisesse criar um link para o seu site, mas o digitasse incorretamente, um URL legítimo seria digitado incorretamente (como www.example.com/awesome em vez de www.example.com/awsome ). Em vez de retornar um erro 404, você pode redirecionar 301 um URL com erro ortográfico para o URL correto e obter o tráfego esperado por meio desse link. Você também pode ajudar os usuários a encontrar o que procuram depois de direcioná-los para uma página 404, em vez de apenas mostrar "404 não encontrado". No entanto, recomendamos seguir essas etapas apenas se o link incorreto estiver gerando uma grande quantidade de tráfego.
Link da fonte: https://support.google.com/webmasters/bin/answer.py?hl=zh-Hans&answer=2409439
Infelizmente, este amigo só viu um, mas não o outro. Quando estamos fazendo SEO, as informações oficiais são muito importantes. Muitos detalhes estão ocultos nelas e leva muito tempo para lê-las e entendê-las com atenção.
Na verdade, muitas das configurações e descrições nas Ferramentas de administração do Google fazem sentido. Acontece que alguns de nós, SEOs, não queremos entender. Assim como as causas internas e externas do 404, faz sentido distingui-las no item “erro de rastreamento”. Em vez de apenas fazer isso quando não há nada para fazer.
Resumo: Como SEOs, precisamos absorver muito conhecimento e, ao mesmo tempo, desenvolver nossas próprias ideias e formas de analisar problemas. Mas você precisa ter certeza de que o conhecimento que você aprende é avançado e não desatualizado. Caso contrário, suas ideias podem ser facilmente enganadas, resultando em maus resultados.
Debater opiniões também é uma parte muito importante do trabalho de SEO. Ninguém pode dizer com certeza que a sua compreensão está correta. Só podemos usar algumas informações oficiais divulgadas e as nossas próprias conclusões tiradas através da análise de dados para provar a correção das nossas ideias e teorias.
Este artigo foi publicado originalmente por Yang Fan no SEO de Yang. Mantenha o link para reimpressão: http://www.seoyangs.com/404-301-original-page.html.
(Editor: Chen Long) Espaço pessoal do autor AimarYang