A padronização de URL sempre foi um problema que preocupa webmasters e mecanismos de busca. Estima-se que 10% a 30% dos URLs na Internet são URLs não padronizados com o mesmo conteúdo, mas URLs diferentes. Isto cria vários problemas. por exemplo:
Para webmasters, a existência de vários URLs dispersa o peso da página e não favorece a classificação.
Para os motores de busca, é um desperdício de recursos e largura de banda.
Quando os motores de busca descobrem que vários URLs têm o mesmo conteúdo, eles não os punirão, mas farão o possível para encontrar o URL que deve ser padronizado. Mas, afinal, um programa é apenas um programa e pode dar errado, e o escolhido pode não ser o URL padronizado que o webmaster deseja.
Se o problema de padronização de URL no site for muito grave, também poderá afetar a inclusão. Um nome de domínio com baixa autoridade tem um número limitado de páginas totais que podem ser incluídas. Os mecanismos de pesquisa gastam recursos para incluir URLs não padrão, deixando menos recursos para conteúdos verdadeiramente diferentes.
Existem muitas opções para resolver o problema de canonização de URLs. Por exemplo: definir a versão com 3W e sem 3W nas ferramentas de administrador do Google, qual delas é a versão padronizada, usar o redirecionamento 301, redirecionar todos os URLs não padronizados para URLs padronizados e. garantir que o sistema CMS usado gere apenas URLs canônicos, garanta que todos os links internos no site apontem para URLs canônicos e especifique todos os URLs canônicos no mapa do site enviado aos mecanismos de pesquisa, mas esses métodos têm suas próprias limitações.
As ferramentas de administrador do Google não são aplicáveis a outros mecanismos de pesquisa. Alguns webmasters não podem fazer redirecionamentos 301 por algum motivo. Na maioria dos casos, o sistema CMS não está sob seu controle. Eles podem controlar links internos, mas os links de outras pessoas para seus próprios sites. controlado por eles. Em suma, embora existam soluções alternativas, a padronização de URL ainda é um grande problema.
Há alguns dias, Google, Yahoo e Microsoft lançaram em conjunto uma nova tag canônica para resolver o problema de canonização de URL.
Para simplificar, adicione este código ao cabeçalho do arquivo HTML:
O significado é que o URL padronizado desta página da web deve ser:
http://www.example.com/product.php?item=swedish-fish
Este código pode ser adicionado aos seguintes URLs:
http://www.example.com/product.php?item=swedish-fish&category=goma-doce
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678
Os verdadeiros URLs canônicos desses URLs tornam-se:
http://www.example.com/product.php?item=swedish-fish
Simplificando, esse rótulo equivale a um redirecionamento 301 dentro de uma página. A diferença é que o usuário não é redirecionado, mas permanece na mesma URL, e o buscador irá tratá-lo como um redirecionamento 301, o que significa que o peso do link da página estará concentrado na URL padronizada especificada no código.
Existem também alguns detalhes aos quais os webmasters precisam prestar atenção:
Esta tag é apenas uma sugestão ou dica, não uma instrução. Não é uma instrução como o arquivo robots. Portanto, os motores de busca irão considerar este código em grande parte, mas não é 100%. Eles também considerarão outras situações para determinar a URL canônica. Isso também evita que os webmasters entendam o URL errado.
Este código pode usar endereços absolutos ou relativos. Geralmente é recomendado usar endereços absolutos para ser mais seguro. O conteúdo do URL canônico especificado pode ser um pouco diferente do conteúdo de outros URLs não canônicos que usam esse código, mas pode não ser exatamente o mesmo. Por exemplo, existem muitos sites de comércio eletrônico que classificam por preço, cor e tamanho em ordem crescente e decrescente. Os URLs gerados são todos diferentes, mas o conteúdo é praticamente o mesmo. Existem apenas pequenas diferenças, então você pode usar. esta etiqueta.
O URL normalizado especificado pode ser uma página que não existe, retornando 404, ou uma página que não foi incluída. Mas não é recomendado fazer isso, não procure encrenca. Este rótulo se aplica ao mesmo nome de domínio, incluindo nomes de domínio de segundo nível. Mas não se aplica entre nomes de domínio diferentes para evitar que alguém o sequestre. Não use esta tag como tábua de salvação. Em primeiro lugar, você deve ter uma boa estrutura de site e tentar evitar problemas de normalização de URL. Este é apenas o último recurso.
Pessoas sensíveis provavelmente poderão ver a oportunidade de construir um grande número de links externos a partir deste novo padrão. Finalmente, este padrão é suportado pelos três principais motores de busca Google, Yahoo e Microsoft. Por que o Baidu não é mencionado? Lembro-me de ter visto relatos de que o Baidu é o segundo maior mecanismo de busca do mundo em termos de volume de busca. com isso? Vamos brincar juntos?
Autor: Zac@SEO Uma postagem por dia
Original: Blog interativo de otimização de mecanismos de pesquisa Dianshi