La standardisation des URL a toujours été un problème qui préoccupe les webmasters et les moteurs de recherche. On estime que 10 à 30 % des URL sur Internet sont des URL non standardisées avec le même contenu mais des URL différentes. Cela crée plusieurs problèmes. Par exemple:
Pour les webmasters, l’existence de plusieurs URL disperse le poids de la page et n’est pas propice au référencement.
Pour les moteurs de recherche, c’est un gaspillage de ressources et de bande passante.
Lorsque les moteurs de recherche constatent que plusieurs URL ont le même contenu, ils ne les puniront pas, mais feront de leur mieux pour trouver l’URL qui doit être standardisée. Mais après tout, un programme n’est qu’un programme, et il peut mal tourner, et celui choisi n’est peut-être pas l’URL standardisée souhaitée par le webmaster.
Si le problème de standardisation des URL sur le site Web est trop grave, cela peut également affecter l'inclusion. Un nom de domaine avec une faible autorité a un nombre limité de pages totales pouvant être incluses. Les moteurs de recherche dépensent des ressources pour inclure des URL non standard, laissant moins de ressources pour un contenu vraiment différent.
Il existe de nombreuses options pour résoudre le problème de la canonisation des URL. Par exemple : définir la version avec 3W et sans 3W dans les outils d'administration de Google, laquelle est la version standardisée, utiliser la redirection 301, rediriger toutes les URL non standardisées vers des URL standardisées, et assurez-vous que le système CMS utilisé génère uniquement des URL canoniques, assurez-vous que tous les liens internes du site pointent vers des URL canoniques et spécifiez toutes les URL canoniques dans le plan du site soumis aux moteurs de recherche, mais ces méthodes ont leurs propres limites.
Les outils d'administration de Google ne sont pas applicables aux autres moteurs de recherche. Certains webmasters ne peuvent pas effectuer de redirections 301 pour une raison quelconque. Dans la plupart des cas, le système CMS n'est pas sous leur contrôle, mais les liens d'autres personnes vers leurs propres sites Web ne peuvent pas l'être. contrôlé par eux. En bref, même s’il existe des solutions alternatives, la standardisation des URL reste jusqu’à présent un gros problème.
Il y a quelques jours, Google, Yahoo et Microsoft ont publié conjointement une nouvelle balise canonique pour résoudre le problème de la canonisation des URL.
Pour faire simple, ajoutez ce code en tête du fichier HTML :
Cela signifie que l'URL standardisée de cette page Web doit être :
http://www.example.com/product.php?item=swedish-fish
Ce code peut être ajouté aux URL suivantes :
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678
Les véritables URL canoniques de ces URL deviennent :
http://www.example.com/product.php?item=swedish-fish
Pour faire simple, ce label équivaut à une redirection 301 au sein d’une page. La différence est que l'utilisateur n'est pas redirigé, mais reste sur la même URL, et le moteur de recherche la traitera comme une redirection 301, ce qui signifie que le poids du lien vers la page sera concentré sur l'URL standardisée spécifiée dans le code.
Il y a également quelques détails auxquels les webmasters doivent prêter attention :
Cette balise n'est qu'une suggestion ou un indice, pas une instruction. Ce n'est pas une instruction comme le fichier robots. Par conséquent, les moteurs de recherche prendront en compte ce code dans une large mesure, mais il ne l’est pas à 100 %. Ils prendront également en compte d’autres situations pour déterminer l’URL canonique. Cela empêche également les webmasters de se tromper d’URL.
Ce code peut utiliser des adresses absolues ou relatives. Il est généralement recommandé d'utiliser des adresses absolues pour plus de sécurité. Le contenu de l'URL canonique spécifiée peut être légèrement différent du contenu d'autres URL non canoniques utilisant ce code, mais peut ne pas être exactement le même. Par exemple, il existe de nombreux sites Web de commerce électronique qui trient par prix, couleur et taille par ordre croissant et décroissant. Les URL générées sont toutes différentes, mais le contenu est à peu près le même. Il n'y a que des différences mineures, vous pouvez donc les utiliser. cette balise.
L'URL normalisée spécifiée peut être une page qui n'existe pas, renvoyant 404, ou une page qui n'a pas été incluse. Mais ce n’est pas recommandé, ne cherchez pas d’ennuis. Ce label s'applique au même nom de domaine, y compris les noms de domaine de deuxième niveau. Mais cela ne s’applique pas entre différents noms de domaine pour empêcher quelqu’un de le pirater. N'utilisez pas cette balise comme bouée de sauvetage. Tout d'abord, vous devez avoir une bonne structure de site Web et essayer d'éviter les problèmes de normalisation des URL. Ce n'est qu'un dernier recours.
Les personnes sensibles y verront sans doute l’opportunité de construire un grand nombre de liens externes à partir de ce nouveau standard. Enfin, cette norme est prise en charge par les trois principaux moteurs de recherche Google, Yahoo et Microsoft. Pourquoi Baidu n'est-il pas mentionné ? Je me souviens avoir vu des rapports selon lesquels Baidu est le deuxième moteur de recherche au monde en termes de volume de recherche. avec ça ? On joue ensemble ?
Auteur : Zac@SEO Une publication par jour
Original : Blog interactif sur l'optimisation des moteurs de recherche de Dianshi