Le 25 juin, l'auteur a publié un article « Utiliser intelligemment les redirections 301 pour convertir les erreurs 404 en liens externes de sites Web » et a expliqué comment utiliser les redirections 301 pour convertir les URL d'erreur obtenues de l'extérieur en URL accessibles, afin d'atteindre l'objectif. transfert d'articles lestés.
Aujourd'hui, j'ai vu un article sur A5 intitulé "Une brève discussion sur les dangers de l'utilisation de la redirection 301 pour transférer 404 pages vers vos propres liens externes", qui réfutait les opinions de mon article précédent. Je pense que c'est très bien. L'industrie du référencement devrait avoir ce genre d'esprit de remise en question et la capacité de penser de manière indépendante. J'ai lu l'article attentivement et j'ai constaté que l'auteur avait mal compris mon sens. Je vais donc écrire un autre article pour clarifier le point de vue et présenter le rôle de la redirection 301. Tout d'abord, je clarifie deux idées dans l'article « Utiliser la redirection 301 pour convertir les erreurs 404 en liens externes de sites Web » :
L'article parle de la redirection de l'URL d'erreur 404 vers l'URL d'origine via 301. Ce point doit être expliqué. Je n'ai mentionné aucun 301 vers la page d'accueil ou d'autres pages dans l'article. L'exemple de l'article concerne la création d'un lien depuis un site Web externe (site Web B) vers son propre site Web (site Web A). Des erreurs d'orthographe d'URL, des ajouts de liens erronés ou même la génération intentionnelle de mauvaises URL peuvent survenir au cours du processus. Plutôt qu'une erreur 404 sur le site A lui-même.
Le texte original est toujours là et les amis qui ont des questions peuvent le lire attentivement. Permettez-moi de réfuter le point de vue de cet ami ci-dessous (les mots en bleu sont les opinions d'amis qui ont des opinions réfutables) :
Réfuter le premier paragraphe
L'auteur original a attribué les erreurs 404 dans le lien externe pointant vers l'extérieur du site Web. Cette phrase est compréhensible. Cependant, l'apparition de cette erreur 404 est également déterminée par le propre programme du site Web. échappez-y, comme Il peut également y avoir de nombreuses pages 404 avec des suffixes comme ceci ou cela sur la page A5. Ajoutez simplement 1.html et 2.html directement à la fin, et c'est tout. Mais si quelqu'un utilise délibérément des liens externes pour créer un lien. comme ces pages Web, c'est aussi apporter des liens vers le site, c'est tout, cela générera une page 404 et rien d'autre.
Si une erreur 404 se produit sur le site Web, il ne s’agit pas nécessairement d’un problème avec le programme interne du site Web. Si l'araignée rampe vers son propre site Web (prenons le site Web A comme exemple) via une mauvaise URL sur un site Web externe (prenons le site Web B comme exemple), cela provoquera également une erreur 404, c'est-à-dire qu'une mauvaise URL mènera au mauvaise page. L'araignée ne se soucie pas de savoir si votre URL liée existe à l'intérieur ou à l'extérieur du site Web. Tant qu'une « page n'existe pas » se produit lors de l'exploration de l'URL, une erreur 404 sera enregistrée.
Nous pouvons clairement le voir dans la colonne « État de l'opération » – « Erreurs d'exploration » – « Introuvable » des outils d'administration Google. Les erreurs 404 sont divisées par Google en deux catégories : « dans le plan du site » (cause interne) et « domaine lié à la page de votre site Web » (cause externe).
Comme son nom l'indique, le « domaine lié à la page de votre site Web » fait référence à l'URL reliant le site Web B au site Web A.
Deuxième paragraphe de réfutation
L'auteur original veut comprendre le poids de cet aspect, et souhaite restituer directement le poids de ce lien externe au lieu de le laisser partir. Ici, l'auteur a aussi son propre point de vue sur ce type de lien externe "http". :/ /www.xxxxx.com/rich-snippets.htmlGFQ", ce type de lien externe renvoie vers 404 pages. Si vous 301 ces pages, cette situation sera la même qu'un grand nombre de 404 pages du site Web, et puis directement La situation des pages 404 et 301 par page est la même ; donc si votre site web comporte 404 pages, afin d'éviter la perte de ces poids, toutes ces pages doivent-elles être 301 par page d'accueil ? Ceci est complètement incompatible avec le ? exigences des moteurs de recherche. Si vous le savez clairement, recherchez simplement "Les dangers de la page 404 301 sur la page d'accueil" sur Baidu et vous en saurez plus.
Tout d’abord, les moteurs de recherche font évidemment une distinction claire entre « comportement propre » et « comportement externe ». Prenons l'exemple de la création de liens. Les liens internes et les liens externes ont des effets différents en termes de poids. Tout le monde le sait. L'idée principale est que les liens externes échappent au contrôle du webmaster, tandis que les liens internes peuvent être définis par le webmaster. Bien que dans le processus de développement des moteurs de recherche, le facteur « liens externes pouvant être contrôlés par le webmaster » soit apparu (c'est-à-dire la construction ordinaire de liens externes). Mais peu importe si cela est contrôlable ou incontrôlable, une idée est claire : personne n'enverra la mauvaise URL en partant du principe que les sites Web d'autres personnes peuvent publier la bonne URL, ce qui empêchera les utilisateurs d'accéder normalement à leur propre site Web ou de ne pas pouvoir accéder à leur propre site Internet. Les mots « Cette page n'existe pas » apparaissent sur le site Internet.
Deuxièmement, que 301 aille à la page Web d'origine ou que 301 aille à la page d'accueil. Je ne veux pas en dire plus, tout le monde peut comprendre ce que je veux dire en lisant le texte original. Ce que je veux dire ici, ce sont quelques signaux sur la façon dont les moteurs de recherche identifient la source du texte original :
Où les moteurs de recherche voient le contenu pour la première fois
Fiabilité des noms de domaine avec de nombreux contenus similaires
Où il y a le plus de liens (liens internes dans le texte original)
Si la copie renvoie à la source originale (lien de copyright)
En raison de l'existence du deuxième signal, de nombreux contenus publiés ou réimprimés sur d'autres sites Web par nos auteurs originaux ne peuvent pas obtenir un bon classement. De nombreux auteurs s’en plaignent également. Mais nous pouvons utiliser les signaux à 1, 3 et 4 points pour corriger cette erreur.
Baidu n'est pas très doué dans ce domaine, mais Google peut identifier rapidement et précisément la source du texte original. Cela est dû aux 3 points ci-dessus. Le facteur "si la copie renvoie à la source d'origine" est également l'un des objectifs expliqués dans mon article "Utiliser la redirection 301 pour convertir les erreurs 404 en liens externes de sites Web". le poids.
Enfin, redirigez une URL incorrecte à laquelle l'utilisateur ne peut pas accéder vers la bonne URL via 301 de manière raisonnable. Cela contribue également à l’expérience utilisateur. On voit également cette phrase dans les « Erreurs d’exploration » de Google Admin Tools.
Googlebot ne peut pas explorer l'URL, car elle pointe vers une page qui n'existe pas. En règle générale, un 404 n'affectera pas le classement de votre site dans les résultats de recherche, mais vous pouvez l'utiliser pour améliorer l'expérience utilisateur.
La seule façon de résoudre les erreurs 404 est de bloquer le fichier robots.txt ou d'utiliser des redirections 301. Je ne pense pas que le blocage améliorera l'expérience utilisateur. L'approche robots.txt ne peut qu'améliorer l'expérience du robot. Parce qu'après que l'utilisateur a cliqué sur la mauvaise URL, il accède toujours à une page qui n'existe pas et voit une erreur 404.
Réfuter le troisième paragraphe
Copiez directement les mots originaux "Si un code autre que 404 ou 410 est renvoyé pour une page web inexistante (ou si l'utilisateur est redirigé vers d'autres pages web comme la page d'accueil au lieu de renvoyer 404), des problèmes peuvent survenir. Tout d'abord , cela équivaut à dire au moteur de recherche. En conséquence, les moteurs de recherche peuvent explorer cette URL et indexer son contenu car Googlebot passe beaucoup de temps à traiter des pages inexistantes et peut ne pas être en mesure de trouver votre URL rapidement ou fréquemment en la visitant. ces URL, vous ne pourrez pas les visiter assez fréquemment pour avoir un impact sur l'exploration du contenu de votre site (de plus, vous ne voulez pas que votre site apparaisse fréquemment dans les requêtes de recherche pour « Fichier introuvable »). 404, si vous ne continuez pas à accéder à la page d'erreur comme requis, il se peut qu'il y ait un grand nombre des mêmes pages sur votre site Web, le même titre, la même description, le même contenu, etc. , et puis c'est différent L'histoire entre l'URL et le même contenu. Quant à ce qui se passera dans le futur, vous pouvez aller sur Baidu ou effectuer une recherche sur Google pour le savoir.
Puisque l'ami qui a réfuté a mentionné les directives de l'administrateur de Google, n'oubliez pas d'en extraire un autre paragraphe :
De manière générale, les erreurs 404 n'affecteront pas le classement de votre site dans Google, vous pouvez donc les ignorer en toute sécurité. Ces erreurs sont souvent le résultat de fautes d'orthographe, d'une mauvaise configuration (comme des liens générés automatiquement par les systèmes de gestion de contenu) ou des efforts accrus de Google pour identifier et explorer les liens dans le contenu intégré tel que Javascript.
Pour voir la source d'un lien mort, cliquez sur l'URL en question. Dans la boîte de dialogue d'erreur, cliquez sur l'onglet Lien depuis la page suivante. Si des liens pertinents proviennent de votre site, corrigez-les ou supprimez-les. Si ces liens proviennent de sites Web externes, vous pouvez utiliser ces données pour améliorer l'expérience utilisateur de votre site Web. Par exemple, si quelqu'un voulait créer un lien vers votre site mais l'a mal saisi, une URL légitime serait mal orthographiée (comme www.example.com/awesome au lieu de www.example.com/awsome ). Au lieu de renvoyer une erreur 404, vous pouvez rediriger 301 une URL mal orthographiée vers la bonne URL et obtenir le trafic attendu via ce lien. Vous pouvez également vous assurer d'aider les utilisateurs à trouver ce qu'ils recherchent après les avoir dirigés vers une page 404, plutôt que d'afficher simplement « 404 introuvable ». Cependant, nous recommandons de suivre ces étapes uniquement si le lien incorrect génère un trafic élevé.
Lien source : https://support.google.com/webmasters/bin/answer.py?hl=zh-Hans&answer=2409439
Malheureusement, cet ami n’en a vu qu’un, mais pas l’autre. Lorsque nous faisons du référencement, les informations officielles sont très importantes. De nombreux détails y sont cachés, et il faut beaucoup de temps pour les lire et les comprendre attentivement.
En fait, de nombreux paramètres et descriptions des outils d'administration Google sont logiques. C’est juste que certains d’entre nous, SEO, ne veulent pas comprendre. Tout comme les causes internes et externes du 404, il est logique de les distinguer dans l'élément « erreur d'exploration ». Au lieu de le faire quand vous n’avez rien à faire.
Résumé : En tant que référenceurs, nous devons absorber beaucoup de connaissances et en même temps développer nos propres idées et façons d'analyser les problèmes. Mais vous devez vous assurer que les connaissances que vous acquérez sont avancées et non obsolètes. Sinon, vos idées pourraient facilement être induites en erreur, ce qui entraînerait de mauvais résultats.
Le débat d’opinions est également une partie très importante du travail de référencement. Personne ne peut affirmer avec certitude que sa compréhension est correcte. Nous ne pouvons utiliser que certaines informations officielles divulguées et nos propres conclusions tirées de l'analyse des données pour prouver l'exactitude de nos idées et de nos théories.
Cet article a été initialement publié par Yang Fan sur le référencement de Yang. Veuillez conserver le lien pour la réimpression : http://www.seoyangs.com/404-301-original-page.html.
(Editeur : Chen Long) Espace personnel de l'auteur AimarYang