1. robots.txt et méta-robots
La plupart des sites Web utilisent désormais un CMS et le contenu qui n'a pas besoin d'être indexé doit exister, le fichier robots.txt est donc extrêmement important. De plus, le contenu qui ne peut pas être entièrement contrôlé par robots.txt est mieux bloqué par les méta-robots de l'indexation des moteurs de recherche. Ne pensez pas que plus le contenu d’un site Web est inclus, mieux c’est. Plus un moteur de recherche inclut du contenu non pertinent provenant d’un site Web, plus la possibilité que le poids du contenu pertinent soit dispersé est grande.
2. Redirection 301 et unification des noms de domaine
Le contenu qui doit être redirigé doit utiliser la redirection 301. 302 est relativement sensible pour Google et peut facilement être considéré comme de la triche. La plupart des piratages de pages sont effectués via 302. Concernant la question de l'unification des noms de domaine, en plus de rediriger www.xxx.com vers xxx.com, nous devons également nous assurer que www.xxx.com/a.html peut être redirigé avec succès vers xxx.com/a.html. Ce problème concerne principalement Baidu, et Google peut le résoudre de manière déguisée grâce à des outils pour les webmasters.
3. Chemins relatifs et entrées de gestion
Comme mentionné précédemment, la plupart des sites Web utilisent cms. Il est préférable d'utiliser des chemins absolus pour certains liens sur le modèle CMS, sinon il y aura beaucoup plus de 404 à mesure que les chemins changent ; de nombreux CMS ont des entrées de connexion administrateur réservées, qui seront explorées par les moteurs de recherche si cette entrée est laissée sur la page. , même s'il est bloqué pour l'indexation, les moteurs de recherche tels que Yahoo et Baidu l'incluront occasionnellement dans la portée de l'inclusion. Il est donc préférable d'assurer l'isolement des liens liés à l'arrière-plan, c'est-à-dire de supprimer l'entrée du fichier. arrière-plan de la page. Dans le même temps, réserver le lien administrateur constitue également un risque de sécurité et peut facilement être exploité par des personnes ayant des arrière-pensées.
Source : http://yeeseo.com/html/3-neglected-seo-details.html