Tous ceux qui font du référencement savent que la clé est que le site Web soit inclus dans le moteur de recherche. Si votre site n'est pas inclus dans le moteur de recherche, alors le référencement est hors de question. Par conséquent, si vous souhaitez que votre site Web soit découvert par les moteurs de recherche et que vos pages Web soient correctement indexées par les moteurs de recherche, vous devez d'abord rendre votre site facile à explorer pour les robots. Les outils utilisés par les moteurs de recherche pour explorer les pages Web sont appelés araignées ou robots d'exploration, et leur nom anglais est robot. Ces robots explorent plusieurs de nos pages le long des hyperliens, mais certaines pages ne peuvent pas être explorées. Certains d'entre eux sont dus au fait que le site Web lui-même présente des problèmes qui ne sont pas propices à l'exploration par les robots, ce qui rend difficile l'indexation des pages correspondantes par les moteurs de recherche. , formant ainsi un ""Piège à araignées" fait généralement référence aux technologies de production de sites Web qui ne sont pas conviviales pour les moteurs de recherche. Ces technologies ne sont pas propices aux araignées qui explorent nos pages. Afin d'éviter cette situation, Xiaowuming a résumé les facteurs suivants pour empêcher les araignées de entrer dans le piège.
1 : Pages qui utilisent des identifiants de session. Certains sites de vente utiliseront des identifiants de session pour suivre les utilisateurs afin d'analyser certaines informations utilisateur. Lors de l'accès au site, chaque utilisateur ajoutera un identifiant de session à l'URL de chaque visite. traité comme un nouvel utilisateur. Chaque fois que l'araignée visite l'URL, un identifiant de session sera ajouté. Cela entraînera la même page mais des URL différentes. Cela entraînera une page de contenu en double, ce qui entraînera des pages de contenu très répétitives. est également l’un des pièges à araignées les plus courants. Par exemple, afin d'améliorer les performances commerciales, certains sites Web organisent des conversations contextuelles, telles que bonjour les amis de XXX, etc.
2 : Pièges à araignées de bon sens qui utilisent une inscription ou une connexion forcée pour accéder aux pages. Ceci est assez difficile pour les araignées, car les araignées ne peuvent pas soumettre d'inscription et ne peuvent pas saisir de noms d'utilisateur et de mots de passe pour se connecter et afficher le contenu. cliquer pour voir directement est également le contenu que les araignées peuvent voir.
3 : J'aime les sites qui utilisent Flash. La raison pour laquelle je dis que j'aime les sites qui utilisent Flash est que pour certaines petites et moyennes entreprises, Flash lui-même peut produire de nombreux types d'effets, en particulier lorsqu'il est utilisé dans la navigation. a un fort effet visuel, c'est pourquoi de nombreux sites Web d'entreprises aiment utiliser Flash pour montrer la force, la culture, les produits, etc. de leur entreprise. Même la page d'accueil de certains sites d'entreprise est un flash, soit en passant à une autre page via Flash après une certaine période de temps, ou en utilisant Flash. Les liens permettent aux utilisateurs de cliquer pour accéder à une nouvelle page, mais il est difficile pour les araignées de lire le contenu en Flash, il est donc également difficile pour les araignées de cliquer sur les liens en Flash.
4 : URL dynamique, ajout de trop de symboles ou de paramètres d'URL à l'URL, etc. Ce type de piège à araignées que j'ai mentionné dans l'optimisation des URL, bien qu'avec le développement technologique des moteurs de recherche, les URL dynamiques soient moins efficaces à explorer. devient de moins en moins un problème, mais en termes de convivialité pour les moteurs de recherche, les URL statiques ou même pseudo-statiques sont relativement meilleures que les URL dynamiques. Vous pouvez jeter un œil au nombre de collègues SEO qui gèrent les URL.
5 : Au début, les cadres étaient largement utilisés partout, mais aujourd'hui, de nombreux sites Web sur des pages Web les utilisent rarement. Premièrement, avec le développement des principaux systèmes CMS, la maintenance des sites Web est devenue relativement plus facile. Les cadres sont utilisés parce qu'ils sont pratiques pour la maintenance des pages du site Web. De plus, ils ne sont pas propices à l'inclusion dans les moteurs de recherche et c'est l'une des raisons pour lesquelles les cadres sont de moins en moins utilisés.
6 : JS, bien que les moteurs de recherche puissent désormais suivre et même essayer de désassembler et d'analyser les liens en JavaScript, nous ne ferions pas mieux de nous attendre à ce que les moteurs de recherche surmontent les difficultés par eux-mêmes. Bien qu'une navigation efficace puisse être effectuée via JS, mais CSS le peut également. faites-le ; afin d'améliorer la convivialité du site Web pour les moteurs de recherche, il est recommandé de rendre la page Web plus facilement explorable par les araignées, essayez de ne pas utiliser js. Bien sûr, en référencement, l'un des avantages de js est que le webmaster le fait. Je ne veux pas que les pages soient incluses. Ou des liens conviviaux peuvent utiliser js. Une autre façon d'éliminer les pièges à araignées Javascript consiste à utiliser la balise <noscript>. La balise <noscript> fournit un code alternatif pour les navigateurs qui ne prennent pas en charge JavaScript. Les araignées n'exécutent pas JavaScript, elles traitent donc le code <noscript> à la place.
7 : Les pages Web profondes, dont certaines n'ont pas d'entrée et sont éloignées de la page d'accueil du site Web, sont relativement difficiles à explorer pour les araignées. Bien sûr, cela peut être différent pour les sites Web de poids élevé. Pour qu'une page de site Web soit incluse, elle doit d'abord avoir un poids de base. Le poids de la page d'accueil est généralement le plus élevé, puis le poids de la page d'accueil peut être répercuté sur les pages internes. atteint le seuil pouvant être inclus, la page Selon cette théorie, le transfert de poids entre les pages diminuera. Par conséquent, plus la distance de clic entre la page intérieure et la page d'accueil est proche, plus il est facile d'obtenir plus de poids. transfert sur la page d'accueil. Une bonne structure de site Web peut permettre d’inclure davantage de pages du site Web.
8 : L'utilisation forcée des cookies équivaut à la désactivation directe des cookies pour les moteurs de recherche. Certains sites Web utiliseront des cookies forcés afin de réaliser certaines fonctions, telles que le suivi des chemins d'accès des utilisateurs, la mémorisation des informations sur les utilisateurs ou même le vol de la confidentialité des utilisateurs, etc. si l'utilisateur n'active pas les cookies lors de la visite de ces sites, la page affichée sera anormale, de sorte que la même page Web ne pourra pas être consultée normalement par les araignées.
9 : Diverses formes de sauts. Je pense que de nombreux enfants SEO sont déjà très familiers avec les redirections 301. Cependant, les araignées sont très dégoûtées par les autres 302, ou les sauts tels que le méta-rafraîchissement, le javascript, le flash, etc., et 301 n'est pas un dernier. recours Lorsqu'il est utilisé, tout saut provoquera dans une certaine mesure des obstacles au rampement de l'araignée, vous le savez.
10 : Erreurs d'écriture de Robots.txt et diverses techniques de triche, telles que du texte caché, des liens cachés, etc., en utilisant des pages Web déguisées pour afficher différentes pages Web afin de déterminer si le visiteur est une araignée ou un navigateur ordinaire, et en utilisant l'erreur par défaut Les pages 404, etc., créeront également des obstacles pour les araignées. Source de cet article : Site Web Shenzhen SEO : http://www.zhsem.com/ Merci de respecter l'originalité, merci de l'indiquer lors de la réimpression, merci !
L'espace personnel de l'auteur Xiao Wuming