Analyser l'algorithme des index de zone et la division de poids du site Web

Auteur：Eve Cole Date de mise à jour：2012-05-23 15:58:39

L'algorithme Zone Indexes est un algorithme de moteur de recherche qui divise les pages Web en régions et leur attribue des poids respectifs. Les moteurs de recherche combineront cet algorithme avec d'autres technologies de débruitage, telles que l'algorithme VipS, pour « débruiter » le contenu d'un site Web et attribuer un poids à chaque zone, affichant ainsi le contenu réellement précieux de la page Web.

Comme mentionné dans l'article précédent sur les algorithmes des moteurs de recherche, « L'application dérivée de l'algorithme TF-IDF en référencement ». Ce blog est sur le thème du référencement et implique le domaine IR uniquement pour permettre à chacun de mieux comprendre les moteurs de recherche, afin d'atteindre l'objectif d'améliorer les effets d'optimisation des sites Web. Par conséquent, cet article utilise un langage simple et facile à comprendre pour présenter les applications dérivées des index de zone dans le domaine de l'optimisation des moteurs de recherche.

Définition SEO de l’algorithme des index de zones

L'algorithme Zone Indexes, traduisons-le temporairement par l'algorithme « Zone Index » (les grands noms du domaine IR sont les bienvenus pour corriger les erreurs de traduction), est une sorte de partitionnement de sites Web ou de pages Web au niveau structurel dans la normalisation des sites Web, et puis attribue un poids à chaque zone. Nous utilisons un exemple simple pour comprendre cet algorithme. Supposons qu'une page Web ne contienne que trois éléments de contenu, à savoir le titre, la description et le texte du contenu. En même temps, supposons que le poids attribué par le moteur de recherche aux trois zones est égal à 1 000. 0,3, 0,1 et 0,6 points :

Titre : 0,3 point

Description : 0,1 point

Contenu : 0,6 point

Maintenant, en tant qu'utilisateur, nous tapons « algorithme booléen » dans le moteur de recherche. En prenant cet article comme exemple, le poids qu'il obtient est :

Titre : "Algorithme d'indexation de zone et division de pondération du site Web", "algorithme" apparaît une fois et obtient 0,15 point

Description : Zone Indexes est un algorithme de moteur de recherche qui divise les pages Web en zones et leur attribue respectivement des pondérations... "Algorithme" apparaît une fois et marque 0,01 point.

Contenu : Désormais, en tant qu'utilisateur, nous tapons « algorithme booléen » dans le moteur de recherche. Prenons cet article comme exemple... L'apparition de « algorithme booléen ET » marquera 0,6 point.

Total : 0,76 point

Autrement dit, mon article fait référence à l'algorithme des index de zone plutôt qu'à l'algorithme booléen, mais comme le mot « algorithme » répond aux exigences de recherche, sans l'influence d'autres facteurs de pondération, cet article est toujours lié aux mots d'index et devrait apparaître dans dans les résultats de recherche.

Cependant, l'application de l'algorithme des index de zones par le moteur de recherche est loin d'être simple : elle effectue une distinction sur la base d'une page Web. J'ai écrit dans l'article « L'impact de la normalisation globale des sites Web sur le référencement » au niveau structurel du référencement :

Le niveau structurel fait référence au langage HTML qui compose le site Internet. Par exemple, nous utilisons souvent les balises h1-h4, strong, a, img, etc. lors du travail de référencement. Les moteurs de recherche peuvent voir et analyser ces balises. Ces balises indiquent également aux moteurs de recherche la relation directe entre le contenu d'un certain site Web.

Nous savons qu'un site Web ordinaire comporte au moins les zones suivantes :

zone d'en-tête

zone de contenu du contenu

zone de pied de page

Un site Web plus complexe comportera les zones suivantes :

zone de navigation

zone de la barre latérale

commentairesZone de commentaires

lien Zone de liens conviviale

La structure interne des grands sites Web est encore plus complexe. Contrairement aux VIPS, qui distinguent les zones visuellement bruyantes, les Index de Zone débruitent le site Web en termes de structure, tels que :

Le contenu est la zone la plus importante. Généralement, la zone marquée comme contenu dans un div est la zone ayant le poids le plus élevé attribué par les moteurs de recherche. Deuxièmement, l’en-tête, car cette partie contient le titre et la description, et ces contenus jouent également un rôle essentiel dans l’indexation du site.

D'une manière générale, la navigation et la barre latérale ne sont pas si importantes, tandis que le pied de page et la zone de commentaires sont généralement des zones de bruit (ainsi que les liens, les publicités, etc.).

En HTML5, cette structure de site Web basée sur la sémantique est encore renforcée. Nous savons que HTML5 prend déjà directement en charge les balises telles que l'article, l'audio, le corps et le pied de page.

Exemples de référencement de l'algorithme d'index de zone

Nous examinons ici un exemple d'utilisation de l'algorithme Zone Indexes pour effectuer du référencement sur un site Web. Le cas vient du célèbre Yahoo (cet exemple est également un exemple que de nombreux experts SEO aiment utiliser lors de l'analyse de la structure d'un site Web).

Nous ouvrons le site http://autos.yahoo.com/ et visualisons son code source Près du pied de page, nous trouvons ce morceau de code :

Pour les moteurs de recherche, après avoir divisé le site Web en régions, ils doivent décider quelles parties sont importantes et lesquelles ne le sont pas, puis attribuer des pondérations aux régions correspondantes. En plus de la division par identifiant ou classe mentionnée ci-dessus, ils adopteront également une méthode de « rapport code texte ». Car dans certains cas, même le contenu du pied de page peut ne pas être sans importance.

Pour des raisons d'écriture et de programmation, si dans un élément de contenu, le texte + les images sont beaucoup plus grands que le code, alors cet élément de contenu peut être considéré comme important. Au contraire, si le contenu du code est plus grand que texte + image, alors ce contenu n'est pas important.

Cela a du sens, est logique et pratique, n'est-ce pas ?

Lorsque Yahoo marque les zones associées, la zone supérieure est la description et la zone inférieure est le lien. Comment pouvons-nous empêcher que la zone ci-dessous soit considérée comme une « zone de bruit » et sans importance par les moteurs de recherche, puis soit rejetée ? L'approche de Yahoo consiste à ajouter une zone « associée », c'est-à-dire une zone de recommandation associée, pour relier la partie supérieure et la zone de recommandation associée. zones inférieures, puis yat -pseo-foot est utilisé comme un contenu complet que les moteurs de recherche peuvent explorer et inclure. Évitez le traitement de « suppression du bruit » des moteurs de recherche.

Après avoir compris les exemples de référencement ci-dessus basés sur l'algorithme des index de zone, nous devons également acquérir une compétence de référencement : n'ajoutez pas trop de code HTML à la position que vous souhaitez mettre en évidence, au cas où il y aurait un problème avec le rapport du code du texte et que cela est considéré comme du bruit par le district des moteurs de recherche. Par exemple, tout l’écran est rempli du « texte » du lien et du « pied de page » du lien d’ancrage.

Grâce à l'algorithme des index de zone, nous pouvons comprendre certaines connaissances de base sur la division et la pondération des zones du site Web par les moteurs de recherche ; l'utilisation de ces connaissances peut nous aider à mettre en évidence le contenu principal du site Web et à réduire la détermination par le moteur de recherche de la zone de bruit de le site Web. Ces algorithmes et connaissances soulignent une fois de plus l’importance de la structure interne du site Internet.

Cet article a été initialement publié par Yang Fan sur Yang SEO. Veuillez conserver le lien pour la réimpression :

http://www.seoyangs.com/zone-indexes-weight-divided.html

(Editeur : Yang Yang) Espace personnel de l'auteur AimarYang