Je travaille actuellement sur la promotion de sites Web et de produits, et il y a beaucoup de choses que je ne comprends pas, mais parmi les choses dont je fais la promotion, de nombreux noms m'attirent beaucoup. Le premier est le référencement. Dans le processus de compréhension du référencement, je suis tombé sur des « liens externes ». Lorsque j'ai découvert les liens externes, j'ai rencontré tellement d'informations à la fois que le référencement était incroyable. pas simple.
Et aujourd'hui, je veux vous parler du mot « araignée qui rampe ». Je crois que je ne suis pas le premier à le mentionner, car je suis un retardataire, mais j'espère que ma description pourra aider davantage de gens à comprendre ce mot. Après tout, de nombreuses présentations professionnelles sont assez professionnelles, et parce qu'elles sont trop professionnelles, cela semble. incompréhensible.
Commençons par présenter l’inclusion Baidu. Il existe de très nombreux sites Web dans le monde en ligne, et les sites Web contiennent d'innombrables pages Web, tout comme nous, avec une population de plus de 6 milliards d'habitants. Eh bien, certaines personnes sont très influentes dans le monde, comme Jackie Chan, Bruce Lee, Michael Jackson, etc., mais les inconnus comme nous sont si humbles. Ceux qui ont apporté de grandes contributions au monde deviendront naturellement célèbres, donc je peux le dire en d'autres termes, ceux qui « contribuent » sur Internet seront inclus par Baidu. Ce qui est inclus est son adresse réseau et est inclus par Baidu. Si le prestige d'être inclus signifie que vous pouvez apparaître dans les gros titres de la recherche Baidu, et les gros titres attirent toujours beaucoup d'attention. C'est précisément parce que tout le monde veut concourir pour ce poste que le SEO (optimisation des moteurs de recherche) est né.
Ensuite, le contenu collecté est placé dans une bibliothèque de manière ordonnée, et cette bibliothèque porte bien son nom de « base de données » dans le monde en ligne. Quant au principe de la base de données, je n'entrerai pas ici dans les détails. comprendre C'est quelque chose qui sauvegarde ou enregistre des données dans un certain format. "Spider Crawl" utilise ce genre de choses. Laissez-moi vous parler à nouveau de « l'araignée ». Bien sûr, ce n'est pas l'araignée que nous voyons tous les jours, c'est un programme informatique. Le processus d'exploration est le processus de mise en œuvre de l'algorithme (comme pour le terme, il s'agit d'un programme informatique). ne peut pas être simplement compris comme le processus arithmétique quotidien (le sens est équivalent au processus de planification d'un événement). Récemment, il semble que Baidu ait modifié son algorithme de recherche, mais a laissé tout le monde comprendre lentement comment le modifier.
"L'exploration par l'araignée" est un peu plus figurative. Il existe une exploration verticale et une exploration horizontale, qui sont une traversée en profondeur et une traversée en largeur dans nos termes informatiques. Le contenu parcouru est constitué de sites Web ou de pages Web de grande et de petite taille. page Web, puis la télécharge. Les pages Web renvoyées sont calculées via divers programmes avant d'être placées dans la zone de recherche. Ce n'est qu'alors qu'un classement stable sera formé. Ensuite, elles seront incluses dans la base de données de Baidu et finalement affichées sur la page Web de Baidu. Et ici, Baidu a envoyé non pas une seule "araignée", mais plusieurs, peut-être dix, ou des centaines, des milliers, voire des dizaines de milliers, ou des centaines de milliers. Bref, il doit y en avoir beaucoup, et l'envoi d'araignées est là. terme informatique : threads. De toute évidence, plusieurs araignées sont plusieurs threads, et ce n'est que lorsque plusieurs threads effectuent des recherches que l'efficacité est élevée. Lorsque plusieurs « araignées » effectuent une recherche ensemble, il s'agit d'une recherche large. Lorsqu'une « araignée » suit une certaine règle, il s'agit d'une recherche approfondie. La recherche de pages Web se fait d'abord en profondeur et en largeur. Lorsque l'araignée Baidu explore la page, elle explore à partir du site de départ (c'est-à-dire que le site de départ fait référence à certains sites portails) en explorant d'abord la largeur afin d'explorer plus d'URL et de profondeur. première exploration.Le but est d'explorer des pages Web de haute qualité. Cette stratégie est calculée et allouée par planification. Baidu Spider est uniquement responsable de l'exploration. La priorité de poids fait référence à l'exploration prioritaire des pages avec plus de connexions inversées. de planification, d'une manière générale, 40 % est la plage normale pour l'exploration du Web, 60 % est considéré comme bon et 100 % est impossible. Bien sûr, plus il y a d'exploration, mieux c'est. Au cours de mon apprentissage, je suis tombé sur un article présentant la sécurité de l'exploration des araignées. Il expliquait que les araignées préféraient généralement parcourir ces sites Web et éviteraient automatiquement les vulnérabilités du réseau pour éviter d'y tomber. rappelez-vous l'introduction de cet article : parcourez d'abord les sites Web statiques, car il peut y avoir une boucle infinie dans les sites Web dynamiques, de sorte que les araignées ne peuvent pas sortir après y être entré. Cependant, le processus général de recherche d'araignées vérifiera d'abord la sécurité du site Web et trouvera ces éléments. les actions destructrices seront évitées. Je pense que cela vaut la peine d'être pris en compte. Lors du processus de création d'un site Web dynamique, vous devez être strict avec le code de votre programme pour éviter les vulnérabilités du site Web. En fin de compte, aucun araignée n'ose entrer.
C'est tout pour l'introduction d'aujourd'hui. Il y a de nombreuses lacunes. J'espère que vous me corrigerez. Veuillez apporter la réimpression à : Asia Ceramics Mall : www.asiachinachina.com !
(Rédacteur en charge : momo) L'espace personnel de l'auteur Asia Ceramics Mall