L'obligation du moteur de recherche d'identifier avec précision la page n'est pas un cadeau.

Auteur：Eve Cole Date de mise à jour：2012-08-22 10:34:20

Le 13 avril 2010, dans le Baidu Tieba Webmaster Club, ZAC, un expert chinois bien connu en référencement, a demandé dans le post « Poser des questions au nom d'autrui que le contenu original ne peut pas être identifié » : « Le classement de mon propre contenu original n'est souvent pas aussi bon que celui du contenu réimprimé ou plagié. Que peut faire le webmaster pour empêcher ou améliorer ? Mon site Web met à jour le contenu original chaque jour, et Baidu le met également à jour quotidiennement. Cependant, une fois les réimpressions d'autres personnes incluses, mes articles. ne peut pas être recherché. J'ai persisté près de 4 fois. C'est mon travail original, mais Baidu m'a quand même laissé tomber à plus de 500 endroits !

Il y a deux ans, le webmaster représentant la ZAC a eu un dialogue avec Lee, qui représentait Baidu, sur la question de l'inclusion originale.

Plus de deux ans se sont écoulés et la situation décrite dans la question ci-dessus n'a pas changé, et s'est même aggravée. Diverses pages de contenu original de valeur « pseudo-originales copiées et collectées » sont facilement recommandées aux internautes par la recherche sur le Web Baidu via l'indexation par mots clés. Cependant, le site Web de lancement de contenu original a perdu sa réputation. Cela tolère objectivement la prolifération du soi-disant référencement basé sur la « copie et la collecte de pseudo-originaux » qui cible les lacunes de Baidu.

Sans surprise, lors de l'événement « Webmaster Clinic Open Day » de Baidu le 10 août de cette année, la question de l'identification de l'originalité est devenue une question que les webmasters et les SEOER n'ont cessé de poser à l'ingénieur de recherche de Baidu, Lee.

Sans surprise également, la réponse de l'ingénieur de recherche de Baidu, Lee, était une réplique de sa réponse d'il y a deux ans : "Eh bien, on peut seulement dire que la stratégie de Baidu n'est pas encore parfaite, et nous l'avons améliorée avec un algorithme d'identification original parfait".

Les personnes qui suivent l'actualité de Baidu peuvent facilement constater que la réponse de Baidu Lee « Nous concevons un ensemble relativement complet d'algorithmes d'identification originaux » est entièrement en réponse aux « Mesures contre les sites de mauvaise qualité » de l'équipe anti-fraude de recherche sur le Web de Baidu le 2 juillet. "Les mesures contre les sites Web de mauvaise qualité (faux originaux et sites Web non originaux) sont entrées en vigueur" - Tout le monde se souvient encore qu'à cette époque, "Les mesures contre les sites Web de mauvaise qualité ont pris effet" disait avec grandeur : "Pour fournir des sites Web de haute qualité, Pour les webmasters de ressources originales, parce que nous réduisons, voire éliminons les classements des sites de mauvaise qualité, vous obtiendrez plus de trafic de Baidu. »

Mais moins de deux mois plus tard, la réponse de Lee, ingénieur de recherche de Baidu, a complètement nié la déclaration de l'équipe anti-fraude de recherche sur le Web de Baidu, ce qui était vraiment choquant.

De plus, face à la question de l'identification du « contenu original » deux fois après deux ans, Baidu Lee a adopté la méthode consistant à « regarder autour de lui et en parler » pour le traiter de manière superficielle : il y a deux ans, la réponse de Lee était « du point de vue de expérience utilisateur, certaines réimpressions peuvent ne pas être pires que l'original... ce ne sont que des réimpressions nationales, dont beaucoup sont coupées du début à la fin, ce qui blesse davantage l'auteur original. " Il vise davantage le problème des irrégularités domestiques. réimpression ; cette année, la réponse de Baidu Lee est : "(Baidu a reçu Plus de 80 % des plaintes qui prétendent être originales sont invalides, et il existe même un grand nombre de sites Web qui prétendent que les anciens médecins chinois peuvent guérir les maladies en phase terminale. 3 à 5 jours. L'intégralité du contenu est illisible et ils prétendent être des sites Web de haute qualité.

Il est indéniable que ce que Lee a dit sont tous des faits, mais l'accumulation de détails réels n'équivaut pas à l'ensemble réel. L'existence de ces situations courantes ne signifie pas qu'il n'y a pas de contenu original de haute qualité dans l'industrie Internet chinoise. cela signifie que Baidu ne peut pas identifier les sites Web. La raison de la publication originale. Comme le dit le proverbe : « Si vous n'avez pas de diamant, ne jouez pas avec la porcelaine. » La déclaration de Baidu Lee ne peut que prouver que la capacité de Baidu à identifier le contenu original et à supprimer les pages en double ne s'est pas du tout améliorée.

Il faut souligner que, après avoir compris que la faible capacité à identifier les pages originales est la faiblesse de tous les moteurs de recherche, de nombreux auteurs originaux de base ont ajouté une déclaration de copyright à la fin de l'article pour marquer l'URL de départ, et en même temps, ils sont guidés par la méthode de « synchronisation du contenu » des soumissions de sites Web de l'industrie de haute qualité. Moteurs de recherche et webmasters republiés. Bien que la plupart des liens obtenus soient des liens en texte brut, Lee, ingénieur de recherche de Baidu, a déclaré : « Clarifions la question : les liens peuvent-ils entrer dans la forme du texte brut (sans balises) doit-elle être reconnue et traitée ? La réponse « Oui, les robots des moteurs de recherche doivent découvrir et explorer les liens sur Internet en temps opportun. La forme sous laquelle se trouve le lien n'a pas d'importance » ce qui leur a donné confiance.

Ce qui déçoit ces webmasters, c'est qu'un grand nombre de sites Web de soumission et de réimpression faisant autorité dans l'industrie ne « réimpriment pas du début à la fin », comme l'a dit Baidu Lee, et que les pages Web des sites Web de soumission ou de réimpression de poids élevé sont générées et incluses. par les moteurs de recherche bien plus tôt que " Dans le cas de sites Web de "copie et collecte pseudo-originaux", il existe encore un grand nombre de pages de première page originales qui sont ignorées par Baidu. Le classement de "copie et collecte pseudo-originale" Les sites Web restent élevés - beaucoup de ces pages interceptent encore de manière aléatoire une partie de l'article et n'expriment pas pleinement le thème de l'article. Elles ne peuvent pas répondre à la norme de « meilleure expérience utilisateur » annoncée par Baidu.

Il convient de noter que même si l'identification des pages originales a toujours été une faiblesse des moteurs de recherche, tous les moteurs de recherche ne fonctionnent pas aussi mal que Baidu face à de nombreuses URL de poids élevé pointant vers des pages de lancement originales. Comme l'a dit Wang Tong, un référenceur national bien connu, face à la prolifération de la « copie et de la collecte de pseudo-originaux » sur l'Internet chinois, pour la page de lancement originale avec le guide URL de la déclaration de droit d'auteur (en plus de la version temps, universalité du lien et poids de la page du site Web du lien, etc. Standard), Google n'a pas subi un échec complet comme Baidu, qui prétend « connaître le mieux le chinois » - les principales recherches liées aux superproductions sont occupées par des pages pseudo-originales copiées et collectées, et la première page originale disparaît sans laisser de trace.

Cela montre que Baidu, qui « connaît le mieux le chinois », doit terminer le travail d’identification initial et la suppression des pages en double (pour identifier les pages d’informations de haute qualité et les pages supplémentaires importantes pour les recommandations clés) avant de recommander des URL aux internautes via l’indexation par mots clés. Il n'est pas terminé - la raison en est que le niveau technique est très faible et qu'il est urgent de rattraper son retard, et la déclaration de Baidu Lee cherche constamment des excuses pour Baidu.

De plus, en comparaison, les meilleures performances de Google dans l'identification de l'adresse de départ d'origine prouvent que Baidu ne se soucie pas de la page de démarrage d'origine, il ne se soucie que du contenu plus original - mais manque de sensibilisation aux droits d'auteur. Je pense que c'est ce que fait Baidu pour un. Depuis longtemps, la principale raison du retard de l'algorithme du site Web d'origine est « soit impossible, soit non ».

Pas étonnant que dès que Wang Tong, un SEOER national bien connu, a déclaré que « l'ajustement 628 de Baidu vise à sévir contre les sites Web originaux », de nombreux webmasters et SEOER se sont sentis tristes.

En fait, si la technologie d'identification de la première page d'origine peut être considérablement améliorée, elle peut aider à améliorer considérablement la capacité anti-triche du moteur de recherche, contrecarrer directement les complots des SEOER qui trompent les moteurs de recherche de diverses manières dans un but lucratif et fournir une plateforme pour ceux qui s'engagent sérieusement dans les moteurs de recherche haut de gamme. Confiance dans un contenu original de qualité.

Ce n'est que lorsque Baidu respectera le travail de nombreux webmasters de sites Web originaux de petite et moyenne taille par des actions pratiques et les encouragera à continuer à utiliser leur intelligence et leurs talents pour réaliser un travail original que nous pourrons guider davantage de webmasters et de SEOER obsédés par « copier et collecter ». pseudo-originaux » pour consacrer leur énergie à aller vers le contenu original qui « reflète le mieux la valeur fondamentale du site Web ». Pour Baidu, même si cette étape est difficile, il s’agit d’un grand pas en avant bénéfique pour le développement futur des moteurs de recherche.

De plus, je dois rappeler à la recherche sur le Web Baidu que ce n'est pas le cadeau de Baidu à de nombreux webmasters de base de résoudre le plus rapidement possible le « problème de collecte de contenu original » signalé par les webmasters avec un algorithme plus raisonnable (les sites Web bien connus n'énervent pas Baidu all), Taobao bloque directement Baidu), mais il s'agit d'une « obligation fondamentale » que Baidu doit remplir en vertu de la loi actuelle sur le droit d'auteur et d'autres lois pertinentes. Les gens de Baidu ne peuvent pas se sentir très bien dans leur peau.

Où aller, la route est à vos pieds, tout dépend du choix du moteur de recherche (Cet article a été initialement publié par gouyn12. Tous droits réservés. Vous êtes responsable de l'article. Veuillez indiquer la source originale de l'article dans le sous forme de lien lors de sa réimpression : http://www.gouyn12.com/cnnet/327.html ).

(Editeur : Chen Long) L'espace personnel de l'auteur gouyn12