La obligación del buscador de identificar con precisión la página no es un regalo.

Autor：Eve Cole Fecha de actualización：2012-08-22 10:34:20

El 13 de abril de 2010, en el Baidu Tieba Webmaster Club, ZAC, un conocido experto chino en SEO, preguntó en la publicación "Hacer preguntas en nombre de otros sobre el contenido original que no se puede identificar": "La clasificación de mi propio contenido original a menudo no es tan bueno como el contenido reimpreso o plagiado. ¿Qué puede hacer el webmaster para prevenir o mejorar? Mi sitio web actualiza el contenido original todos los días y Baidu también lo actualiza todos los días. Sin embargo, después de que se incluyen las reimpresiones de otras personas, No se puede buscar. ¡Persistí casi 4 veces! ¡Es mi trabajo original, pero aún así Baidu me llevó a más de 500 lugares!

Hace dos años, el webmaster representante de ZAC dialogó con Lee, quien representaba a Baidu, sobre el tema de la inclusión original.

Han pasado más de dos años y la situación indicada en la pregunta anterior no ha cambiado, e incluso ha empeorado. Varias páginas de contenido original valioso "copiadas y recopiladas pseudooriginales" se recomiendan fácilmente para que los internautas busquen mediante la búsqueda web de Baidu mediante la indexación de palabras clave. Sin embargo, el sitio web de lanzamiento de contenido original ha perdido su reputación. Esto tolera objetivamente la proliferación del llamado SEO basado en "copiar y recopilar pseudooriginales" que apunta a las deficiencias de Baidu.

Como era de esperar, en el evento "Día de puertas abiertas de la Clínica para webmasters" de Baidu el 10 de agosto de este año, la cuestión de la identificación de la originalidad se convirtió en una pregunta que los webmasters y SEOER seguían planteándole al ingeniero de búsqueda de Baidu, Lee.

Tampoco es de extrañar que la respuesta del ingeniero de búsqueda de Baidu, Lee, fuera una réplica de su respuesta de hace dos años: "Bueno, sólo se puede decir que la estrategia de Baidu aún no es perfecta y la hemos estado mejorando".

Las personas que siguen las noticias de Baidu pueden encontrar fácilmente que la respuesta de Baidu Lee "Estamos diseñando un conjunto relativamente completo de algoritmos de identificación originales" es completamente una respuesta a las "Medidas contra sitios de baja calidad" del equipo antifraude de búsqueda web de Baidu el 2 de julio. "Las medidas contra los sitios web de baja calidad (originales falsos y sitios web no originales) han entrado en vigor" - Todos todavía recuerdan que en ese momento, "Las medidas contra los sitios web de baja calidad han entrado en vigor", dijo grandiosamente: "Para proporcionar alta calidad, Para los webmasters de recursos originales, debido a que reducimos o incluso eliminamos las clasificaciones de los sitios de baja calidad, obtendrán más tráfico de Baidu".

Pero menos de dos meses después, la respuesta del ingeniero de búsqueda de Baidu, Lee, negó por completo la declaración del equipo antifraude de búsqueda web de Baidu, lo cual fue realmente impactante.

Además, cuando se enfrentó a la cuestión de identificar el "contenido original" dos veces después de dos años, Baidu Lee adoptó el método de "mirar a su alrededor y hablar sobre ello" para abordarlo de manera superficial: hace dos años, la respuesta de Lee fue "Desde la perspectiva de experiencia del usuario, algunas reimpresiones pueden no ser peores que el original... son solo reimpresiones domésticas, muchas de las cuales están cortadas de principio a fin, lo que hace que el autor original se sienta más herido". Está más dirigido al problema de las irregularidades domésticas. reimpresión este año, la respuesta de Baidu Lee es: "(Baidu recibió Más del 80% de las quejas que dicen ser originales no son válidas, e incluso hay una gran cantidad de sitios web que afirman que los antiguos médicos chinos pueden curar enfermedades terminales en 3-5 días. Todo el contenido es ilegible y afirman ser sitios web de alta calidad".

Es innegable que lo que dijo Lee son todos hechos, pero la acumulación de detalles reales no equivale al todo real. La existencia de estas situaciones comunes no significa que no exista contenido original de alta calidad en la industria china de Internet, ni tampoco. significa que Baidu no puede identificar los sitios web y el motivo del lanzamiento original. Como dice el refrán: "Si no tienes un diamante, no te metas con la porcelana". La declaración de Baidu Lee sólo puede demostrar que la capacidad de Baidu para identificar el contenido original y eliminar páginas duplicadas no ha mejorado en absoluto.

Debe enfatizarse que, después de comprender que la mala capacidad para identificar páginas originales es la debilidad de todos los motores de búsqueda, muchos autores originales de base han agregado una declaración de derechos de autor al final del artículo para marcar la URL de inicio y, al mismo tiempo, se guían por el método de "sincronización de contenido" de envíos de sitios web de la industria de alta calidad y reenvíos de webmasters. Aunque la mayoría de los enlaces obtenidos son enlaces de texto sin formato, el ingeniero de búsqueda de Baidu Lee dijo: "Aclaremos la pregunta: ¿pueden los enlaces ingresar?". ¿Se puede reconocer y procesar la forma de texto plano (sin etiquetas)? La respuesta "Sí, las arañas de los motores de búsqueda necesitan descubrir y rastrear enlaces en Internet de manera oportuna. No importa en qué forma se encuentre el enlace". lo que les dio confianza.

Lo que decepciona a estos webmasters es que una gran cantidad de sitios web autorizados de envío y reimpresión en la industria no "reimprimen desde el principio hasta el final" como dijo Baidu Lee, y las páginas web de sitios web de envío o reimpresión de alto peso se generan e incluyen. por los motores de búsqueda mucho antes que " En el caso de sitios web de "copiar y recopilar pseudooriginales", todavía hay una gran cantidad de páginas originales en la primera página que Baidu ignora. Las clasificaciones de "copiar y recopilar pseudooriginales" Los sitios web siguen siendo altos: muchas de estas páginas aún interceptan aleatoriamente parte del artículo y no expresan completamente el tema del artículo. No pueden cumplir con el estándar de "mejor experiencia de usuario" anunciado por Baidu.

Cabe señalar que, aunque la identificación de páginas originales siempre ha sido una debilidad de los motores de búsqueda, no todos los motores de búsqueda funcionan tan mal como Baidu frente a muchas URL de alto peso que apuntan a páginas de lanzamiento originales. Como dijo Wang Tong, un conocido SEOER nacional, ante la proliferación de "copiar y recopilar pseudooriginales" en Internet chino, para la página de lanzamiento original con la guía URL de declaración de derechos de autor (además de la publicación estándar), Google no ha sufrido un fracaso total como Baidu, que afirma "conocer mejor el chino": las principales búsquedas relacionadas con éxitos de taquilla están ocupadas por páginas pseudooriginales copiadas y recopiladas, y la primera página original desaparece sin dejar rastro.

Esto muestra que Baidu, que "conoce mejor el chino", debe completar el trabajo de identificación original y la eliminación de páginas duplicadas (para identificar páginas de información de alta calidad y páginas complementarias importantes para recomendaciones clave) antes de recomendar URL para buscar a los internautas mediante la indexación de palabras clave. No se ha completado: la razón es que el nivel técnico es muy bajo y hay una necesidad urgente de ponerse al día, y la declaración de Baidu Lee busca constantemente excusas para Baidu.

Además, en comparación, el mejor desempeño de Google en la identificación de la dirección de inicio original demuestra que a Baidu no le importa la página de inicio original, solo le importa el contenido más original, pero carece de un conocimiento adecuado de los derechos de autor. Creo que esto es lo que Baidu está haciendo. Durante mucho tiempo, la razón principal del atraso del algoritmo del sitio web original es "imposible o no".

No es de extrañar que tan pronto como Wang Tong, un conocido SEOER nacional, dijera que "el ajuste 628 de Baidu es para tomar medidas enérgicas contra los sitios web originales", muchos webmasters y SEOER se sintieron tristes.

De hecho, si la tecnología de identificación de la primera página original se puede mejorar en gran medida, puede ayudar a mejorar en gran medida la capacidad anti-trampas del motor de búsqueda, frustrar directamente las conspiraciones de los SEOER que engañan a los motores de búsqueda de diversas formas con fines de lucro y proporcionar una plataforma para quienes apuestan seriamente por los motores de búsqueda de alta gama. Confianza en contenido original de calidad.

Sólo cuando Baidu respete el trabajo de muchos webmasters de sitios web originales pequeños y medianos con acciones prácticas y los aliente a continuar usando su inteligencia y talento para realizar trabajos originales podremos guiar a más webmasters y SEOER que están obsesionados con "copiar y recopilar". pseudo-originales" para dedicar su energía a Ir al contenido original que "refleje mejor el valor central del sitio web". Para Baidu, aunque este paso es difícil, es un gran paso que beneficia el desarrollo futuro de los motores de búsqueda.

Además, debo recordarle a Baidu la búsqueda web que no es un regalo de Baidu para muchos webmasters de base resolver el "problema de recopilación de contenido original" informado por los webmasters lo antes posible con un algoritmo más razonable (los sitios web conocidos no molestan a Baidu en todos), Taobao bloquea directamente a Baidu), pero es una "obligación básica" que Baidu debe cumplir según la actual Ley de derechos de autor y otras leyes pertinentes. La gente de Baidu no puede sentirse muy bien consigo misma.

Adónde ir, el camino está a tus pies, todo depende de la elección del propio motor de búsqueda (Este artículo fue publicado originalmente por gouyn12. Todos los derechos reservados. Usted es responsable del artículo. Indique la fuente original del artículo en el forma de enlace al reimprimirlo : http://www.gouyn12.com/cnnet/327.html ).

(Editor: Chen Long) El espacio personal del autor gouyn12