Todo el mundo debe saber sobre el contenido duplicado. Como sugiere el nombre, significa que el contenido del sitio web está repetido o muy repetido. También se le llama página web duplicada, es decir, página web de contenido duplicado. Debido al entorno de Internet en China, la recopilación de plagio es bastante popular, especialmente después de que se lanzaron muchos CMS en los últimos años, cada vez más webmasters registraron un nombre de dominio, cargaron un programa CMS y comenzaron a recopilar y crear sitios web. En realidad, este enfoque no es aconsejable. En primer lugar, los usuarios se sentirán disgustados por una gran cantidad de contenido repetido que se basa en la experiencia del usuario, por lo que tampoco les gustará.
Algunos sitios web pueden usar diferentes URL para acceder a la misma página debido a problemas con sus propios programas. Lo mencioné en mi artículo anterior sobre la estandarización de URL y no lo discutiré aquí. Mencionando que se puede decir que la estandarización de las URL es imprescindible para toda optimización SEO. A los motores de búsqueda no les gusta el contenido duplicado. El programa determinará automáticamente qué versión es la versión original y luego ignorará otras páginas. Pero para los motores de búsqueda, uno consume recursos de banda ancha y el otro es una pérdida de tiempo. Para los administradores de sitios web, varias URL no sólo dispersarán el peso y reducirán la clasificación, sino que también correrán el riesgo de ser castigados por los motores de búsqueda. Y hay que saber que, después de todo, una araña es sólo un programa, y la URL estandarizada que selecciona por sí sola puede no ser la que queremos. Con respecto a la cuestión del castigo por copiar páginas de contenido, ha habido un debate en la industria del SEO, cuál es la cuestión del castigo y la no sanción. Personalmente, creo que aún será castigado. Aunque Google ha indicado claramente en la guía oficial para webmasters que las páginas web con contenido duplicado no serán castigadas, no cree una gran cantidad de páginas web con contenido duplicado, ya que esto no es propicio. al ranking del sitio web. Baidu también lo ha dejado claro: si la mayor parte del contenido de su página web está duplicado con contenido existente en Internet, es probable que Baidu abandone su sitio. Y cuando se incluyen estas URL duplicadas, cuando el motor de búsqueda devuelve estas páginas web con contenido duplicado al buscador, afectará seriamente la experiencia del usuario, porque el motor de búsqueda se basa en la experiencia del usuario como núcleo, y no quiere que Los resultados de búsqueda que aparecen son los mismos. Sólo está dispuesto a incluir una copia de contenido duplicado y, para otras páginas de contenido duplicado, los motores de búsqueda degradarán la página o la eliminarán directamente del índice.
Cuando leí "Segunda edición para acelerar el tráfico del sitio web" estos días, descubrí que otra situación para las páginas web con contenido repetido es que los vendedores y agentes de productos copian la información del producto del sitio web del fabricante, por lo que para el fabricante Está bien, porque los fabricantes En general estoy de acuerdo; pero esto crea un problema: aparece mucho contenido duplicado en diferentes páginas web, lo que no gusta a los motores de búsqueda. Para que sus productos sean más familiares para los clientes, estos sitios web pueden proporcionar algunas versiones que sean más adecuadas para imprimir. Si estas URL no se procesan, las páginas de contenido también se copiarán.
Otra situación es la trampa de arañas mencionada en un artículo de anteayer. Es decir, algunos sitios web de comercio electrónico utilizarán ID de sesión para proporcionar diferentes ID a diferentes usuarios. En este caso, sucederá lo mismo cada vez que una araña visite. páginas de contenido. Para obtener más información, puede leer este artículo sobre cómo evitar las trampas para arañas. Cuando un motor de búsqueda determina si copiar una página web, tendrá un conjunto de mecanismos algorítmicos relacionados para procesarla. Esto involucra diferentes algoritmos de mecanismos de detección de contenido duplicado de diferentes motores de búsqueda. Debido a los diferentes pesos de los sitios web, los motores de búsqueda pueden considerar la fuente original real como una copia y la copiada como la fuente original. Esto es especialmente cierto para sitios web con un peso demasiado alto en Baidu, como este artículo mío. Baidu lo incluye después de que lo publique, si Sina lo reimprime, Baidu aún puede juzgar que estoy reimpreso.
Además de la parte de contenido de la página web, las páginas de contenido duplicado también tienen títulos repetidos, estructuras repetidas, plantillas repetidas, etc. Ahora todos los que hacen SEO saben que el título de una página web es muy importante, así que cuando nombras un título para una página web, intente ir a Baidu y Google y busque si ya existe un título como este o similar. Intente no repetir el título. Con respecto a la duplicación estructural, los más comunes incluyen algunos sistemas CMS, programas de creación de sitios web, programas de foros, etc. Dado que estos programas se utilizan ampliamente, sus estructuras de URL a menudo tienen grandes áreas de duplicación. Puede estudiar esto usted mismo e intentar lograr la estructura de URL. lo más único posible. Entonces, ¿qué es la duplicación de plantillas? Hoy en día, el umbral para crear un sitio web es cada vez más bajo. Muchas personas cargan un programa, aplican una plantilla predeterminada y se olvidan de ella. Aunque el contenido es lo más importante, todavía se recomienda modificar el valor predeterminado. Descárguelo. La plantilla predeterminada generalmente se usa ampliamente. Su estructura de diseño y el código HTML o CSS en la plantilla a menudo causan duplicaciones. Aunque el motor de búsqueda considera que la página eliminará todo el código HTML, para nosotros, los entusiastas del SEO. En otras palabras, para los profesionales de SEO, para mejorar mejor el rendimiento de SEO, se recomienda modificarlo.
También hay sitios web espejo, que se mencionan en este blog. Puede buscarlos, pero no los describiré aquí. No daremos más detalles sobre el problema de las páginas de contenido copiadas causadas por la reimpresión y el plagio de artículos. Otra cosa que se debe evitar es que el contenido del sitio web sea muy escaso. Por ejemplo, algunos sitios tienen muy poco contenido sustancial en sus páginas de contenido. Además, cada página inevitablemente tiene partes comunes, como la barra de navegación, la parte inferior de la página. etc. Si la cantidad de contenido sustancial es menor que estos contenidos, los motores de búsqueda también pueden considerarla como una página de contenido duplicado. También hay un detalle: algunos sitios web tienen páginas en blanco debido a negligencia u otras razones. Si hay una gran cantidad de páginas en blanco, se confundirán con contenido duplicado.
También hay un sitio web de tipo de servicio o producto Cuando se opera por región, algunos productos o tipos de servicio tienen rangos más pequeños o son iguales. Este tipo de página solo modifica la información de la región y otros parámetros, pero otros son grandes La mayor parte del contenido. sigue siendo el mismo. También hay sitios web de noticias comunes que utilizan canales RSS para generar contenido web, y estos contenidos también son propensos a inundarse. Algunos sitios web generan archivos estáticos reales antes de ser revisados, y estas páginas html reales no se eliminan después de la revisión. Si se cambia la estructura del sitio web pero el contenido permanece sin cambios, los archivos html en estos directorios reales no se deben eliminar. También provocará un alto grado de duplicación del contenido web. De manera similar, una configuración de resumen incorrecta también puede generar páginas de contenido duplicadas. Para mejorar la experiencia del usuario, cada vez más sitios web, especialmente sitios web de noticias, habilitan funciones de resumen de artículos no solo brindan a los usuarios una navegación conveniente, sino que también pueden causar malentendidos. Creo que el contenido duplicado, y otra situación poco común es http y https, etc. Es esencial trabajar en los detalles para la optimización del sitio web, y el contenido duplicado en el sitio web afectará la clasificación del sitio web hasta cierto punto. Fuente de este artículo: Fuente SEO de Shenzhen http://www.zhsem.com/ Indíquelo al reimprimir, ¡gracias!
El espacio personal del autor Xiao Wuming