Hablando de este tema, es posible que desee preguntar, ¿por qué necesitamos mantener estos robots araña? ¿No puedo simplemente actualizar el contenido de mi sitio web todos los días? No me importa si estos robots araña vienen o no. sitio web Está bien si lo haces tú mismo para verlo solo, pero nuestro sitio web no está hecho para que lo disfrutes en casa, sino para que analices tu alegría con todos. Por eso tenemos que tratar a estos robots araña como invitados distinguidos y cuidarlos bien. Ahora hablemos de cómo criarlos.
1. Analizar las actividades de los robots araña de Baidu y Google.
La forma más sencilla es mirar el registro IIS del servidor, pero eso es sólo para personas que tienen sus propios servidores, o se proporciona en algunos sitios web de proveedores de espacio y no puede ser visto por la mayoría de los sitios web. Entonces, ¿cómo ves esta valiosa información? Recomiendo un código fuente a todos: Luzhu CMS. El fondo del código fuente de este sitio web puede registrar claramente los rastros de los principales robots de búsqueda. Tiene la hora de la visita de cada robot, las páginas visitadas y se analizan los datos detallados de la visita. y realizado las 24 horas del día Análisis de segmentos, análisis de cada canal y análisis de las secciones de contenido que hayas añadido. Analiza qué canales y secciones de su sitio web les gustan a los principales robots de búsqueda y también le ofrece sugerencias para remediar otros canales y secciones.
Permítanme darles un ejemplo de los métodos de actividad detallados de Baidu y Google. Por supuesto, los métodos de cada sitio web son diferentes. Ahora les daré un ejemplo de mi sitio web Luzhu. Al robot araña de Baidu le gusta más rastrear la página de inicio del sitio web, y lo hará una vez cada cinco minutos. También se puede entender que Baidu usa la página de inicio del sitio web como punto de entrada y luego descubre que existen diferencias entre ellas. la página de inicio esta vez y la última vez, se arrastrarán inmediatamente a la nueva página de enlace. Google es diferente. No rastreará su página de inicio con tanta frecuencia. Tiene un mapa para cada sitio web. Continuarán rastreando cada enlace de su sitio web. Por supuesto, no rastrearán si tienen registros. A partir de esto, no es difícil ver que Baidu descubrirá rápidamente el nuevo contenido de su sitio web, pero Google no descubrirá rápidamente su nuevo contenido. Recuerdo que una vez, después de agregar un contenido a mi sitio web, revisé inmediatamente los registros del rastreador de araña en segundo plano y fui a Baidu para descargar el sitio. Por supuesto, este contenido es un artículo suave escrito por mí, que es un artículo que Baidu considera original, por lo que se incluye muy rápidamente.
2. No revise el sitio web con frecuencia ni realice pocos cambios.
¿Por qué dice esto? Baidu y Google registrarán cierta información sobre su sitio web en sus bases de datos. Las páginas rastreadas esta vez se compararán y analizarán con las páginas rastreadas la última vez. Lo mismo para un sitio web nuevo, el rastreo de arañas se suspenderá por un período de tiempo, lo que significa que su sitio web entrará inmediatamente en un período de observación. Durante este período, no aparecerán con frecuencia, lo que significa que Baidu y Google no lo incluirán. Durante este período, la autoridad de su página también puede ser degradada. Recuerdo que cambié la plantilla de mi sitio web una vez en mayo. Las dos plantillas eran muy diferentes. Algunas páginas se incluían más o menos todos los días. Después de cambiarlas, me detuvieron durante aproximadamente una semana. Las páginas incluidas no estaban incluidas. La cantidad también se ha reducido mucho. Este es un cambio integral en el sitio web. Recuerdo que en otra ocasión este mes agregué más de 90 enlaces externos en tres días, lo cual es un pequeño cambio en el sitio web y Google todavía no suspendió las arañas al principio. hasta que una semana después, cuando verifiqué el número de páginas incluidas, y de repente faltaban cientos de páginas. El número de direcciones IP descargadas de Baidu y Google también ha disminuido en comparación con el número original.
3. El contenido de las actualizaciones del sitio web debe ser lo más original o pseudooriginal posible.
Todo el mundo sabe que a Baidu y Google les gustan los artículos originales, por lo que si un antiguo huésped llega a tu casa, debes conocer sus platos y té favoritos. Sabemos que a Baidu y Google les encanta esto, ¿por qué no le damos un buen uso? Si lee con frecuencia Sina y algunos sitios web famosos, encontrará que a veces no son necesariamente artículos originales, pero para satisfacer el gusto de las arañas de búsqueda, también procesarán los artículos hasta cierto punto, lo cual es pseudooriginal. Por otra parte, hay una gran cantidad de información actualizada todos los días en Internet, por eso hay tantas obras originales. Al igual que nosotros, hay gente buena y gente mala. Los sitios web famosos se están dedicando al procesamiento pseudooriginal, como pequeños y medianos webmasters, ¿por qué no lo hacemos? Los robots de Baidu y Google no son dioses, son programas escritos por humanos y ellos los ejecutan. Es imposible realizar un análisis completo de cada artículo actual del programa. Solo pueden comparar si son iguales y si son originales. A veces habrá muchos errores. Cuando agregamos contenido a nuestro sitio web, ¿por qué no agregar una gran cantidad de contenido pseudooriginal para aumentar la inclusión de nuestro sitio web?
4. Oportunidad del contenido de actualización del sitio web
Como se mencionó anteriormente, Baidu y Google rastrearán su sitio web varias veces al día y debemos aprovechar esto. Por lo tanto, nuestro propio sitio web también debe actualizar el contenido de manera oportuna para que puedan obtener algo cuando vengan, y vendrán con más frecuencia, para que su inclusión sea mayor. Como se mencionó anteriormente, puede crear artículos falsos al actualizar el contenido del sitio web. Si no es bueno creando artículos falsos, solo debe ser diligente cuando aparece un artículo en un sitio web, puede actualizarlo en su sitio web de manera oportuna. Entonces, es posible que Baidu y Google no lo hayan incluido en ese momento y que consideren erróneamente que el contenido de su sitio web es original. Si actualiza periódicamente el contenido de su sitio web de manera oportuna, incluso si es el trabajo original de otra persona, Baidu y Google incluirán todas sus páginas.
En resumen, si nuestro sitio web quiere que Baidu y Google incluyan una gran cantidad de ellos todos los días, debemos tener un conocimiento profundo del tiempo de actividad y el método de sus arañas en su sitio web, no cambiar el diseño y agregar algunos. artículos originales de manera oportuna.
Las anteriores son algunas de mis propias opiniones, que son relativamente superficiales. Puedes corregirme y comunicarte conmigo en http://www.luzhuba.cn.