El H1N1 ha causado mucho ruido últimamente y todo el mundo lo sabe. Hace no sólo unos días, incluso Baidu se vio afectado por el virus H1N1.
En términos de velocidad de actualización del motor de búsqueda, Baidu indexa muy rápidamente los sitios web de noticias del portal y otros sitios web muy actualizados, y básicamente los actualiza el mismo día. Sin embargo, para los sitios web con una pequeña cantidad de actualizaciones, como los sitios web de hospitales, existe una gran diferencia entre los dos. Por ejemplo, para los sitios web con mucho peso y mapas de sitio y ping enviados, la velocidad de indexación de Google puede alcanzar el nivel de minutos. Después de actualizar un artículo, la velocidad de indexación puede alcanzar varios minutos. Se puede encontrar en Google en minutos, pero para Baidu, la velocidad de indexación es lenta. Por lo general, solo se rastrea hasta la página de inicio del sitio web y busca el título. o la página del directorio, pero hay muy pocas páginas de contenido para el artículo.
Según mi observación del nuevo sitio web www.wznanke.com, este sitio web es principalmente un sitio web de servicios médicos. De las instantáneas incluidas, se puede ver que Baidu parece prestar especial atención a la página de inicio del sitio web. Cuando se revisó el contenido fijo de la página de inicio del sitio web y no se perfeccionó, primero utilicé enlaces de artículos externos, así como el conocimiento de Baidu y Tieba como ayuda. Por lo general, se tarda menos de una semana en incluirlo en Baidu, mediante el análisis de sitios web médicos relacionados. Para artículos publicados en medio mes, utilice Baidu para buscar títulos de artículos. Los principales son básicamente artículos reimpresos o recopilados de sitios web de portales. La mayoría de los artículos en sitios de hospitales son los mismos, por lo que el contenido de los artículos no es visible. Los motores de búsqueda son muy pequeños, entonces, ¿cómo aumentar el tráfico de sitios web como Wanzhong Men's Network que tienen pocas actualizaciones de contenido profesional y características obvias de la industria? Si Baidu también se ve afectado por el virus H1N1, ¡tal vez podamos encontrar algunas razones!
1. Análisis de captura de simulación
(1) Según el registro del rastreador de Baidu en el sitio el 16 de mayo, muestra:
#Software: Servicios de información de Internet de Microsoft 6.0
#Versión: 1.0
#Fecha: 2009-05-16 14:42:56
#Campos: fecha y hora s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status
2009-05-16 14:42:55 W3SVC490114653 61.129.14.17 OBTENER /robots.txt - 80 - 61.135.190.55 Baiduspider+(+http://www.baidu.com/search/spider.htm) 404 0 64
Primero, el rastreador encontró la información de navegación en la parte superior de la página de inicio del sitio web. Baidu se detuvo después de leer los robots una vez y devolver 404. Dado que el contenido de las páginas internas del sitio web aún no está completo, Baidu esperará mucho tiempo antes de acceder a las páginas internas después de leer la página de inicio. Según la simulación, la primera visita efectiva de Baidu es:
2009-05-16 01:23:32 W3SVC490114653 61.129.14.17 OBTENER /index.htm - 80 - 61.135.162.212 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
En segundo lugar, es probable que la próxima lectura de Baidu continúe leyendo el contenido de la página de inicio primero. Podemos mostrarlo a través de una instantánea en el sitio: wznanke.com. Sin embargo, cuando rastreamos la página de inicio por segunda vez, los robots no se leen (visualización del rastreador simulada). ).
2009-05-16 08:24:26 W3SVC490114653 61.129.14.17 OBTENER /index.htm - 80 - 61.135.162.212 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
En el siguiente paso, Baidu puede leer más enlaces en la página de inicio. Dado que el sitio web está mejorando gradualmente, el sitio web debería mejorar los enlaces internos relevantes y rechazar la aparición de enlaces inactivos según el registro del rastreador simulado:
2009-05-1608:26:01W3SVC490114653 61.129.14.17 GET /remensousuo/RuHeJianFei/index.htm - 80 - 61.135.162.212 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
De acuerdo con los diferentes contenidos de la red de rastreo Baidu baiduspider en cada etapa, podemos ajustar el diseño relevante del sitio web a tiempo de acuerdo con las reglas relevantes. Especialmente para los sitios web nuevos que están en línea, Baidu no los indexará rápidamente. Solo cuando su sitio web tenga un cierto peso en el motor de búsqueda y tenga ciertos enlaces inversos de alta calidad, Baidu le dará al sitio web un umbral a medida que aumenta. comenzará a incluir páginas de contenido relevante y el sitio web recibirá más tráfico de Baidu.
Especialmente para los webmasters cuyo contenido del sitio web aún se está mejorando gradualmente y que están ansiosos por ser incluidos en Baidu, no se envíen ciegamente a los principales motores de búsqueda. En el proceso, primero promocioné el sitio web a través de artículos relacionados con enlaces externos y utilicé Baidu para darle mayor peso a Baidu Space, Tieba, Zhizhi y cooperé con Baidu para visitar con frecuencia los sitios web del portal con tiempos de actualización más rápidos, como: Sina, NetEase. , Tom Concéntrese en escribir artículos de cierta calidad en comunidades relevantes. De esta manera, Baidu considerará que el sitio web tiene mayor peso externo y lo incluirá voluntariamente.
Por supuesto, Baidu no será sólo el propagador del virus H1N1. Mientras encontremos el arma mágica para las reglas de recopilación de Baidu, este virus H1N1 también será eliminado por la mayoría de los webmasters.
Este artículo es una amable contribución del webmaster de www.wznanke.com. Contacto QQ309067036.