Todo el que hace SEO sabe que la clave es que el sitio web se incluya en el motor de búsqueda. Si su sitio no está incluido en el motor de búsqueda, entonces el SEO está fuera de discusión. Por lo tanto, si desea que los motores de búsqueda descubran su sitio web y que sus páginas web sean indexadas correctamente, primero debe hacer que su sitio sea fácil de rastrear para las arañas. Las herramientas utilizadas por los motores de búsqueda para rastrear páginas web se denominan arañas o robots rastreadores, y su nombre en inglés es robot. Estas arañas rastrean muchas de nuestras páginas a lo largo de los hipervínculos, pero algunas páginas no se pueden rastrear. Algunas de ellas se deben a que el sitio web en sí tiene algunos problemas que no favorecen el rastreo de arañas, lo que dificulta que los motores de búsqueda indexen las páginas correspondientes. , formando así una " "trampa de araña" generalmente se refiere a tecnologías de producción de sitios web que no son amigables para los motores de búsqueda. Estas tecnologías no favorecen que las arañas rastreen nuestras páginas. Para evitar esta situación, Xiaowuming resumió los siguientes factores para evitar que las arañas entrando en la trampa.
1: Páginas que usan ID de sesión. Algunos sitios de ventas usarán ID de sesión para rastrear a los usuarios con el fin de analizar cierta información del usuario. Al acceder al sitio, cada usuario agregará una ID de sesión a la URL. tratado como un nuevo usuario cada vez que la araña visita la URL, se agregará una identificación de sesión. Esto dará como resultado la misma página pero diferentes URL. Esto dará como resultado una página de contenido duplicado, lo que generará páginas de contenido altamente repetitivas. También es una de las trampas para arañas más comunes. Por ejemplo, para mejorar el rendimiento de las ventas, algunos sitios web realizan conversaciones emergentes, como hola amigos de XXX, etc.
2: Trampas de arañas de sentido común que utilizan el registro o inicio de sesión forzados para acceder a las páginas. Esto es bastante difícil para las arañas, porque las arañas no pueden enviar el registro y no pueden ingresar nombres de usuario y contraseñas para iniciar sesión y ver el contenido. Haga clic para ver directamente también el contenido que las arañas pueden ver.
3: Me gustan los sitios que usan Flash. La razón por la que digo que me gustan los sitios que usan Flash es porque para algunas pequeñas y medianas empresas, Flash en sí puede generar muchos tipos de efectos, especialmente cuando se usa en la navegación. tiene un fuerte efecto visual, por lo que a muchos sitios web empresariales les gusta usar flash para mostrar la fortaleza, la cultura, los productos, etc. de su empresa. Incluso la página de inicio de algunos sitios corporativos es flash, ya sea saltando a otra página a través de flash después de un cierto período de tiempo. Los enlaces permiten a los usuarios hacer clic para ingresar a una nueva página, pero a las arañas les resulta difícil leer el contenido en flash, por lo que también les resulta difícil hacer clic en enlaces en flash.
4: URL dinámica, agregar demasiados símbolos o parámetros de URL a la URL, etc. He mencionado este tipo de trampa para arañas en la optimización de URL, aunque con el desarrollo tecnológico de los motores de búsqueda, las URL dinámicas son menos efectivas para que las arañas las rastreen. Se está volviendo un problema cada vez menor, pero en términos de compatibilidad con los motores de búsqueda, las URL estáticas o incluso pseudoestáticas son relativamente mejores que las URL dinámicas. Puede ver cuántos colegas de SEO manejan URL.
5: Los marcos se usaban ampliamente en todas partes al principio, pero ahora muchos sitios web en páginas web con marcos rara vez los usan. En primer lugar, con el desarrollo de los principales sistemas CMS, el mantenimiento del sitio web se ha vuelto relativamente más fácil. Se utilizan marcos porque es conveniente para el mantenimiento de las páginas del sitio web. Además, no favorece la inclusión en los motores de búsqueda y es una de las razones por las que los marcos se utilizan cada vez menos.
6: JS, aunque los motores de búsqueda ahora pueden rastrear e incluso intentar desensamblar y analizar enlaces en JavaScript, es mejor que no esperemos que los motores de búsqueda superen las dificultades por sí solos. Aunque se puede realizar cierta navegación efectiva a través de JS, CSS también puede hacerlo. hágalo; para mejorar la facilidad de uso del sitio web para los motores de búsqueda, se recomienda que la página web sea más rastreable por las arañas, trate de no usar js. Por supuesto, en SEO, una ventaja de js es que el webmaster lo hace. No quiero que se incluyan las páginas. O los enlaces amigables pueden usar js. Otra forma de eliminar las trampas de arañas de Javascript es utilizar la etiqueta <noscript>. La etiqueta <noscript> proporciona código alternativo para navegadores que no admiten JavaScript. Las arañas no ejecutan JavaScript, por lo que procesan código <noscript> en su lugar.
7: Las páginas web profundas, algunas de las cuales no tienen entrada y están lejos de la página de inicio del sitio web, son relativamente difíciles de rastrear para las arañas. Por supuesto, puede ser un asunto diferente para aquellos sitios web con mucho peso. Para que se incluya una página de sitio web, primero debe tener un peso básico. El peso de la página de inicio es generalmente el más alto, y luego el peso de la página de inicio se puede pasar a las páginas internas. aumenta al umbral que se puede incluir, la página Según esta teoría, la transferencia de peso entre páginas disminuirá. Por lo tanto, cuanto más cercana sea la distancia de clic entre la página interior y la página de inicio, más fácil será obtener más peso. transferencia en la página de inicio. Una buena estructura del sitio web puede permitir que se incluyan más páginas del sitio web.
8: El uso forzado de cookies equivale a deshabilitar directamente las cookies para los motores de búsqueda. Algunos sitios web utilizarán cookies forzadas para lograr ciertas funciones, como rastrear las rutas de acceso de los usuarios, recordar información del usuario o incluso robar la privacidad de los usuarios, etc. Si el usuario no habilita las cookies cuando visita dichos sitios, la página mostrada será anormal, por lo que las arañas no podrán acceder normalmente a la misma página web.
9: Varias formas de saltos. Creo que muchos niños de SEO ya están muy familiarizados con las redirecciones 301. Sin embargo, las arañas están muy disgustadas con otros 302, o saltos como metaactualización, javascript, flash, etc., y 301 no es el último. recurso Cuando se usa, cualquier salto causará obstáculos para el rastreo de la araña hasta cierto punto, así que ya lo sabes.
10: Errores de escritura de Robots.txt y diversas técnicas de trampa, como texto oculto, enlaces ocultos, etc., utilizando páginas web disfrazadas para mostrar diferentes páginas web para determinar si el visitante es una araña o un navegador normal, y utilizando el error predeterminado Las páginas 404, etc., también provocarán obstáculos para las arañas. Fuente de este artículo: Sitio web de Shenzhen SEO: http://www.zhsem.com/ Respete la originalidad, indíquelo al reimprimir, ¡gracias!
El espacio personal del autor Xiao Wuming