El 25 de junio, el autor publicó un artículo "Uso inteligente de redirecciones 301 para convertir errores 404 en enlaces externos de sitios web" y habló sobre cómo utilizar redirecciones 301 para convertir URL de error obtenidas desde el exterior en URL accesibles, para lograr el objetivo. traslado de artículos pesados.
Hoy vi un artículo en A5 llamado "Una breve discusión sobre los peligros de usar la redirección 301 para transferir páginas 404 a sus propios enlaces externos", que refutaba las opiniones de mi artículo anterior. Creo que es muy bueno que la industria del SEO debería tener este tipo de espíritu interrogativo y la capacidad de pensar de forma independiente. Leí el artículo detenidamente y descubrí que el autor no entendió lo que quería decir. Así que escribiré otro artículo para aclarar el punto de vista y presentar el papel de la redirección 301. Primero, aclaro dos ideas en el artículo "Uso del redireccionamiento 301 para convertir errores 404 en enlaces externos a sitios web":
El artículo habla sobre cómo redirigir la URL del error 404 a la URL original a través del 301. Es necesario explicar este punto. No mencioné ningún 301 a la página de inicio ni a otras páginas en el artículo. El ejemplo del artículo trata sobre cómo vincular un sitio web externo (sitio web B) a su propio sitio web (sitio web A). pueden ocurrir errores ortográficos en las URL, adiciones de enlaces incorrectas o incluso generar URL incorrectas intencionalmente. En lugar de un error 404 en el propio sitio web A.
El texto original siempre está ahí y los amigos que tengan preguntas pueden leerlo atentamente. Permítanme refutar el punto de vista de este amigo a continuación (las palabras en azul son opiniones de amigos que tienen opiniones refutadas):
Refutar el primer párrafo.
El autor original atribuyó los errores 404 en el enlace externo que apuntaba al exterior del sitio web. Sin embargo, la aparición de este error 404 también está determinada por el propio programa del sitio web. escápelo, como También puede haber muchas páginas 404 con sufijos como este o aquel en la página A5. Simplemente agregue 1.html y 2.html directamente al final, y eso es todo, pero si alguien usa deliberadamente enlaces externos para vincular. como estas páginas web, eso también es para traer enlaces al sitio web, eso es todo, como máximo generará una página 404 y nada más.
Si se produce un error 404 en el sitio web, no es necesariamente un problema con el programa interno del sitio web. Si la araña accede a su propio sitio web (tome el sitio web A como ejemplo) a través de una URL incorrecta en un sitio web externo (tome el sitio web B como ejemplo), también provocará un error 404, es decir, la URL incorrecta conduce al página equivocada. A la araña no le importa si la URL vinculada existe dentro o fuera del sitio web. Siempre que se produzca una "página no existe" durante el rastreo de la URL, se registrará un error 404.
Podemos ver esto claramente en la columna "Estado de la operación" - "Errores de rastreo" - "No encontrado" de las Herramientas de administrador de Google. Google divide los errores 404 en dos categorías: "en el mapa del sitio" (causa interna) y "dominio vinculado a la página de su sitio web" (causa externa).
Como sugiere el nombre, el "dominio que enlaza a la página de su sitio web" se refiere a la URL que enlaza desde el sitio web B al sitio web A.
Segundo párrafo de refutación
El autor original quiere entender cómo captar el peso de este aspecto y quiere devolver directamente el peso de este enlace externo en lugar de dejarlo ir. Aquí, el autor también tiene su propio punto de vista sobre este tipo de enlace externo "http. :/ /www.xxxxx.com/rich-snippets.htmlGFQ", este tipo de enlace externo enlaza con páginas 404. Si accede a estas páginas 301, esta situación será la misma que la de una gran cantidad de páginas 404 en el sitio web, y luego directamente La situación de 404 páginas y 301 por página es la misma; entonces, si su sitio web tiene 404 páginas, para evitar la pérdida de estos pesos, ¿deberían todas estas páginas ser 301 por página de inicio? requisitos de los motores de búsqueda Si lo desea Si lo sabe claramente, simplemente busque "Los peligros de la página 404 301 en la página de inicio" en Baidu y sabrá más.
En primer lugar, los motores de búsqueda distinguen claramente entre "comportamiento propio" y "comportamiento externo". Tomemos como ejemplo la construcción de enlaces. Los enlaces internos y los enlaces externos tienen diferentes efectos en términos de peso. Todo el mundo lo sabe. La idea central es que los enlaces externos están fuera del control del webmaster, mientras que los enlaces internos pueden ser establecidos por el webmaster. Aunque en el proceso de desarrollo de los motores de búsqueda apareció el factor de "enlaces externos que pueden ser controlados por el webmaster" (es decir, construcción ordinaria de enlaces externos). Pero independientemente de si es controlable o incontrolable, una idea es clara: nadie enviará la URL incorrecta bajo la premisa de que los sitios web de otras personas pueden publicar la URL correcta, lo que provocará que los usuarios no puedan acceder a su propio sitio web normalmente o no poder acceder a su propio sitio web. En el sitio web aparece la mención "Esta página no existe".
En segundo lugar, si el 301 va a la página web original o si el 301 va a la página de inicio. No quiero decir más sobre esto, todos pueden entender lo que quiero decir leyendo el texto original. Lo que quiero decir aquí son algunas señales de cómo los motores de búsqueda identifican la fuente del texto original:
Dónde los motores de búsqueda ven el contenido por primera vez
Confiabilidad de los nombres de dominio con muchos contenidos similares
Dónde hay más enlaces (enlaces internos en el texto original)
Si la copia enlaza con la fuente original (enlace de derechos de autor)
Debido a la existencia de la segunda señal, muchos de los contenidos publicados o reimpresos en otros sitios web por nuestros autores originales no pueden obtener buenas clasificaciones. Muchos autores también se han quejado de esto. Pero podemos utilizar las señales de 1, 3 y 4 puntos para corregir este error.
Baidu no es muy bueno en esto, pero Google puede identificar de forma rápida y precisa la fuente del texto original. Esto se debe a los 3 puntos anteriores. El factor "si la copia enlaza con la fuente original" también es uno de los propósitos explicados en mi artículo "Uso del redireccionamiento 301 para convertir errores 404 en enlaces externos de sitios web". Hay otro propósito que también has visto. el peso.
Finalmente, redirigir una URL incorrecta a la que el usuario no puede acceder a la URL correcta a través de 301 de manera razonable. También ayuda con la experiencia del usuario. También vemos esta frase en los "Errores de rastreo" de las Herramientas de administración de Google.
El robot de Google no puede rastrear la URL porque apunta a una página que no existe. Normalmente, un 404 no afectará la clasificación de su sitio en los resultados de búsqueda, pero puede usarlo para mejorar la experiencia del usuario.
La única forma de resolver los errores 404 es bloquear robots.txt o utilizar redireccionamientos 301. No creo que el bloqueo mejore la experiencia del usuario. El enfoque robots.txt sólo puede mejorar la experiencia de la araña. Porque después de que el usuario hace clic en la URL incorrecta, aún accede a una página que no existe y ve un error 404.
Refutar el tercer párrafo.
Copie directamente las palabras originales "Si se devuelve un código distinto de 404 o 410 para una página web inexistente (o el usuario es redirigido a otras páginas web, como la página de inicio, en lugar de devolver 404), pueden ocurrir problemas. En primer lugar , esto equivale a informarle al motor de búsqueda. Como resultado, los motores de búsqueda pueden rastrear esta URL e indexar su contenido porque el robot de Google pasa mucho tiempo procesando páginas inexistentes y es posible que no pueda encontrar su URL de manera rápida o frecuente al visitarla. estas URL, no podrá visitarlas con suficiente frecuencia como para afectar el rastreo del contenido de su sitio (además, no desea que su sitio aparezca con frecuencia en las consultas de búsqueda de "Archivo no encontrado). Página 404, si no continúas saltando a la página de error como se requiere, lo que puede pasar es que habrá una gran cantidad de páginas iguales en tu sitio web, el mismo título, la misma descripción, el mismo contenido, etc. Entonces esto es diferente La historia entre la URL y el mismo contenido. En cuanto a lo que sucederá en el futuro, puedes ir a Baidu o buscar en Google para averiguarlo.
Dado que el amigo de la refutación mencionó las Directrices para administradores de Google, no olvide extraer otro párrafo:
En términos generales, los errores 404 no afectarán la clasificación de su sitio en Google, por lo que puede ignorarlos con seguridad. Estos errores suelen ser el resultado de errores ortográficos, mala configuración (como enlaces generados automáticamente por sistemas de administración de contenido) o los mayores esfuerzos de Google para identificar y rastrear enlaces en contenido incrustado como javascript.
Para ver la fuente de un enlace inactivo, haga clic en la URL en cuestión. En el cuadro de diálogo de error, haga clic en la pestaña Enlace de la página siguiente. Si los enlaces relevantes provienen de su sitio, corríjalos o elimínelos. Si estos enlaces provienen de sitios web externos, puede utilizar estos datos para mejorar la experiencia del usuario de su sitio web. Por ejemplo, si alguien quiso vincular a su sitio pero lo escribió mal, una URL legítima estaría mal escrita (como www.example.com/awesome en lugar de www.example.com/awsome ). En lugar de devolver un error 404, puedes redirigir 301 una URL mal escrita a la URL correcta y obtener el tráfico esperado a través de ese enlace. También puede asegurarse de ayudar a los usuarios a encontrar lo que buscan después de dirigirlos a una página 404, en lugar de simplemente mostrar "404 no encontrado". Sin embargo, sólo recomendamos seguir estos pasos si el enlace incorrecto genera una gran cantidad de tráfico.
Enlace fuente: https://support.google.com/webmasters/bin/answer.py?hl=zh-Hans&answer=2409439
Desafortunadamente, este amigo solo vio uno, pero no el otro. Cuando hacemos SEO, la información oficial es muy importante. En ella se esconden muchos detalles y lleva mucho tiempo leerla y comprenderla detenidamente.
De hecho, muchas de las configuraciones y descripciones de las Herramientas de administración de Google tienen sentido. Es solo que algunos de nosotros, los SEO, no queremos entender. Al igual que las causas internas y externas del 404, tiene sentido distinguirlas en el elemento "error de rastreo". En lugar de simplemente hacerlo cuando no tienes nada que hacer.
Resumen: Como SEO, necesitamos absorber mucho conocimiento y, al mismo tiempo, desarrollar nuestras propias ideas y formas de analizar problemas. Pero debe asegurarse de que el conocimiento que adquiera sea avanzado y no esté desactualizado. De lo contrario, sus ideas pueden ser fácilmente engañadas y producir malos resultados.
Debatir opiniones también es una parte muy importante del trabajo SEO. Nadie puede decir con certeza que su comprensión es correcta. Sólo podemos utilizar cierta información oficial revelada y nuestras propias conclusiones extraídas a través del análisis de datos para demostrar la exactitud de nuestras ideas y teorías.
Este artículo fue publicado originalmente por Yang Fan sobre SEO de Yang. Conserve el enlace para reimprimir: http://www.seoyangs.com/404-301-original-page.html.
(Editor: Chen Long) Espacio personal del autor AimarYang