La estandarización de URL siempre ha sido un problema que preocupa a los webmasters y a los motores de búsqueda. Se estima que entre el 10% y el 30% de las URL en Internet son URL no estandarizadas con el mismo contenido pero URL diferentes. Esto crea varios problemas. Por ejemplo:
Para los webmasters, la existencia de varias URL dispersa el peso de la página y no favorece la clasificación.
Para los motores de búsqueda, es un desperdicio de recursos y ancho de banda.
Cuando los motores de búsqueda descubren que varias URL tienen el mismo contenido, no las castigarán, pero harán todo lo posible para encontrar la URL que debe estandarizarse. Pero después de todo, un programa es sólo un programa, y puede salir mal, y el elegido puede no ser la URL estandarizada que el webmaster desea.
Si el problema de estandarización de URL en el sitio web es demasiado grave, también puede afectar la inclusión. Un nombre de dominio con baja autoridad tiene un número limitado de páginas totales que pueden incluirse. Los motores de búsqueda gastan recursos en incluir URL no estándar, dejando menos recursos para contenido verdaderamente diferente.
Hay muchas opciones para resolver el problema de la canonicalización de URL. Por ejemplo: configurar la versión con 3W y sin 3W en las herramientas de administrador de Google, cuál es la versión estandarizada, usar la redirección 301, redirigir todas las URL no estandarizadas a URL estandarizadas y. asegúrese de que el sistema CMS utilizado genere solo URL canónicas, asegúrese de que todos los enlaces internos del sitio apunten a URL canónicas y especifique todas las URL canónicas en el mapa del sitio enviado a los motores de búsqueda, pero estos métodos tienen sus propias limitaciones.
Las herramientas de administrador de Google no son aplicables a otros motores de búsqueda. Algunos webmasters no pueden realizar redireccionamientos 301 por algún motivo. En la mayoría de los casos, el sistema CMS no está bajo su control. Pueden controlar los enlaces internos, pero los enlaces de otras personas a sus propios sitios web no. controlado por ellos Está fuera de control. En resumen, aunque existen soluciones alternativas, la estandarización de URL sigue siendo un gran problema hasta ahora.
Hace unos días, Google, Yahoo y Microsoft lanzaron conjuntamente una nueva etiqueta canónica para resolver el problema de la canonicalización de URL.
En pocas palabras, agregue este código al encabezado del archivo HTML:
El significado es que la URL estandarizada de esta página web debe ser:
http://www.example.com/product.php?item=pescado-sueco
Este código se puede agregar a las siguientes URL:
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678
Las URL canónicas reales de estas URL se convierten en:
http://www.example.com/product.php?item=pescado-sueco
En pocas palabras, esta etiqueta equivale a una redirección 301 dentro de una página. La diferencia es que el usuario no es redirigido, sino que permanece en la misma URL, y el motor de búsqueda lo tratará como una redirección 301, lo que significa que el peso del enlace de la página se concentrará en la URL estandarizada especificada en el código.
También hay algunos detalles a los que los webmasters deben prestar atención:
Esta etiqueta es sólo una sugerencia o sugerencia, no una instrucción. No es una instrucción como el archivo robots. Por lo tanto, los motores de búsqueda considerarán este código en gran medida, pero no al 100%. También considerarán otras situaciones para determinar la URL canónica. Esto también evita que los webmasters se equivoquen en la URL.
Este código puede utilizar direcciones absolutas o relativas. Generalmente se recomienda utilizar direcciones absolutas para estar más seguro. El contenido de la URL canónica especificada puede ser ligeramente diferente del contenido de otras URL no canónicas que utilizan este código, pero puede que no sea exactamente el mismo. Por ejemplo, hay muchos sitios web de comercio electrónico que clasifican por precio, color y tamaño en orden ascendente y descendente. Las URL generadas son todas diferentes, pero el contenido es aproximadamente el mismo. Solo hay pequeñas diferencias, por lo que puede utilizarlas. esta etiqueta.
La URL normalizada especificada puede ser una página que no existe, que devuelve 404, o una página que no se ha incluido. Pero no es recomendable hacer esto, no busques problemas. Esta etiqueta se aplica al mismo nombre de dominio, incluidos los nombres de dominio de segundo nivel. Pero no se aplica entre diferentes nombres de dominio para evitar que alguien lo secuestre. No utilices esta etiqueta como salvavidas. En primer lugar, debes tener una buena estructura del sitio web y tratar de evitar problemas de normalización de URL. Este es sólo un último recurso.
Las personas sensibles probablemente puedan ver la oportunidad de crear una gran cantidad de enlaces externos a partir de este nuevo estándar. Finalmente, este estándar es compatible con los tres principales motores de búsqueda: Google, Yahoo y Microsoft. ¿Por qué no se menciona a Baidu? Recuerdo haber visto informes de que Baidu es el segundo motor de búsqueda más grande del mundo en términos de volumen de búsqueda. ¿Con eso? ¿Jugamos juntos?
Autor: Zac@SEO Una publicación al día
Original: Blog interactivo de optimización de motores de búsqueda de Dianshi