Die URL-Standardisierung war schon immer ein Problem, das Webmastern und Suchmaschinen zu schaffen macht. Es wird geschätzt, dass 10–30 % der URLs im Internet nicht standardisierte URLs mit demselben Inhalt, aber unterschiedlichen URLs sind. Dies führt zu mehreren Problemen. Zum Beispiel:
Für Webmaster führt die Existenz mehrerer URLs zu einer Streuung der Gewichtung der Seite und ist nicht förderlich für das Ranking.
Für Suchmaschinen ist es eine Verschwendung von Ressourcen und Bandbreite.
Wenn Suchmaschinen feststellen, dass mehrere URLs denselben Inhalt haben, bestrafen sie diese nicht, sondern versuchen ihr Bestes, um die URL zu finden, die standardisiert werden sollte. Aber schließlich ist ein Programm nur ein Programm, und es kann schief gehen, und die ausgewählte URL ist möglicherweise nicht die standardisierte URL, die der Webmaster wünscht.
Wenn das URL-Standardisierungsproblem auf der Website zu schwerwiegend ist, kann es sich auch auf die Einbindung auswirken. Ein Domänenname mit geringer Autorität verfügt über eine begrenzte Anzahl an Gesamtseiten, die einbezogen werden können. Suchmaschinen geben Ressourcen für die Einbeziehung nicht standardmäßiger URLs aus, wodurch weniger Ressourcen für wirklich unterschiedliche Inhalte übrig bleiben.
Es gibt viele Möglichkeiten, das Problem der URL-Kanonisierung zu lösen, zum Beispiel: Legen Sie in den Google-Administratortools die Version mit 3W und ohne 3W fest, welche die standardisierte Version ist, verwenden Sie die 301-Umleitung, leiten Sie alle nicht standardisierten URLs auf standardisierte URLs um und Stellen Sie sicher, dass das verwendete CMS-System nur kanonische URLs generiert, stellen Sie sicher, dass alle internen Links auf der Website auf kanonische URLs verweisen, und geben Sie alle kanonischen URLs in der an Suchmaschinen übermittelten Sitemap an. Diese Methoden haben jedoch ihre eigenen Einschränkungen.
Einige Webmaster können aus irgendeinem Grund keine 301-Weiterleitungen durchführen. In den meisten Fällen unterliegen sie nicht der Kontrolle über interne Links, die Links anderer Personen zu ihren eigenen Websites Von ihnen kontrolliert Es ist außer Kontrolle, obwohl es alternative Lösungen gibt, ist die URL-Standardisierung bisher immer noch ein großes Problem.
Vor einigen Tagen haben Google, Yahoo und Microsoft gemeinsam ein neues kanonisches Tag-Tag veröffentlicht, um das Problem der URL-Kanonisierung zu lösen.
Um es einfach auszudrücken: Fügen Sie diesen Code zum Kopf der HTML-Datei hinzu:
Das bedeutet, dass die standardisierte URL dieser Webseite lauten sollte:
http://www.example.com/product.php?item=swedish-fish
Dieser Code kann zu den folgenden URLs hinzugefügt werden:
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678
Die echten kanonischen URLs dieser URLs lauten:
http://www.example.com/product.php?item=swedish-fish
Vereinfacht ausgedrückt entspricht dieses Label einer 301-Weiterleitung innerhalb einer Seite. Der Unterschied besteht darin, dass der Benutzer nicht umgeleitet wird, sondern auf derselben URL bleibt und die Suchmaschine dies als 301-Weiterleitung behandelt, was bedeutet, dass das Gewicht des Seitenlinks auf die im Code angegebene standardisierte URL konzentriert wird.
Außerdem gibt es ein paar Details, auf die Webmaster achten müssen:
Dieses Tag ist lediglich ein Vorschlag oder Hinweis, keine Anweisung. Es handelt sich nicht um eine Anweisung wie die Robots-Datei. Daher berücksichtigen Suchmaschinen diesen Code weitgehend, jedoch nicht zu 100 %. Sie berücksichtigen auch andere Situationen, um die kanonische URL zu ermitteln. Dies verhindert auch, dass Webmaster die URL falsch verstehen.
Dieser Code kann entweder absolute oder relative Adressen verwenden. Aus Sicherheitsgründen wird normalerweise empfohlen, absolute Adressen zu verwenden. Der Inhalt der angegebenen kanonischen URL unterscheidet sich möglicherweise geringfügig vom Inhalt anderer nicht-kanonischer URLs, die diesen Code verwenden, ist jedoch möglicherweise nicht genau derselbe. Beispielsweise gibt es viele E-Commerce-Websites, die nach Preis, Farbe und Größe in aufsteigender und absteigender Reihenfolge sortieren. Die generierten URLs sind alle unterschiedlich, der Inhalt ist jedoch ungefähr gleich. Es gibt nur geringfügige Unterschiede, sodass Sie sie verwenden können dieses Tag.
Die angegebene normalisierte URL kann eine Seite sein, die nicht existiert und 404 zurückgibt, oder eine Seite, die nicht eingebunden wurde. Es wird jedoch nicht empfohlen, dies zu tun. Suchen Sie nicht nach Ärger. Diese Bezeichnung gilt für denselben Domänennamen, einschließlich Domänennamen der zweiten Ebene. Es gilt jedoch nicht zwischen verschiedenen Domainnamen, um zu verhindern, dass jemand sie kapert. Verwenden Sie dieses Tag nicht als Lebensader. Zunächst müssen Sie über eine gute Website-Struktur verfügen und versuchen, Probleme bei der URL-Normalisierung zu vermeiden. Dies ist nur der letzte Ausweg.
Sensible Menschen können in diesem neuen Standard vermutlich die Chance erkennen, eine Vielzahl externer Links aufzubauen. Schließlich wird dieser Standard von den drei großen Suchmaschinen Google, Yahoo und Microsoft unterstützt. Ich erinnere mich, dass ich Berichte gesehen habe, dass Baidu gemessen am Suchvolumen die zweitgrößte Suchmaschine der Welt ist damit? Sollen wir zusammen spielen?
Autor: Zac@SEO Ein Beitrag pro Tag
Original: Dianshi Interactive Search Engine Optimization Blog