Suchmaschinen wie Google haben ein Problem. Sie nennen es „duplicate content“. Ihre Inhalte werden auf verschiedenen Seiten der Website angezeigt und sie wissen nicht, unter welcher Adresse sie angezeigt werden sollen. Dieser doppelte Inhalt ist besonders problematisch, wenn Personen auf alle verschiedenen Versionen Ihres Inhalts verlinken. Der Zweck dieses Artikels besteht darin, Ihnen zu helfen, die verschiedenen Ursachen für doppelte Inhalte zu verstehen und anschließend herauszufinden, wie Sie die einzelnen Ursachen beheben können.
Gründe für Duplicate Content
1. Missverständnis des URL-Konzepts
2. Sitzungs-IDs
3. URL-Tracking-Parameter
4. Inhaltssuche und Inhaltsaggregation
5. Parameterreihenfolge
6. Kommentarpaginierung
7. Seite drucken
8. www vs. kein www
Konzeptionelle Problemumgehung: „kanonisches“ Tag
1. Identifizieren Sie doppelten Inhalt
2. Google Webmaster-Tools
3. Suchbefehl zum Abfragen des Titels
Praktische Schritte zur Lösung doppelter Inhalte
1. Vermeiden Sie doppelte Inhalte
2. 301-Weiterleitung
4. Verwenden Sie das rel="canonical"-Tag
5. Link zum Originalinhalt
Zusammenfassung: Duplicate Content kann und sollte angegangen werden
Sie können sich Duplicate Content so vorstellen, als ob Sie an einer Kreuzung stünden und auf den Verkehrsschildern zwei unterschiedliche Richtungen zum gleichen Ziel zeigten. Welchen Weg sollten Sie nehmen? Darüber hinaus ist die Situation noch schlimmer, wenn Ihr Reiseziel ein anderes ist. Als Leser ist es Ihnen egal, woher der Inhalt kommt, aber die Suchmaschinen müssen einen auswählen, der in den Suchergebnissen angezeigt wird, weil sie nicht möchten, dass derselbe Inhalt zweimal angezeigt wird.
Wenn es sich beispielsweise um Inhalte zum Schlüsselwort -x/ handelt , ist diese Situation nicht fiktiv, dieses Problem besteht in vielen CMS-Systemen. Beispielsweise wurde Ihr Artikel von einigen Internetnutzern gesammelt und erneut veröffentlicht, einige Leute verlinken auf Ihre erste URL und andere verlinken auf Ihre zweite URL. Hier kommt das Problem des Duplicate Content ins Spiel. Wenn alle Links zu diesem Keyword auf eine URL verweisen, ist die Wahrscheinlichkeit, dass das Keyword auf der Startseite vorkommt, deutlich höher.
Ursachen für Duplicate Content
Es gibt viele Faktoren, die zu Duplicate Content führen können. Das meiste davon ist technischer Natur. Es kommt nicht oft vor, dass jemand beschließt, denselben Inhalt an zwei verschiedenen Orten zu platzieren, ohne die Originalquelle anzugeben, und die meisten Leute würden es als unangenehm empfinden. Auch die technischen Gründe sind sehr gut. Die meisten Gründe dafür sind, dass Programmierer nicht aus der Perspektive von Browsern oder Benutzern stehen und sich nicht um Suchmaschinenspinnen kümmern, sondern einfach den Gedanken des Programmierers folgen. Angenommen, der zuvor erwähnte Artikel erscheint unter http://www.example.com/keyword-x/ und http://www.example.com/article-category/keyword-x/ ? Wenn Sie den Programmierer fragen, wird er sagen, dass es nur einmal vorkommt.
Missverständnis des URL-Konzepts
Sind Programmierer also verrückt? Nein, nein, er sprach einfach wieder eine andere Sprache. Die gesamte Website, die Sie sehen, ist wahrscheinlich datenbankgesteuert. In dieser Datenbank gibt es nur einen Artikel, und das Website-Programm ermöglicht den Zugriff auf einen Artikel in der Datenbank über verschiedene URLs. Denn in den Augen von Programmierern ist das einzige Zeichen, dass die Artikel in der Datenbank eindeutige IDs und keine URLs haben. Für Suchmaschinen ist die URL die eindeutige Kennung eines Artikels. Wenn Sie dies Ihrem Programmierer sagen, wird er die Ursache des Problems verstehen und sich dann, wie die meisten Programmierer, mit denen ich zusammenarbeite, fragen, warum Suchmaschinen dumm sind und warum er dieses Problem nicht lösen kann. Auf diese Weise gelangte er zu einem weiteren falschen Denken.
Sitzungs-ID
Sie möchten häufig die Bewegungen Ihrer Besucher verfolgen, beispielsweise die Speicherung der von ihnen gekauften Artikel in ihrem Warenkorb. Dazu müssen Sie ihnen eine Sitzung geben. Bei einer Sitzung handelt es sich im Grunde genommen um einen kurzen Verlauf dessen, was ein Besucher auf Ihrer Website getan hat. Dazu können Inhalte wie die Artikel in einem Warenkorb gehören. Um zu verhindern, dass die Sitzung des Besuchers von einer Webseite zur anderen klickt, muss sie irgendwo gespeichert werden. Die häufigste Lösung sind Cookies, allerdings speichern Suchmaschinen in der Regel keine Cookies.
Was an diesem Punkt passiert, ist, dass einige Website-Systeme die Sitzungs-ID in der URL verwenden, um zurückzukehren. Zu diesem Zeitpunkt wird den internen Links auf jeder Website die Sitzungs-ID angehängt, und die Sitzungs-ID ist eindeutig, wodurch eine neue URL und damit doppelter Inhalt generiert werden.
Verwenden von Tracking- und Sortier-URL-Parametern
Eine weitere Ursache für Duplicate Content ist die Verwendung von URL-Parametern, obwohl Parameter den Inhalt der Seite nicht verändern, etwa bei Tracking-Links. Sie werden sehen , dass http://www.example.com/keyword-x/ und http://www.example.com/keyword-x/?source=rss nicht dieselben URLs für Suchmaschinen sind. Letzteres ermöglicht es Ihnen möglicherweise, Quellen zu verfolgen, was Ihr Ranking etwas erschweren kann, was ein sehr negativer Effekt ist.
Dies gilt nicht nur für Tracking-Parameter, sondern auch für jeden Parameter, den Sie nach der URL hinzufügen, ohne den eigentlichen Inhalt Ihrer Seite zu ändern. Durch das Einbeziehen von Parametern wird die Reihenfolge der Produkte auf der Webseite geändert oder eine andere Seitenleiste angezeigt, was zu doppeltem Inhalt führt.
Content Scraping und Content Aggregation
Während die überwiegende Mehrheit der Ursachen für Duplicate Content Ihr eigenes Verschulden oder zumindest das Ihrer Website ist, liegt es manchmal auch daran, dass eine andere Website Ihre Inhalte ohne Ihre Zustimmung verwendet. Sie verweisen nicht immer auf Ihren Originalinhalt und Suchmaschinen wissen nicht, dass sie eine andere Version desselben Artikels verarbeiten müssen.
Je beliebter Ihre Website wird, desto mehr Crawls werden Sie erleben und Ihre Probleme werden schlimmer.
Parameterreihenfolge
Ein weiterer häufiger Grund ist, dass CMS keine prägnanten und sauberen URLs verwendet, sondern /? id=1&cat=2, die ID hier gibt den Artikel an und cat gibt die Kategorie an. In den meisten Website-Erstellungssystemen ist diese URL /? cat=2&id=1 rendert ebenfalls denselben Inhalt, für Suchmaschinen sind sie jedoch völlig unterschiedlich.
Kommentarpaginierung
Es besteht die Möglichkeit, Kommentare im WordPress-System oder anderen Programmen zu paginieren. Dies führt zu einer Duplizierung des Artikelinhalts in der URL des Artikels selbst und der Artikel-URL+/Kommentarseite-1/, /Kommentarseite-2/ usw.
Seite drucken
Wenn Ihr CMS Druckseiten und Links aus Ihren Artikelseiten generiert, werden diese Seiten in den meisten Fällen von Google gefunden, es sei denn, Sie verhindern dies ausdrücklich. Welche Version soll Google anzeigen? Eine Seite mit Anzeigen und umgebendem Inhalt oder eine Seite nur mit Ihren Artikeln.
WWW vs. Nicht-WWW
Dies ist eine alte Frage, aber manchmal verwechseln Suchmaschinen WWW- und Nicht-WWW-Duplicate Content immer noch, wenn beide Versionen zugänglich sind.
Eine ungewöhnliche Situation ist der doppelte Inhalt von http vs. https.
Konzeptionelle Problemumgehung: „kanonisches“ Tag
Wie oben erwähnt, ist doppelter Inhalt, der aus unterschiedlichen URLs für denselben Inhalt resultiert, ein Problem, das jedoch gelöst werden kann. Ein Mensch kann Ihnen beim Veröffentlichen eines Artikels normalerweise leicht sagen, wie die richtige URL für einen Artikel lauten sollte. Das Lustige ist, dass man manchmal drei Leute im selben Unternehmen fragt und drei verschiedene Antworten bekommt.
Zusammenfassung: Duplicate Content kann und sollte angegangen werden
In diesen Fällen muss das Problem gelöst werden, da am Ende nur eine URL stehen darf. Die korrekte URL des Artikels kann von Suchmaschinen als Canonical bezeichnet werden.
Identifizieren Sie doppelten Inhalt
Möglicherweise wissen Sie nicht, ob Ihre Website doppelten Inhalt enthält. Lassen Sie mich Ihnen einige Tipps geben.
Google Webmaster-Tools
Google Webmaster Tools ist ein großartiges Tool zur Identifizierung doppelter Inhalte. Wenn Sie zu den Google Webmaster-Tools gehen und Ihre Website anzeigen, überprüfen Sie „Diagnose -> HTML-Vorschläge“. Dort sehen Sie etwa Folgendes
Wenn eine Seite einen doppelten Titel oder eine doppelte Beschreibung hat, passiert dort fast nichts Gutes. Wenn Sie darauf klicken, wird Ihnen angezeigt, welche URLs doppelte Titel oder Beschreibungen haben, um Ihnen bei der Identifizierung des Problems zu helfen. Das Problem besteht darin, dass die Titel möglicherweise unterschiedlich sind, wenn ein Artikel zum Thema „Schlüsselwort -X“ in zwei Kategorien angezeigt wird. Ihre Titel wären beispielsweise „Stichwort X – Kategorie X – Beispielseite“ und „Stichwort X – Kategorie Y – Beispielseite“. Google behandelt sie nicht als doppelte Titel, Sie können sie jedoch durch Suchen finden.
Finden Sie Titel oder andere Fragmente
Es gibt mehrere Suchoperatoren, die in dieser Situation sehr hilfreich sind. Wenn Sie alle URLs von Artikeln auf Ihrer Website finden möchten, die Ihr Schlüsselwort „X“ enthalten, können Sie den folgenden Befehl in das Google-Suchfeld eingeben:
site:example.com intitle:"Keyword X"
Code kopieren
Google zeigt Ihnen alle Seiten auf example.com an, die dieses Schlüsselwort enthalten. Je spezifischer Sie im Titelbereich nach Schlüsselwörtern suchen, desto einfacher ist es, doppelte Inhalte zu finden und zu beseitigen. Mit derselben Methode können Sie auch doppelte Inhalte von Ihnen auf den Websites anderer Personen identifizieren. Der vollständige Titel Ihres Artikels lautet beispielsweise Stichwort X – warum es großartig ist, können Sie durchsuchen
intitle: „Keyword X – warum es großartig ist“
Code kopieren
Google gibt alle Websites zurück, die diesen Titel enthalten. Manchmal können Sie auch nach einem oder zwei Sätzen in Ihrem Artikel suchen, da einige Content-Scraper möglicherweise Ihren Titel ändern. In einigen Fällen zeigt Google bei der Suche am Ende der Ergebnisse möglicherweise die folgende Eingabeaufforderung an:
Dies ist ein Zeichen dafür, dass Google doppelte Datenergebnisse entfernt hat. Das ist offensichtlich nicht gut. Sie können weiterklicken, um andere Ergebnisse anzuzeigen und zu sehen, ob es Ihnen bei der Lösung dieser Probleme hilft.
Praktische Schritte zur Lösung doppelter Inhalte
Sobald Sie entschieden haben, welche URL für Ihren Artikel kanonisiert werden soll, müssen Sie einen Kanonisierungsprozess starten (ok, ich weiß, dass ich ausführlich bin und das schon mehrmals gesagt habe). Das bedeutet im Grunde, Suchmaschinen diese kanonische Version so schnell wie möglich mitzuteilen und sie entdecken zu lassen. Hier sind vier Möglichkeiten, dieses Problem zu lösen:
1. Erstellen Sie keine doppelten Inhalte
2. Leiten Sie doppelte Inhalte auf kanonische URLs um
3. Fügen Sie der duplizierten Seite ein Link-Canonical-Tag hinzu
4. Fügen Sie einen Hyperlink zur kanonischen URL auf der Seite mit doppeltem Inhalt hinzu
Vermeiden Sie doppelten Inhalt
Für die oben genannten Ursachen von Duplicate Content gibt es einige einfache Möglichkeiten, diese zu beheben.
1. Sitzungs-ID in URL?
Normalerweise können Sie es in Ihren Systemeinstellungen abbrechen
2. Es gibt eine gedruckte Seite
Dies ist nicht erforderlich, Sie können ein Druck-Stylesheet verwenden
3. Verwenden Sie die Kommentarpaginierung in WordPress
Können Sie bei diesem Problem die Kommentarpaginierung in den Einstellungen deaktivieren?
4. Verschiedene Parameterreihenfolgen
Weisen Sie Ihren Programmierer an, einen Code zu erstellen, der in derselben Reihenfolge sortiert (dies bezieht sich normalerweise auf die URL-Factory).
5. Probleme mit den Tracking-Parametern
In den meisten Fällen können Sie Hash-Werte # anstelle von Parametern verwenden, um Marketingkampagnen zu verfolgen
6. WWW vs. Nicht-WWW-Problem
Wählen Sie die gewünschte Version und bleiben Sie bei der Weiterleitung. Sie können dies in den Google Webmaster-Tools festlegen.
Wenn Ihr Problem nicht so einfach zu lösen ist, kann es sich dennoch lohnen, Duplicate Content vollständig zu verhindern. Das ist bisher die beste Lösung.
301-Duplikate umleiten
In manchen Fällen lässt sich die Generierung falscher URLs durch die von Ihnen verwendeten Systemartikelinhalte nicht vollständig verhindern, Sie können diese aber umleiten. Wenn das für Sie keinen Sinn ergibt (und das verstehe ich), müssen Sie daran denken, dies Ihren Programmierern mitzuteilen. Wenn Sie außerdem ein Problem mit doppeltem Inhalt beheben, stellen Sie sicher, dass Sie alle alten URLs mit doppeltem Inhalt auf die entsprechenden kanonischen URLs umleiten.
Verwenden Sie rel="Canonical"
Manchmal möchte oder kann man das Problem doppelter Artikel nicht lösen, muss aber wissen, dass es sich um die falsche URL handelt. Für dieses spezielle Problem haben Suchmaschinen dies auch eingeführt
Kanonische Elemente. Der Teil, an dem es auf Ihrer Website platziert wird, sieht folgendermaßen aus:
<link rel="canonical" href=" http://example.com/keyword-x/"/ >
Im href-Teil des Canonical-Link-Tags platzieren Sie die korrekte kanonische URL des Artikels. Wenn Google oder andere Suchmaschinen, die dieses Attribut unterstützen, dieses Link-Element finden, wird ein weicher 301-Sprung durchgeführt: Es wird auch die Seite Most übergeben des Linkwerts geht an Ihre kanonische URL.
Dieser Vorgang ist langsamer als eine 301-Weiterleitung, daher wäre es vorzuziehen, wenn Sie 301 verwenden. John Mueller von Google erwähnte http://www.seroundtable.com/google-canonical-tag-vs-301-redirect-12611.html
Link zurück zu Ihrer Originalversion
Wenn Sie das oben Genannte nicht tun können, haben Sie wahrscheinlich keine Kontrolle über den „Head“-Bereich Ihrer Website, in dem Inhalte angezeigt werden, und es ist außerdem eine gute Idee, oben oder unten einen Link zu Ihrer Originalseite hinzuzufügen die Seite. Es gibt einige andere Artikel, zu denen Sie einen Link zu Ihrem RSS-Feed hinzufügen möchten. Einige Crawler filtern diese Links möglicherweise heraus, andere bleiben jedoch möglicherweise dort. Wenn Google mehrere Links zählt, die auf Ihren Artikel verweisen, erkennt Google auch schnell, dass es sich um die genaue kanonische Version des Artikels handelt.
Zusammenfassung: Duplicate Content kann und sollte angegangen werden
Duplicate Content kommt überall vor. Ich bin noch nie auf eine Website mit über 1000 Seiten gestoßen, auf der kein einziger doppelter Inhalt vorhanden war. Dies erfordert jederzeit Ihre Aufmerksamkeit. Das ist lösbar und die Belohnungen können großartig sein. Das Ranking Ihrer hochwertigen Content-Seiten kann in die Höhe schnellen, nachdem Sie doppelte Inhalte behoben haben. Natürlich müssen Sie diese Probleme zunächst identifizieren, Ihren Programmierern helfen, Lösungen für die Probleme zu finden und Ihnen sogar bei der Lösung der Probleme helfen.
Autor der Übersetzung: Zhipeng
Artikelquelle: Lightyear Forum ( http://www.gnbase.com/thread-474-1.html )
Englischer Originaltext: http://yoast.com/articles/duplicate-content/
Hinweis: Der Artikel wurde mit Genehmigung von zhipeng, Lightyear Forum, auf der Webmaster-Homepage abgedruckt. Wenn Sie einen Nachdruck benötigen, geben Sie bitte die Quelle und den Link des Artikels an.