Heutzutage gibt es im Internet eine große Vielfalt an Inhalten. Manchmal veröffentlichen Sie etwas, das Sie nicht veröffentlichen sollten – Sie veröffentlichen beispielsweise wütend einen Blog-Beitrag und bereuen ihn später, oder Sie geben versehentlich vertrauliche Daten preis. In den meisten Fällen wird der Inhalt durch einfaches Entfernen oder Einschränken des Zugriffs nicht mehr in den Suchergebnissen angezeigt. Wenn Sie jedoch unbedingt einige unerwünschte Inhalte entfernen möchten, die bereits von Google indiziert sind, können Sie unser URL-Entfernungstool verwenden, das Inhalte aus unseren Suchergebnissen entfernt, sofern sie bestimmte Kriterien erfüllen (siehe unten). Wir werden eine Reihe von Blogbeiträgen veröffentlichen, in denen Sie erfahren, wie Sie verschiedene Arten von Inhalten erfolgreich entfernen und häufige Fehler vermeiden. In diesem ersten Blogbeitrag bespreche ich einige grundlegende Szenarien: Löschen einer einzelnen URL, Löschen eines gesamten Verzeichnisses oder einer gesamten Website und erneutes Hinzufügen gelöschter Inhalte.
Löschen Sie eine einzelne URL
Damit ein Entfernungsantrag erfolgreich sein kann, muss im Allgemeinen der Eigentümer der betreffenden URL – ob Sie oder eine andere Person – der Entfernung des Inhalts zustimmen. Für eine einzelne URL gibt es drei Möglichkeiten, die Einwilligung anzuzeigen:
Blockieren Sie Seiten über die robots.txt-Datei, um zu verhindern, dass sie durchsucht werden
Das Blockieren von Seiten über das Noindex-Meta-Tag verhindert, dass sie indiziert werden
Zeigt an, dass die aktuelle Seite nicht existiert, indem der Statuscode 404 oder 410 zurückgegeben wird
Bevor Sie einen Löschantrag stellen, können Sie zunächst prüfen, ob die URL gesperrt wurde:
robots.txt: Verwenden Sie die Funktion „Als Googlebot abrufen“ oder „robots.txt testen“ in den Webmaster-Tools, um zu überprüfen, ob der URL der Zugriff verweigert wurde.
noindex-Meta-Tag: Sie können Fetch as Googlebot verwenden, um sicherzustellen, dass das Meta-Tag zwischen den Tags angezeigt wird. Wenn Sie eine Seite anzeigen möchten, die nicht mit den Webmaster-Tools überprüft werden kann, können Sie die URL in Ihrem Browser öffnen, auf „Ansicht“ > „Webressourcen“ klicken und sicherstellen, dass sich das Meta-Tag zwischen den Tags befindet.
404/410-Statuscodes: Sie können Fetch as Googlebot oder ein Tool wie Live HTTP Headers oder web-sniffer.net verwenden, um zu bestätigen, dass die URL tatsächlich den richtigen Code zurückgibt. Manchmal wird auf einer „gelöschten“ Seite möglicherweise „404“ oder „Seite nicht gefunden“ angezeigt, in der Kopfzeile wird jedoch der Statuscode 200 zurückgegeben. Daher ist es eine gute Idee, dies noch einmal mit einem geeigneten Header-Überprüfungstool zu überprüfen.
Wenn Sie unerwünschte Inhalte von einer Webseite entfernt haben, die Seite jedoch nicht mit den oben genannten Methoden blockiert haben, können Sie die URL immer noch nicht vollständig aus unseren Suchergebnissen entfernen. Dies kommt häufig vor, wenn der Inhalt auf einer Website veröffentlicht wird, die Ihnen nicht gehört. Wie Sie damit umgehen, besprechen wir im zweiten Teil unserer Serie zum Entfernen von URLs.
Wenn eine URL eine der oben genannten Bedingungen erfüllt, können Sie http://www.google.com/webmasters/tools/removals aufrufen, die URL eingeben, die Sie löschen möchten, und zum Entfernen die Option „Webmaster hat diese Seite blockiert“ auswählen Es ist gelöscht. Hinweis: Sie sollten die URL eingeben, die den Inhalt enthält, nicht die URL, unter der Google nach dem Inhalt sucht. Zum Beispiel sollten Sie eingeben
http://www.example.com/embarrassing-stuff.html
statt
http://www.google.com/search ? q=peinlich+Zeug
In diesem Artikel erfahren Sie außerdem, wie Sie sicherstellen, dass Sie die richtige URL eingeben. Denken Sie daran, dass wir Ihre unerwünschten Inhalte nicht entfernen können, wenn Sie uns nicht die genaue URL mitteilen, die Sie stört.
Löschen Sie ein gesamtes Verzeichnis oder eine gesamte Website
Um ein gesamtes Verzeichnis oder eine gesamte Website erfolgreich zu löschen, muss der Zugriff auf das Verzeichnis oder die Website in der robots.txt-Datei der Website verweigert werden. Um beispielsweise das Verzeichnis http://www.example.com/secret/ zu löschen, muss die robots.txt-Datei Folgendes enthalten:
Benutzeragent: *
Nicht zulassen: /geheim/
Das Stammverzeichnis gibt einen 404-Statuscode zurück, aber das reicht nicht aus, denn selbst wenn das Verzeichnis einen 404-Statuscode zurückgibt, ist es immer noch möglich, darunter liegende Dateien anzuzeigen. Durch die Verwendung von robots.txt zum Blockieren eines Verzeichnisses (oder einer gesamten Website) kann sichergestellt werden, dass alle URLs unter dem Verzeichnis (oder der Website) blockiert werden. Mit den Funktionen „Als Googlebot abrufen“ oder „robots.txt testen“ in den Webmaster-Tools können Sie testen, ob das Verzeichnis vollständig blockiert ist.
Nur verifizierte Websitebesitzer können in den Webmaster-Tools die Löschung einer gesamten Website oder eines Verzeichnisses beantragen. Um die Löschung eines Verzeichnisses oder einer Website anzufordern, geben Sie zunächst die entsprechende Website ein und klicken Sie dann auf Website-Konfiguration > Crawler-Zugriff > URL löschen. Wenn Sie sich im Stammverzeichnis der Website befinden und die URL löschen möchten, müssen Sie bestätigen, dass Sie die gesamte Website löschen möchten. Wenn Sie ein Unterverzeichnis eingeben, sollten Sie im Dropdown-Menü die Option „Verzeichnis löschen“ auswählen.
Fügen Sie erneut Inhalte hinzu
Sie können einen Antrag auf Entfernung Ihrer Website jederzeit zurückziehen, auch wenn dieser von anderen gestellt wurde. Dazu müssen Sie in den Webmaster-Tools ein verifizierter Websitebesitzer sein. Sobald Sie verifiziert sind, können Sie zu Site-Konfiguration > Crawler-Zugriff > URL löschen (oder > Von anderen senden) gehen und neben der Anfrage, die Sie stornieren möchten, auf die Schaltfläche „Abbrechen“ klicken.
Sie haben noch Fragen? Seien Sie gespannt auf Updates, während wir unsere Reihe von Blogbeiträgen zum Entfernen von Inhalten aus den Google-Suchergebnissen fortsetzen.