1. Greifen
Beim Crawlen handelt es sich um den Prozess, bei dem der Googlebot neue Webseiten entdeckt und aktualisiert, um die Webseiten zum Google-Index hinzuzufügen.
Wir verwenden viele Computer, um die große Anzahl an Seiten unserer Website abzurufen (oder zu „crawlen“). Das Programm, das die Erfassungsaufgabe ausführt, heißt Googlebot (auch bekannt als Roboter oder Informationserfassungssoftware). Googlebot verwendet zum Crawlen einen Algorithmus: Ein Computerprogramm bestimmt, welche Websites wie oft gecrawlt werden und wie viele Seiten von jeder Website abgerufen werden sollen.
Der Crawling-Prozess von Google basiert auf einer Liste von Webseiten-URLs, die während des vorherigen Crawling-Prozesses erstellt und kontinuierlich mit vom Webmaster bereitgestellten Sitemap-Daten erweitert wird. Wenn der Googlebot jede Website besucht, erkennt er die Links auf jeder Seite und fügt sie seiner Liste der zu crawlenden Seiten hinzu. Neue Websites, Änderungen an bestehenden Websites und tote Links werden protokolliert und zur Aktualisierung des Google-Index verwendet.
Google erlaubt keine Bezahlung für häufigeres Crawlen Ihrer Website. Wir unterscheiden zwischen unserem Suchgeschäft und unseren gewinnorientierten AdWords-Diensten.
2. Indizierung
Der Googlebot verarbeitet jede gecrawlte Webseite, sodass er alle gefundenen Wörter und die Positionen dieser Wörter auf jeder Seite in einer großen indizierten Liste zusammenstellt. Darüber hinaus verarbeiten wir Informationen in wichtigen Inhalts-Tags und -Attributen, wie z. B. TITLE-Tags oder ALT-Attributen. Der Googlebot kann viele Arten von Inhalten verarbeiten, aber nicht alle. Beispielsweise können wir den Inhalt bestimmter Rich Media-Dateien oder dynamischer Webseiten nicht verarbeiten.
3. Ergebnisse liefern
Wenn ein Benutzer eine Suchanfrage eingibt, durchsuchen unsere Computer unseren Index nach passenden Seiten und geben Ergebnisse zurück, die unserer Meinung nach für die Suche des Benutzers am relevantesten sind. Die Relevanz wird durch mehr als 200 Faktoren bestimmt, darunter der PageRank einer bestimmten Webseite. Der PageRank ist ein Maß dafür, wie wichtig eine Seite für eingehende Links von anderen Seiten ist. Einfach ausgedrückt bilden einzelne Links von anderen Websites, die auf Seiten Ihrer Website verweisen, den PageRank Ihrer Website. Nicht alle Links sind gleichwertig: Google ist bestrebt, das Nutzererlebnis kontinuierlich zu verbessern, indem es auf Link-Spam und anderes Verhalten hinweist, das sich negativ auf die Suchergebnisse auswirken kann. Links, die auf der Grundlage der Qualität der von Ihnen bereitgestellten Inhalte zugewiesen werden, sind die besten Links.
Damit Ihre Website auf den Suchergebnisseiten gut rankt, ist es wichtig sicherzustellen, dass Google Ihre Website korrekt crawlt und indiziert. In unseren Webmaster-Richtlinien finden Sie einige Best Practices, die Ihnen helfen können, häufige Probleme zu vermeiden und das Ranking Ihrer Website zu verbessern.
Die Funktionen „Ähnliche Suche“, „Rechtschreibvorschläge“ und „Google-Vorschläge“ von Google sollen Nutzern dabei helfen, Zeit bei der Suche zu sparen, indem verwandte Begriffe, häufige Rechtschreibfehler und häufige Suchanfragen angezeigt werden. Ähnlich wie bei unseren google.com-Suchergebnissen werden die in diesen Funktionen verwendeten Schlüsselwörter automatisch von unseren Webcrawlern und Suchalgorithmen generiert. Wir zeigen diese Vorschläge nur an, wenn wir glauben, dass sie dem Benutzer Zeit sparen. Wenn eine Website für ein bestimmtes Schlüsselwort einen höheren Rang einnimmt, liegt das daran, dass wir mithilfe eines Algorithmus ermittelt haben, dass ihr Inhalt für die Suchanfrage des Benutzers relevanter ist.