1. Agarre
O rastreamento é o processo pelo qual o Googlebot descobre novas páginas da web e as atualiza para adicioná-las ao índice do Google.
Usamos muitos computadores para buscar (ou "rastrear") o grande número de páginas do nosso site. O programa que realiza a tarefa de aquisição é denominado Googlebot (também conhecido como robô ou software de coleta de informações). O Googlebot usa um algoritmo para rastrear: um programa de computador determina quais sites rastrear, com que frequência e quantas páginas buscar em cada site.
O processo de rastreamento do Google é baseado em uma lista de URLs de páginas da web, que é formada durante o processo de rastreamento anterior e é continuamente expandida com dados do Sitemap fornecidos pelo webmaster. À medida que o Googlebot visita cada site, ele detecta os links de cada página e os adiciona à lista de páginas a serem rastreadas. Novos sites, alterações em sites existentes e links inativos são registrados e usados para atualizar o índice do Google.
O Google não permite pagamento para rastrear seu site com mais frequência. Distinguimos entre o nosso negócio de pesquisa e os nossos serviços AdWords com fins lucrativos.
2. Indexação
O Googlebot processa cada página da web que rastreia para compilar em uma grande lista indexada todas as palavras que encontra e as posições dessas palavras em cada página. Além disso, processamos informações em tags e atributos de conteúdo chave, como tags TITLE ou atributos ALT. O Googlebot pode lidar com muitos tipos de conteúdo, mas não todos. Por exemplo, não conseguimos processar o conteúdo de determinados arquivos Rich Media ou páginas dinâmicas da Web.
3. Forneça resultados
Quando um usuário insere uma consulta, nossos computadores pesquisam em nosso índice páginas correspondentes e retornam resultados que acreditamos serem mais relevantes para a pesquisa do usuário. A relevância é determinada por mais de 200 fatores, um dos quais é o PageRank de uma determinada página web. PageRank é uma medida da importância de uma página para links recebidos de outras páginas. Simplificando, links individuais de outros sites que apontam para páginas do seu site constituem o PageRank do seu site. Nem todos os links têm o mesmo valor: o Google está empenhado em melhorar continuamente a experiência do usuário, denunciando spam de links e outros comportamentos que podem impactar negativamente os resultados da pesquisa. Os links atribuídos com base na qualidade do conteúdo que você fornece são os melhores links.
Para que seu site tenha uma boa classificação nas páginas de resultados de pesquisa, é importante garantir que o Google esteja rastreando e indexando seu site corretamente. Nossas Diretrizes para webmasters descrevem algumas práticas recomendadas que podem ajudar você a evitar problemas comuns e melhorar a classificação do seu site.
Os recursos de pesquisa relacionada, sugestões ortográficas e sugestões do Google foram projetados para ajudar os usuários a economizar tempo pesquisando, mostrando termos relacionados, erros ortográficos e consultas comuns. Semelhante aos nossos resultados de pesquisa no google.com, as palavras-chave usadas nesses recursos são geradas automaticamente pelos nossos rastreadores da web e algoritmos de pesquisa. Somente exibimos essas sugestões se acharmos que elas economizarão o tempo do usuário. Se um site tiver uma classificação mais elevada para uma determinada palavra-chave, é porque determinamos algoritmicamente que seu conteúdo é mais relevante para a consulta do usuário.