1. Agarra
El rastreo es el proceso mediante el cual el robot de Google descubre nuevas páginas web y las actualiza para agregarlas al índice de Google.
Utilizamos muchas computadoras para buscar (o "rastrear") la gran cantidad de páginas de nuestro sitio web. El programa que realiza la tarea de adquisición se llama Googlebot (también conocido como robot o software de recopilación de información). El robot de Google utiliza un algoritmo para rastrear: un programa informático determina qué sitios web rastrear, con qué frecuencia y cuántas páginas recuperar de cada sitio.
El proceso de rastreo de Google se basa en una lista de URL de páginas web, que se forma durante el proceso de rastreo anterior y se amplía continuamente con los datos del mapa del sitio proporcionados por el webmaster. Cuando el robot de Google visita cada sitio web, detecta los enlaces de cada página y los agrega a su lista de páginas para rastrear. Los sitios nuevos, los cambios en los sitios existentes y los enlaces inactivos se registran y utilizan para actualizar el índice de Google.
Google no permite el pago por rastrear su sitio con más frecuencia. Distinguimos entre nuestro negocio de búsqueda y nuestros servicios de AdWords con fines de lucro.
2. Indexación
El robot de Google procesa cada página web que rastrea para compilar en una gran lista indexada todas las palabras que encuentra y las posiciones de esas palabras en cada página. Además, procesamos información en etiquetas y atributos de contenido clave, como etiquetas TITLE o atributos ALT. El robot de Google puede manejar muchos tipos de contenido, pero no todos. Por ejemplo, no podemos procesar el contenido de ciertos archivos Rich Media o páginas web dinámicas.
3. Proporcionar resultados
Cuando un usuario ingresa una consulta, nuestras computadoras buscan en nuestro índice páginas coincidentes y devuelven los resultados que creemos que son más relevantes para la búsqueda del usuario. La relevancia está determinada por más de 200 factores, uno de los cuales es el PageRank de una página web determinada. PageRank es una medida de la importancia de una página para los enlaces entrantes de otras páginas. En pocas palabras, los enlaces individuales de otros sitios que apuntan a páginas de su sitio constituyen el PageRank de su sitio. No todos los enlaces tienen el mismo valor: Google se compromete a mejorar continuamente la experiencia del usuario denunciando enlaces spam y otros comportamientos que pueden afectar negativamente a los resultados de búsqueda. Los enlaces que se asignan en función de la calidad del contenido que proporciona son los mejores enlaces.
Para que su sitio tenga una buena clasificación en las páginas de resultados de búsqueda, es importante asegurarse de que Google esté rastreando e indexando su sitio correctamente. Nuestras Directrices para webmasters describen algunas de las mejores prácticas que pueden ayudarle a evitar problemas comunes y mejorar la clasificación de su sitio.
Las funciones de búsqueda relacionada, sugerencias ortográficas y sugerencias de Google de Google están diseñadas para ayudar a los usuarios a ahorrar tiempo de búsqueda al mostrar términos relacionados, errores ortográficos comunes y consultas comunes. De manera similar a nuestros resultados de búsqueda de google.com, las palabras clave utilizadas en estas funciones son generadas automáticamente por nuestros rastreadores web y algoritmos de búsqueda. Solo mostramos estas sugerencias si creemos que ahorrarán tiempo al usuario. Si un sitio tiene una clasificación más alta para una determinada palabra clave, es porque hemos determinado algorítmicamente que su contenido es más relevante para la consulta del usuario.