La coincidencia de archivos y la selección inicial de subconjuntos son dos aspectos muy importantes en el proceso de clasificación de los motores de búsqueda. Hoy les daré algunos resúmenes básicos sobre estos dos aspectos. Aunque esto parece no tener nada que ver con nosotros, todos deberían aprender más sobre algunos principios básicos, que tendrán cierta importancia rectora para la futura construcción y optimización de sitios web. Por supuesto, estos son solo algunos de mis propios resúmenes. , Espero que por favor haga correcciones.
Después de que el motor de búsqueda pasa por las primeras etapas de preprocesamiento, lo que obtiene es un conjunto de palabras clave en unidades de palabras. Antes de esto, el motor de búsqueda primero obtenía un archivo correspondiente a varias palabras clave, pero la eficiencia de la consulta era demasiado baja y poco realista, por lo que el motor de búsqueda asignaba estos archivos de forma inversa y el resultado era una palabra clave correspondiente a un documento de varias palabras clave. De esta manera, cuando el usuario busca una determinada palabra clave, se realizan cálculos y coincidencias en todos los archivos correspondientes a la palabra clave y se devuelven al usuario los mejores resultados de búsqueda. Luego de comprender este proceso general, comencemos a compartir los dos aspectos principales de hoy.
La primera es la coincidencia de archivos: las arañas de los motores de búsqueda rastrean y capturan todo el tiempo, y constantemente clasifican, resumen y almacenan los datos capturados. Estos procesos no se realizan cuando el usuario busca, sino que se procesan previamente antes y después de la búsqueda. Cuando el usuario busca una determinada palabra clave, el motor de búsqueda solo busca en su propia base de datos, en lugar de buscar en Internet en tiempo real. en todos los sitios web. Para expresarlo más claramente te lo explicaré con un sencillo diagrama:
Esta imagen es una tabla típica de archivos de coincidencia rápida de índice invertido. Cuando el usuario busca "palabra clave 1, palabra clave 16", el motor de búsqueda realizará cálculos simples y coincidencias en todos los archivos correspondientes a estas dos palabras y encontrará los archivos que contienen la palabra clave 1. también contiene todas las páginas de la palabra clave 16.
El segundo es la selección inicial de subconjuntos: el subconjunto debe satisfacer las necesidades de los usuarios más rápidamente. El motor de búsqueda debe seleccionar entre todas las páginas relevantes y solo calcula las páginas con un peso ligeramente mayor y las devuelve al usuario. A menudo se le conoce como el subconjunto inicial de filtrado. Puede imaginar que cuando buscamos una determinada palabra clave, la cantidad de páginas que contienen esa palabra clave suele ser enorme, incluso cientos de miles o millones. Si un motor de búsqueda coincide con una cantidad tan grande de datos, obviamente tomará más tiempo. Para satisfacer mejor las necesidades de los usuarios, en la práctica los motores de búsqueda solo seleccionarán páginas con un peso alto para que coincidan, pero qué tipo de páginas tienen un alto. peso?, para cumplir con las condiciones de los motores de búsqueda? Esto incluye la influencia de muchos aspectos del contenido y elementos relacionados con la página, tanto factores externos como internos. Este tema no es el tema central del resumen de este artículo. Lo compartiré con ustedes lentamente en artículos futuros.
Por lo general, cuando buscamos, es imposible ver todos los resultados de la búsqueda uno por uno. Generalmente, solo miramos las primeras páginas o incluso las primeras. Aunque el motor de búsqueda arroja muchos resultados relacionados, estos resultados son los mismos. Todavía está calificado en Internet como una pequeña parte de muchas páginas web. Por lo tanto, los hábitos de búsqueda de los usuarios están cambiando y los motores de búsqueda también enfrentan grandes desafíos. Cómo ayudar mejor a los usuarios a buscar la información que necesitan es siempre lo que los motores de búsqueda. estamos tratando de hacer.
En este punto, he compartido con ustedes algunos principios básicos de los motores de búsqueda a través de la comparación de archivos y la selección inicial de subconjuntos. Por supuesto, hay muchas más cosas que deben involucrarse técnicamente y todos los aspectos a considerar son más completos y complejos. Estos son solo los principios generales que he resumido para todos. Al comprender todos los aspectos de los motores de búsqueda, puede desempeñar un cierto papel rector en la construcción de nuestro sitio web y la optimización de los motores de búsqueda.
Bien, eso es todo por este artículo. Continuaré resumiéndolo y compartiéndolo con ustedes en el futuro. Este artículo proviene de: Beijing SEO, sitio web: http://www.seostudy.org/ , conserve los derechos de autor para la reimpresión, ¡gracias!
Gracias a Beijing SEO por su contribución.