En respuesta a las opiniones de la mayoría de los usuarios, hemos mejorado este producto y hemos lanzado una "Edición personal" para uso gratuito, lo que le permitirá experimentar mejor el producto.
V1.1 se ha mejorado para incluir clasificaciones de búsqueda, códigos de búsqueda, administración de directorios de índice, configuraciones de peso de páginas web y otras funciones para mejorar la recuperación y aumentar la velocidad de búsqueda.
Introducción al sistema
K-PageSearch es un motor de búsqueda web desarrollado independientemente por Kwindsoft en 2007 y diseñado específicamente para la recuperación de información industrial y especializada. Principales características funcionales: araña web, colección direccional, extracción de texto, segmentación de palabras chinas, índice de texto completo, clasificación de relevancia, instantánea de la página web, búsqueda relacionada, clasificación de ofertas, la base de datos backend utiliza Microsoft SQL Server y el diseño del sistema de búsqueda estática utiliza; Búsqueda de caché en isla de datos XML Como resultado, se mejoran la estabilidad y el rendimiento del sistema, se ahorran recursos del servidor y se reduce la carga del sistema.
araña web
El componente K-wind spider incluye tres módulos funcionales principales: recopilación de enlaces, análisis de páginas web y escaneo de páginas web no válidas;
Identifique automáticamente codificaciones de páginas web como GB2312, BIG5, UTF-8 y Unicode;
La verificación del tipo de archivo impide la recopilación de archivos que no sean de texto;
K-wind spider puede recopilar datos dinámicos de páginas web como ASP, PHP, JSP, etc. y páginas web estáticas como HTML, SHTML, XHTML, etc.;
Admite la función de reanudar la recopilación. Si la recopilación finaliza debido a fallas del sistema, la red, etc., el sistema le preguntará si desea "continuar la recopilación" o "finalizar la tarea" la próxima vez.
La función de gestión de tareas de recopilación puede configurar múltiples tareas de recopilación para programar el trabajo, y cada tarea de recopilación se ejecutará en secuencia;
Colección direccional
Especificar la colección de páginas web específicas y recopilar páginas web de información especializada es una tecnología clave para que los motores de búsqueda verticales mejoren la calidad y relevancia del contenido.
El enlace contiene palabras clave: palabras clave que deben incluirse en el enlace, por ejemplo: descargar|mp3|soft puede utilizar "|" para separar las palabras clave que contienen;
Enlace de palabras clave excluidas: palabras clave no incluidas en el enlace, por ejemplo: descargar|mp3|soft puede utilizar "|" para separar varias palabras clave excluidas;
La página web contiene palabras clave: palabras clave que deben incluirse en la página web, por ejemplo: estilo K | página web | puede utilizar "|" para separar las palabras clave que contienen;
Palabras clave excluidas de la página web: palabras clave que no están incluidas en la página web; por ejemplo: estilo K | página web | puede utilizar "|" para separar varias palabras clave excluidas;
Extracción de texto
El componente de extracción de texto desarrollado independientemente por Kwindsoft se utiliza para extraer el contenido del tema central de una página web y filtrar información no relacionada con el tema de la página web (publicidad, navegación, columnas y otra información de contenido de texto que no sea de la página web). Esta tecnología garantiza eficazmente la calidad de la recopilación de información de las páginas web, mejora la relevancia de la recuperación, identifica de forma inteligente y extrae con precisión el texto de las páginas web, y la precisión de la extracción e identificación del contenido de las páginas web alcanza más del 80%.
Segmentación de palabras chinas
El componente de segmentación de palabras chinas desarrollado independientemente por Kwindsoft puede reconocer palabras chinas e inglesas. Con función especial de filtrado de símbolos.
Texto original de demostración del efecto de segmentación de palabras: ¡Kwindsoft Search World! K-PageSearch★ Un motor de búsqueda web diseñado específicamente para la recuperación de información industrial y especializada. Principales características funcionales: araña web, recopilación direccional, extracción de texto, segmentación de palabras chinas, índice de texto completo, clasificación de relevancia, instantánea de la página web, búsqueda relacionada, clasificación de ofertas, la base de datos en segundo plano utiliza Microsoft SQL Server, diseño de sistema de búsqueda estática Utilice datos XML; Island para almacenar en caché los resultados de búsqueda para mejorar la estabilidad y el rendimiento del sistema, ahorrar recursos del servidor y reducir la carga del sistema.
Segmentación de palabras: Kwindsoft Search World KPageSearch es un motor de búsqueda web diseñado específicamente para la recuperación de información específica de la industria Funciones y características principales: recopilación direccional de arañas web, extracción de texto, segmentación de palabras en chino, indexación de texto completo, clasificación por relevancia, instantáneas web, relacionadas. búsquedas, clasificaciones de ofertas, base de datos en segundo plano utilizando el sistema de búsqueda estática de Microsoft SQL Server Diseñado para utilizar islas de datos XML para almacenar en caché los resultados de búsqueda para mejorar la estabilidad y el rendimiento del sistema, ahorrar recursos del servidor y reducir la carga del sistema
Índice de texto completo
La indexación de texto completo es una de las tecnologías clave de los motores de búsqueda actuales. Este sistema utiliza el motor de texto completo de Microsoft SQL Server. La indexación de texto completo permite una recuperación potente y rápida al indexar cada palabra en una base de datos específica.
Clasificación por relevancia
El sistema determina la clasificación de los resultados basándose en cálculos de relevancia y los clasifica según el peso de las palabras clave y la frecuencia de aparición para que los resultados de la búsqueda sean más precisos.
Instantánea de la página web
¿Qué debo hacer si un resultado de búsqueda no se abre o se abre lentamente? "Web Snapshot" puede ayudarle a resolver el problema. Las instantáneas de la página web se almacenan en el servidor en formato de texto. Si la página web original ha sido modificada, eliminada o bloqueada, también podemos utilizar la función "instantánea de la página web" para explorar el contenido de la página web original. Las instantáneas de páginas web requieren una gran cantidad de espacio de almacenamiento. Puede configurar la función de instantáneas de páginas web para que se active o desactive. Cuando esté apagada, el sistema no guardará instantáneas de páginas web.
Búsquedas relacionadas
Las búsquedas relacionadas se refieren a palabras clave que son similares y similares a las palabras clave de búsqueda. Estas palabras clave de búsqueda relacionadas se calculan en función de los registros de palabras clave utilizados por todos los usuarios en el pasado. Cuando las palabras clave buscadas por el usuario cumplen con las condiciones, el sistema las registrará automáticamente y realizará estadísticas. Puede hacer clic en "Más búsquedas relacionadas" para ver las estadísticas de búsqueda de las palabras clave. Las búsquedas relacionadas le ayudan a encontrar resultados más valiosos con mayor rapidez.
PPC
Un sistema de clasificación de ofertas profesional conveniente y práctico que puede ofertar y clasificar las clasificaciones del sitio web, las recomendaciones del lado derecho y la información de clic electrónico enviada por los miembros. Cuanto mayor sea la oferta, mayor será la clasificación. Después del registro, los miembros pueden autogestionar las ofertas. información en una sola parada. Modelo de facturación razonable: el mismo cliente IP hace clic en la misma información de oferta varias veces en el mismo día y solo se le factura una vez. El sistema puede establecer la cantidad mínima de recarga y consumo de clics de IP, y los miembros pueden recargar sus cuentas en línea en tiempo real por sí mismos o el administrador del sistema puede hacerlo en su nombre.
Interfaz del software (haga clic en la imagen para verla más grande):