K-PageSearch est un système de moteur de recherche Web professionnel développé indépendamment par Kwindsoft. Il dispose d'une technologie avancée d'analyse intelligente et de récupération de données massives. Son noyau se compose de quatre parties : un système de collecte multithread, un système d'analyse intelligent, un système d'indexation massive et un système d'indexation complet. système de récupération de texte. Le système adopte une architecture de moteur de recherche de niveau professionnel et prend en charge la récupération de texte intégral au niveau de la milliseconde de données massives. Il s'agit d'un produit professionnel de récupération de texte intégral conçu principalement pour les moteurs de recherche industriels de grande et moyenne taille, les moteurs de recherche locaux, les moteurs de recherche d'informations spécialisés et d'autres domaines d'application, offrant aux utilisateurs des solutions idéales pour les applications de récupération de texte intégral de données massives.
Principales améliorations de la V2.2 : Amélioration des performances de lecture et d'écriture du système d'indexation, augmentant la vitesse d'indexation d'environ 10 fois ;
Amélioration SP2 : correction du problème de vitesse de récupération lente causé par des erreurs de composants de récupération, améliorant considérablement la vitesse de récupération ;
Amélioration SP1 : augmentez la longueur de la valeur de hachage, obtenez essentiellement une collecte à 100 %, explorez entièrement la page Web du site et ajoutez la fonction de recherche dans les meilleurs classements ;
Caractéristiques
Araignée Web multithread
Collecte ciblée de pages Web
Reconnaissance automatique du codage de pages Web multilingues
Déduplication de pages Web par table de hachage
Extraction intelligente de texte de page Web
Segmentation intelligente des mots chinois basée sur un thésaurus
Gestion du dictionnaire de segmentation de mots chinois
Récupération de texte intégral au niveau de la milliseconde de données massives
technologie de mise en cache
Instantané de page Web
Recherche avancée
PPC
toile d'araignée