En réponse aux opinions de la majorité des utilisateurs, nous avons amélioré ce produit et publié une « édition personnelle » pour une utilisation gratuite, vous permettant de mieux expérimenter le produit.
La V1.1 a été améliorée pour inclure les classements de recherche, les codes de recherche, la gestion du répertoire d'index, les paramètres de poids des pages Web et d'autres fonctions pour améliorer la récupération et augmenter la vitesse de recherche.
Présentation du système
K-PageSearch est un moteur de recherche Web développé indépendamment par Kwindsoft en 2007 et conçu spécifiquement pour la recherche d'informations industrielles et spécialisées. Principales fonctionnalités fonctionnelles : araignée Web, collecte directionnelle, extraction de texte, segmentation de mots chinois, index de texte intégral, classement par pertinence, instantané de page Web, recherche associée, classement des enchères, la base de données principale utilise Microsoft SQL Server et la conception du système de recherche statique utilise ; Recherche de cache d'îlot de données XML En conséquence, la stabilité et les performances du système sont améliorées, les ressources du serveur sont économisées et la charge du système est réduite.
toile d'araignée
Le composant K-wind spider comprend trois modules fonctionnels principaux : la collecte de liens, l'analyse de pages Web et l'analyse de pages Web invalides ;
Identifiez automatiquement les encodages de pages Web tels que GB2312, BIG5, UTF-8 et Unicode ;
La vérification du type de fichier empêche la collecte de fichiers de type non texte ;
K-wind spider peut collecter des pages Web de données dynamiques telles que ASP, PHP, JSP, etc. et des pages Web statiques telles que HTML, SHTML, XHTML, etc.
Prend en charge la fonction de reprise de la collecte. Si la collecte est interrompue en raison de pannes du système, du réseau, etc., le système vous demandera si vous devez « continuer la collecte » ou « terminer la tâche » lors du prochain démarrage de la collecte.
La fonction de gestion des tâches de collecte peut configurer plusieurs tâches de collecte pour planifier le travail, et chaque tâche de collecte sera exécutée dans l'ordre ;
Collection directionnelle
Spécifier la collection de pages Web spécifiques et collecter des pages Web d'informations spécialisées est une technologie clé pour les moteurs de recherche verticaux afin d'améliorer la qualité et la pertinence du contenu.
Le lien contient des mots-clés : mots-clés qui doivent être inclus dans le lien ; par exemple : download|mp3|soft, vous pouvez utiliser "|" pour séparer plusieurs mots-clés contenant ;
Mots-clés exclus du lien : mots-clés non inclus dans le lien ; par exemple : download|mp3|soft, vous pouvez utiliser "|" pour séparer plusieurs mots-clés exclus ;
La page Web contient des mots-clés : mots-clés qui doivent être inclus dans la page Web ; par exemple : recherche de style K |
Mots-clés exclus de la page Web : mots-clés non inclus dans la page Web ; par exemple : recherche de page Web de style K, vous pouvez utiliser « | » pour séparer plusieurs mots-clés exclus ;
Extraction de texte
Le composant d'extraction de texte développé indépendamment par Kwindsoft est utilisé pour extraire le contenu du thème central d'une page Web et filtrer les informations sans rapport avec le thème de la page Web (publicité, navigation, colonnes et autres informations sur le contenu textuel non lié à la page Web). Cette technologie garantit efficacement la qualité de la collecte d'informations sur les pages Web, améliore la pertinence de la récupération, identifie intelligemment et extrait avec précision le texte des pages Web, et la précision de l'extraction et de l'identification du contenu des pages Web atteint plus de 80 %.
Segmentation des mots chinois
Le composant de segmentation de mots chinois développé indépendamment par Kwindsoft peut reconnaître les mots chinois et anglais. Avec fonction spéciale de filtrage des symboles.
Texte original de démonstration de l'effet de segmentation de mots : Kwindsoft Search World ! K-PageSearch★ Un moteur de recherche Web conçu spécifiquement pour l'industrie et la recherche d'informations spécialisées. Principales fonctionnalités fonctionnelles : araignée Web, collecte directionnelle, extraction de texte, segmentation de mots chinois, index de texte intégral, classement par pertinence, instantané de page Web, recherche associée, classement des enchères ; la base de données en arrière-plan utilise Microsoft SQL Server, conception du système de recherche statique Utiliser des données XML ; island pour mettre en cache les résultats de recherche afin d'améliorer la stabilité et les performances du système, d'économiser les ressources du serveur et de réduire la charge du système.
Segmentation de mots : Kwindsoft Search World KPageSearch est un moteur de recherche Web conçu spécifiquement pour la récupération d'informations spécifiques à un secteur. Principales fonctions et caractéristiques : collecte directionnelle de Web Spiders, extraction de texte, segmentation de mots chinois, indexation de texte intégral, tri par pertinence, instantanés Web, etc. recherches, classements des enchères, base de données d'arrière-plan utilisant le système de recherche statique Microsoft SQL Server Conçu pour utiliser des îlots de données XML pour mettre en cache les résultats de recherche afin d'améliorer la stabilité et les performances du système, d'économiser les ressources du serveur et de réduire la charge du système
Index du texte intégral
L'indexation de texte intégral est l'une des technologies clés des moteurs de recherche actuels. Ce système utilise le moteur de texte intégral Microsoft SQL Server. L'indexation de texte intégral permet une récupération puissante et rapide en indexant chaque mot dans une base de données spécifiée.
Tri par pertinence
Le système détermine le classement des résultats sur la base de calculs de pertinence et les trie en fonction du poids des mots clés et de la fréquence d'occurrence pour rendre les résultats de recherche plus précis.
Instantané de page Web
Que dois-je faire si un résultat de recherche ne s’ouvre pas ou s’ouvre lentement ? "Web Snapshot" peut vous aider à résoudre le problème. Les instantanés de page Web sont stockés sur le serveur au format texte. Si la page Web d'origine a été modifiée, supprimée ou bloquée, nous pouvons également utiliser la fonction « instantané de page Web » pour parcourir le contenu de la page Web d'origine. Les instantanés de page Web nécessitent une grande quantité d'espace de stockage. Vous pouvez activer ou désactiver la fonction d'instantané de page Web. Lorsqu'elle est désactivée, le système n'enregistrera pas d'instantanés de page Web.
Recherches associées
Les recherches associées font référence à des mots-clés similaires et similaires aux mots-clés de recherche. Ces mots-clés de recherche associés sont calculés sur la base des enregistrements de mots-clés utilisés par tous les utilisateurs dans le passé. Lorsque les mots-clés recherchés par l'utilisateur remplissent les conditions, le système les enregistrera automatiquement et établira des statistiques. Vous pouvez cliquer sur « Plus de recherches associées » pour afficher les statistiques de recherche des mots-clés. Les recherches associées vous aident à trouver plus rapidement des résultats plus intéressants.
PPC
Un système de classement des enchères professionnel pratique qui peut soumissionner et classer les classements du site Web, les recommandations du côté droit et les informations de clic électronique soumises par les membres. Plus l'enchère est élevée, plus le classement est élevé. Après l'inscription, les membres peuvent gérer eux-mêmes les enchères. informations en un seul arrêt. Modèle de facturation raisonnable, le même client IP clique plusieurs fois sur les mêmes informations d'enchères dans la même journée et n'est facturé qu'une seule fois. Le système peut définir le montant minimum de recharge et de consommation de clics IP, et les membres peuvent recharger leurs comptes en ligne en temps réel par eux-mêmes ou l'administrateur système peut le faire en leur nom.
Interface du logiciel (cliquez sur l'image pour l'agrandir) :