K-PageSearch — это профессиональная система веб-поиска, независимо разработанная Kwindsoft. Она включает в себя передовую технологию интеллектуального анализа и массового поиска данных. Ее ядро состоит из четырех частей: многопоточной системы сбора, системы интеллектуального анализа, системы массивной индексации и полнофункциональной системы. текстовая поисковая система. Система использует архитектуру поисковой системы профессионального уровня и поддерживает полнотекстовый поиск больших объемов данных за миллисекунды. Это профессиональный продукт полнотекстового поиска, предназначенный в основном для крупных и средних отраслевых поисковых систем, локальных поисковых систем, специализированных поисковых систем информации и других областей применения, предоставляющий пользователям идеальные решения для приложений полнотекстового поиска больших объемов данных.
Основные улучшения в версии 2.2: Улучшена производительность чтения и записи системы индексирования, что увеличивает скорость индексации примерно в 10 раз;
Улучшение SP2: исправлена проблема низкой скорости извлечения, вызванная ошибками компонентов извлечения, что значительно повысило скорость извлечения;
Улучшение SP1: увеличить длину хеш-значения, добиться 100% сбора, полностью просканировать всю веб-страницу сайта и добавить функцию поиска в верхних позициях;
Функции
Многопоточный веб-паук
Целевая коллекция веб-страниц
Автоматическое распознавание многоязычного кодирования веб-страниц.
Дедупликация веб-страницы хеш-таблицы
Интеллектуальное извлечение текста веб-страницы
Интеллектуальная сегментация китайских слов на основе тезауруса
Управление словарем сегментации китайских слов
Полнотекстовое извлечение больших объемов данных за миллисекунды
технология кэширования
Снимок веб-страницы
Расширенный поиск
КПП
веб-паук