Kwind — это профессиональная система веб-поиска, независимо разработанная Kwindsoft. Она включает в себя передовую технологию интеллектуального анализа и массового поиска данных. Ее ядро состоит из четырех частей: многопоточной системы сбора, системы интеллектуального анализа, системы массивного индексирования и полнотекстового поиска. система. Система использует архитектуру поисковой системы профессионального уровня и поддерживает полнотекстовый поиск больших объемов данных за миллисекунды. Это профессиональный продукт полнотекстового поиска, предназначенный в основном для крупных и средних отраслевых поисковых систем, локальных поисковых систем, специализированных поисковых систем информации и других областей применения, предоставляющий пользователям идеальные решения для приложений полнотекстового поиска больших объемов данных.
Основные улучшения версии 2.2SP5 поисковой системы Kwind:
Основные улучшения в версии 2.2: Улучшена производительность чтения и записи системы индексирования, увеличена скорость индексации примерно в 10 раз;
SP5: Исправление и улучшение алгоритма поиска;
SP4: исправление и оптимизация некоторых основных программ;
SP3: Оптимизировать процесс поиска и исправить ошибки программы;
Улучшение SP2: исправлена проблема низкой скорости извлечения, вызванная ошибками компонентов извлечения, что значительно повысило скорость извлечения;
Улучшение SP1: увеличить длину хэш-значения, которая может достигать 100 коллекций, полностью просканировать всю веб-страницу сайта и добавить функцию поиска в верхних позициях;
Функции:
Многопоточный веб-паук
Целевая коллекция веб-страниц
Автоматическое распознавание многоязычного кодирования веб-страниц.
Дедупликация веб-страницы хеш-таблицы
Интеллектуальное извлечение текста веб-страницы
Интеллектуальная сегментация китайских слов на основе тезауруса
Управление словарем сегментации китайских слов
Полнотекстовое извлечение больших объемов данных за миллисекунды
технология кэширования
Снимок веб-страницы
Расширенный поиск
КПП
веб-паук
Веб-пауки используют многопоточность для одновременного сбора веб-страниц в сочетании с эффективными механизмами сбора и стратегическим развертыванием, чтобы максимизировать эффективность сбора веб-страниц. Поддерживает целевой сбор веб-страниц — ключевую технологию для систем вертикального поиска, позволяющую повысить качество и релевантность данных. Пользователи могут настраивать правила сбора для сбора конкретных веб-страниц. Поддерживает сбор нескольких динамических и статических типов веб-страниц, а также автоматическую идентификацию многоязычных кодировок веб-страниц. Он использует технологию дедупликации веб-страниц хеш-таблиц, которая отличается высокой производительностью и низким использованием системы, что позволяет веб-паукам работать эффективно и стабильно. Поддерживает одиночный или пакетный сбор веб-сайтов, автоматический сбор и функции автоматического обновления.
Извлечение текста
Интеллектуальная технология извлечения текста веб-страницы, ее функция заключается в извлечении основного содержимого темы веб-страницы и фильтрации информации, не связанной с темой веб-страницы (реклама, навигация, авторские права и другая информация, не относящаяся к содержанию веб-страницы). Эта технология эффективно повышает качество сбора и актуальности информации на веб-страницах, интеллектуальную автоматическую идентификацию, точное извлечение текста веб-страницы и точность более 95%.
Сегментация китайских слов
Интеллектуальная технология сегментации китайских слов, основанная на тезаурусе, поддерживает множество технологий интеллектуального анализа, таких как сегментация китайского и английского языков, преобразование китайских упрощенных и традиционных шрифтов, преобразование полной ширины и половинной ширины, а также распознавание китайских имен. Пользователи могут расширять и поддерживать библиотеку словаря в соответствии с потребностями своего приложения для достижения наилучшего эффекта сегментации слов.
Полнотекстовый поиск
Он использует архитектуру системы массового индексирования данных и усовершенствованную технологию алгоритма полнотекстового поиска в сочетании с эффективными стратегиями оптимизации поиска для поддержки скорости извлечения больших объемов данных на миллисекундном уровне и одновременного извлечения несколькими пользователями. Расширенный поиск поддерживает настраиваемые методы поиска для удовлетворения различных потребностей пользователей в поиске. Внедрите эффективные стратегии технологии кэширования, чтобы повысить стабильность системы и ее нагрузочную способность, снизить нагрузку на систему, а данные кэша автоматически обновляются в соответствии с конкретными условиями.
Применимые объекты
Подходит для внутренних групп веб-сайтов или групп веб-сайтов в Интернете, таких как предприятия, государственные учреждения, школы и т. д., для создания поисковых систем в Интернете;
Подходит для групп веб-сайтов в различных отраслях и областях для создания отраслевых поисковых систем;
Подходит для местных групп веб-сайтов, таких как провинции, города и районы, для создания локальных поисковых систем в Интернете;