Kwind — это профессиональная система веб-поиска, независимо разработанная Kwindsoft. Она включает в себя передовую технологию интеллектуального анализа и массового поиска данных. Ее ядро состоит из четырех частей: многопоточной системы сбора, системы интеллектуального анализа, системы массивного индексирования и полнотекстового поиска. система. Система использует архитектуру поисковой системы профессионального уровня и поддерживает полнотекстовый поиск больших объемов данных за миллисекунды. Это профессиональный продукт полнотекстового поиска, предназначенный в основном для крупных и средних отраслевых поисковых систем, локальных поисковых систем, специализированных поисковых систем информации и других областей применения, предоставляющий пользователям идеальные решения для приложений полнотекстового поиска больших объемов данных. "
"
Основные улучшения версии 2.2SP4 поисковой системы Kwind: "
Основные улучшения в версии 2.2: Улучшена производительность чтения и записи системы индексирования, увеличена скорость индексации примерно в 10 раз;"
SP4: Исправьте и оптимизируйте некоторые основные программы;"
SP3: Оптимизировать процесс поиска и исправить ошибки программы;"
Улучшение SP2: исправлена проблема низкой скорости извлечения, вызванная ошибкой компонента извлечения, что значительно повышает скорость извлечения;"
Улучшение SP1: увеличить длину хеш-значения, которое может достигать 100 коллекций, полностью просканировать всю веб-страницу веб-сайта и добавить функцию поиска в верхних позициях;;"
"
Функции: "
Многопоточный паутинный паук"
Целевая коллекция веб-страниц"
Автоматическое распознавание многоязычной кодировки веб-страницы»
Дедупликация веб-страницы хэш-таблицы"
Интеллектуальное извлечение текста веб-страницы»
Интеллектуальная сегментация китайских слов на основе тезауруса»
Управление лексикой сегментации китайских слов"
Полнотекстовое извлечение больших объемов данных на миллисекундном уровне»
Технология кэширования"
Веб-снимок"
Расширенный поиск"
Рейтинг ставок"
веб-паук
Веб-пауки используют многопоточность для одновременного сбора веб-страниц в сочетании с эффективными механизмами сбора и стратегическим развертыванием, чтобы максимизировать эффективность сбора веб-страниц. Поддерживает целевой сбор веб-страниц — ключевую технологию для систем вертикального поиска, позволяющую повысить качество и релевантность данных. Пользователи могут настраивать правила сбора для сбора конкретных веб-страниц. Поддерживает сбор нескольких динамических и статических типов веб-страниц, а также автоматическую идентификацию многоязычных кодировок веб-страниц. Он использует технологию дедупликации веб-страниц хеш-таблиц, которая отличается высокой производительностью и низким использованием системы, что позволяет веб-паукам работать эффективно и стабильно. Поддерживает одиночный или пакетный сбор веб-сайтов, автоматический сбор и функции автоматического обновления. "
"
Извлечение текста"
Интеллектуальная технология извлечения текста веб-страницы, ее функция заключается в извлечении основного содержимого темы веб-страницы и фильтрации информации, не связанной с темой веб-страницы (реклама, навигация, авторские права и другая информация, не относящаяся к содержанию веб-страницы). Эта технология эффективно повышает качество сбора и актуальности информации на веб-страницах, интеллектуальную автоматическую идентификацию, точное извлечение текста веб-страницы и точность более 95%. "
"
Сегментация китайских слов"
Интеллектуальная технология сегментации китайских слов, основанная на тезаурусе, поддерживает множество технологий интеллектуального анализа, таких как сегментация китайского и английского языков, преобразование китайских упрощенных и традиционных шрифтов, преобразование полной ширины и половинной ширины, а также распознавание китайских имен. Пользователи могут расширять и поддерживать библиотеку словаря в соответствии с потребностями своего приложения для достижения наилучшего эффекта сегментации слов. "
"
Полнотекстовый поиск"
Он использует архитектуру системы массового индексирования данных и усовершенствованную технологию алгоритма полнотекстового поиска в сочетании с эффективными стратегиями оптимизации поиска для поддержки скорости извлечения больших объемов данных на миллисекундном уровне и одновременного извлечения несколькими пользователями. Расширенный поиск поддерживает настраиваемые методы поиска для удовлетворения различных потребностей пользователей в поиске. Внедрите эффективные стратегии технологии кэширования, чтобы повысить стабильность системы и ее нагрузочную способность, снизить нагрузку на систему, а данные кэша автоматически обновляются в соответствии с конкретными условиями. "
"
Применимые объекты"
Подходит для внутренних групп веб-сайтов или групп веб-сайтов в Интернете, таких как предприятия, государственные учреждения, школы и т. д., для создания поисковых систем в Интернете;
Подходит для групп веб-сайтов в различных отраслях и областях для создания отраслевых поисковых систем в Интернете;
Подходит для местных групп веб-сайтов, таких как провинции, города и районы, для создания локальных поисковых систем в Интернете;