Кеннеди
Кеннеди — поисковая система по космосу Близнецов. Он состоит из сканера, серверной части и сервера приложений Gemini. Кеннеди использует многие методы и архитектуру ранних сканеров WWW и поисковых систем, таких как Mercator, Archive.org и GoogleBot.
Демо
Посетите gemini://kennedy.gemi.dev
с помощью клиента Gemini или через прокси-сервер HTTP-Gemini.
Функции
- Полнотекстовый поиск с Портером Стеммингом
- Предлагаемые запросы. Кеннеди рекомендует другие запросы, если вы не получаете много результатов.
- Сложные поисковые запросы. Например: «кошки И собаки», «(кошки ИЛИ собаки) НЕ птицы».
- Поиск изображений! Кеннеди индексирует текст ссылки и информацию о пути, чтобы обеспечить поиск изображений.
- Классификация языка контента с использованием ngrams вместо MIME-типов параметров
lang=
- Алгоритм на основе PageRank для лучшего определения релевантности результатов
- Чистые фрагменты: результаты поиска включают фрагмент контента, соответствующий вашему запросу. Ваши ключевые слова заключены в квадратные скобки, а форматирование драгоценного текста удалено, чтобы его было удобнее читать.
- Количество строк. Чтобы помочь вам отделить быстрые статьи от более длинного контента, результаты поиска сообщают вам, сколько строк в контенте. Если вы хотите показаться занудным, я также включаю размеры в байтах.
Почему?
Много лет назад великого британского исследователя Джорджа Мэллори, которому предстояло погибнуть на Эвересте, спросили, почему он захотел на него подняться. Он сказал: «Потому что оно есть».
Речь Джона Ф. Кеннеди в Университете Райса, 12 сентября 1962 г.
Проекты
- Kennedy.Crawler — логика сканера (границы URL-адресов, очереди и т. д.)
- Kennedy.CrawlData — Модели и системы хранения документов, метаданных и полнотекстового поиска.
- Kennedy.Server — сервер Gemini для обработки запросов и результатов поиска. Создан на базе RocketForce, сервера и платформы приложений .NET Gemini.
- Kennedy.SearchConsole — консольное приложение для выполнения запросов FTS. Используется для тестирования