Kennedy
Kennedy est un moteur de recherche pour l'espace Gemini. Il se compose d'un robot d'exploration, d'un backend et d'un serveur d'applications Gemini. Kennedy exploite de nombreuses techniques et architectures des premiers robots d'exploration et moteurs de recherche du Web tels que Mercator, Archive.org et GoogleBot.
Démo
Visitez gemini://kennedy.gemi.dev
avec un client Gemini ou via un proxy HTTP vers Gemini
Caractéristiques
- Recherche en texte intégral, avec Porter Stemming
- Requêtes suggérées. Kennedy recommande d'autres requêtes si vous n'obtenez pas beaucoup de résultats
- Requêtes de recherche complexes. Par exemple : "chats ET chiens", "(chats OU chiens) PAS d'oiseaux".
- Recherche d'images ! Kennedy indexe le texte des liens et les informations sur le chemin pour permettre la recherche d'images.
- Classification du langage de contenu à l'aide de ngrammes au lieu de types MIME
lang=
paramètres - Algorithme dérivé du PageRank pour mieux déterminer la pertinence des résultats
- Clean Snippets : les résultats de la recherche incluent un extrait de contenu qui correspond à votre requête. Vos mots-clés sont [entourés] de crochets et le formatage gemtext est supprimé pour le rendre plus propre à lire.
- Nombre de lignes : pour vous aider à trier les articles rapides à partir d'un contenu plus long, les résultats de recherche vous indiquent le nombre de lignes contenues dans le contenu. Si vous voulez être ringard, j'inclus également la taille des octets.
Pourquoi?
Il y a de nombreuses années, on a demandé au grand explorateur britannique George Mallory, qui devait mourir sur le mont Everest, pourquoi il voulait l'escalader. Il a répondu : « Parce que c'est là. »
Discours de John F. Kennedy à l'Université Rice, 12 septembre 1962
Projets
- Kennedy.Crawler - Logique du robot (frontières d'URL, files d'attente, etc.)
- Kennedy.CrawlData - Modèles et systèmes de stockage pour les documents, les métadonnées et la recherche en texte intégral
- Kennedy.Server - Gemini Server pour gérer les requêtes et les résultats de recherche. Construit sur RocketForce, un serveur et un cadre d'application .NET Gemini
- Kennedy.SearchConsole - Application console pour exécuter des requêtes FTS. Utilisé pour les tests