Kennedy
Kennedy ist eine Suchmaschine für den Gemini-Raum. Es besteht aus einem Crawler, einem Backend und einem Gemini-App-Server. Kennedy nutzt viele der Techniken und Architekturen früher WWW-Crawler und Suchmaschinen wie Mercator, Archive.org und GoogleBot.
Demo
Besuchen Sie gemini://kennedy.gemi.dev
mit einem Gemini-Client oder über einen HTTP-to-Gemini-Proxy
Merkmale
- Volltextsuche mit Porter Stemming
- Vorgeschlagene Fragen. Kennedy empfiehlt andere Abfragen, wenn Sie nicht viele Ergebnisse erhalten
- Komplexe Suchanfragen. Zum Beispiel: „Katzen UND Hunde“, „(Katzen ODER Hunde) KEINE Vögel“.
- Bildsuche! Kennedy indiziert Linktext und Pfadinformationen, um die Suche nach Bildern zu ermöglichen.
- Klassifizierung der Inhaltssprache mithilfe von Ngrams anstelle von MIME-Typen
lang=
-Parametern - Vom PageRank abgeleiteter Algorithmus zur besseren Bestimmung der Ergebnisrelevanz
- Saubere Snippets: Die Suchergebnisse enthalten einen Inhaltsausschnitt, der Ihrer Suchanfrage entspricht. Ihre Schlüsselwörter sind in Klammern [umgeben] und die Gemtext-Formatierung wurde entfernt, um die Lesbarkeit zu verbessern.
- Anzahl der Zeilen: Damit Sie schnelle Artikel aus längeren Inhalten sortieren können, erfahren Sie in den Suchergebnissen, wie viele Zeilen der Inhalt enthält. Wenn Sie nerdig sein möchten, füge ich auch Bytegrößen hinzu.
Warum?
Vor vielen Jahren wurde der große britische Entdecker George Mallory, der auf dem Mount Everest sterben sollte, gefragt, warum er ihn besteigen wollte. Er sagte: „Weil es da ist.“
Ansprache von John F. Kennedy an der Rice University, 12. September 1962
Projekte
- Kennedy.Crawler – Crawler-Logik (URL-Grenzen, Warteschlangen usw.)
- Kennedy.CrawlData – Modelle und Speichersysteme für Dokumente, Metadaten und Volltextsuche
- Kennedy.Server – Gemini-Server zur Verarbeitung von Abfragen und Suchergebnissen. Basierend auf RocketForce, einem .NET Gemini-Server- und Anwendungsframework
- Kennedy.SearchConsole – Konsolen-App zum Ausführen von FTS-Abfragen. Wird zum Testen verwendet