Kennedy
Kennedy é um mecanismo de busca para o espaço Gemini. Ele consiste em um rastreador, back-end e servidor de aplicativos Gemini. Kennedy aproveita muitas das técnicas e arquitetura dos primeiros rastreadores da WWW e mecanismos de pesquisa como Mercator, Archive.org e GoogleBot.
Demonstração
Visite gemini://kennedy.gemi.dev
com um cliente Gemini ou por meio de um proxy HTTP para Gemini
Características
- Pesquisa de texto completo, com Porter Stemming
- Consultas sugeridas. Kennedy recomenda outras consultas se você não obtiver muitos resultados
- Consultas de pesquisa complexas. Por exemplo: "gatos E cachorros", "(gatos OU cachorros) NÃO pássaros".
- Pesquisa de imagens! Os índices Kennedy vinculam informações de texto e caminho para permitir a pesquisa de imagens.
- Classificação da linguagem do conteúdo usando ngrams em vez de tipos MIME parâmetros
lang=
- Algoritmo derivado do PageRank para determinar melhor a relevância dos resultados
- Trechos limpos: os resultados da pesquisa incluem um trecho de conteúdo que corresponde à sua consulta. Suas palavras-chave são [entre colchetes] e a formatação gemtext é removida para torná-la mais limpa de leitura.
- Contagem de linhas: para ajudá-lo a classificar artigos rápidos de conteúdo mais longo, os resultados da pesquisa informam quantas linhas há no conteúdo. Se você quiser ser nerd, também incluo tamanhos de bytes.
Por que?
Muitos anos atrás, perguntaram ao grande explorador britânico George Mallory, que morreria no Monte Everest, por que ele queria escalá-lo. Ele disse: “Porque está lá”.
Discurso de John F. Kennedy na Rice University, 12 de setembro de 1962
Projetos
- Kennedy.Crawler - Lógica do rastreador (fronteiras de URL, filas, etc)
- Kennedy.CrawlData - Modelos e sistemas de armazenamento para documentos, metadados e pesquisa de texto completo
- Kennedy.Server - Servidor Gemini para lidar com consultas e resultados de pesquisa. Construído com base no RocketForce, um servidor .NET Gemini e estrutura de aplicativos
- Kennedy.SearchConsole - aplicativo de console para execução de consultas FTS. Usado para testes