Um leitor de coleção de PDF com mecanismo de pesquisa de texto completo integrado
Escrito em Python/Electron/Elm/Javascript
IU simples
Banco de dados local (você tem controle de 100% dos seus dados)
Fácil instalação (não há necessidade de instalar bancos de dados externos)
Multiplataforma (Linux, Mac, Windows)
Git
Node.js
python3
clone git https://github.com/mknz/mirusan.gitcd ./mirusancd ./search pip install -r requisitos.txtcd ../electron instalação npm npm executar compilação npm início
Mirusan detecta automaticamente o idioma de entrada usando a detecção de idioma do Google. O tokenizador ou analisador para indexação é escolhido de acordo com o idioma detectado.
Para os seguintes idiomas, o LanguageAnalayzer ou StandardAnalyzer integrado do Whoosh (para inglês) é usado.
(embora atualmente não funcione corretamente para árabe).
Arabic Danish Dutch English Finnish French German Hungarian Italian Norwegian Portuguese Romanian Russian Spanish Swedish Turkish
Para outras linguagens, o tokenizer N-gram (minsize=1, maxsize=2) é usado.
GPLv3
Whoosh (biblioteca de mecanismo de pesquisa Pure Python)
pdf.js
Elétron
Fóton
Olmo
olmo-elétron