Un lector de colecciones de PDF con motor de búsqueda de texto completo integrado
Escrito en Python/Electron/Elm/Javascript
Interfaz de usuario sencilla
Base de datos local (Tú tienes el control del 100% de tus datos)
Fácil instalación (No es necesario instalar bases de datos externas)
Multiplataforma (Linux, Mac, Windows)
git
Nodo.js
python3
clon de git https://github.com/mknz/mirusan.gitcd ./mirusancd ./search pip install -r requisitos.txtcd ../electrón instalación npm npm ejecutar compilar inicio de npm
Mirusan detecta automáticamente el idioma de entrada mediante la detección de idioma de Google. El tokenizador o analizador para la indexación se elige según el idioma detectado.
Para los siguientes idiomas, se utiliza el LanguageAnalayzer o StandardAnalyzer (para inglés) integrado de Whoosh.
(aunque actualmente no funciona correctamente en árabe).
Arabic Danish Dutch English Finnish French German Hungarian Italian Norwegian Portuguese Romanian Russian Spanish Swedish Turkish
Para otros idiomas, se utiliza el tokenizador N-gram (minsize=1, maxsize=2).
GPLv3
Whoosh (biblioteca de motor de búsqueda Pure Python)
pdf.js
Electrón
Fotón
Olmo
electrón-olmo