Ein PDF-Sammlungsreader mit integrierter Volltextsuchmaschine
Geschrieben in Python / Electron / Elm / Javascript
Einfache Benutzeroberfläche
Lokale Datenbank (Sie haben die Kontrolle über 100 % Ihrer Daten)
Einfache Installation (keine Notwendigkeit, externe Datenbanken zu installieren)
Multiplattform (Linux, Mac, Windows)
Git
Node.js
Python3
Git-Klon https://github.com/mknz/mirusan.gitcd ./mirusancd ./search pip install -r Anforderungen.txtcd ../electron npm installieren npm ausführen, kompilieren npm-Start
Mirusan erkennt die Eingabesprache automatisch mithilfe der Spracherkennung von Google. Der Tokenizer oder Analysator für die Indizierung wird entsprechend der erkannten Sprache ausgewählt.
Für die folgenden Sprachen wird der integrierte LanguageAnalyzer oder StandardAnalyzer von Whoosh (für Englisch) verwendet.
(obwohl es derzeit für Arabisch nicht richtig funktioniert.)
Arabic Danish Dutch English Finnish French German Hungarian Italian Norwegian Portuguese Romanian Russian Spanish Swedish Turkish
Für andere Sprachen wird der N-Gramm-Tokenizer (minsize=1, maxsize=2) verwendet.
GPLv3
Whoosh (reine Python-Suchmaschinenbibliothek)
pdf.js
Elektron
Photon
Ulme
Ulme-Elektron