Программа для чтения PDF-файлов со встроенной полнотекстовой поисковой системой.
Написано на Python/Electron/Elm/Javascript.
Простой пользовательский интерфейс
Локальная база данных (вы контролируете 100 % своих данных)
Простая установка (нет необходимости устанавливать внешние базы данных)
Мультиплатформенность (Linux, Mac, Windows)
Гит
Node.js
python3
git clone https://github.com/mknz/mirusan.gitcd ./mirusancd ./search pip install -r требования.txtcd ../электрон установка npm npm запустить компиляцию запуск НПМ
Мирусан автоматически определяет язык ввода с помощью функции определения языка Google. Токенизатор или анализатор для индексации выбирается в соответствии с обнаруженным языком.
Для следующих языков используется встроенный LanguageAnalyzer или StandardAnalyzer Whoosh (для английского языка).
(хотя в настоящее время он не работает должным образом для арабского языка.)
Arabic Danish Dutch English Finnish French German Hungarian Italian Norwegian Portuguese Romanian Russian Spanish Swedish Turkish
Для других языков используется токенизатор N-грамм (minsize=1, maxsize=2).
лицензия GPLv3
Whoosh (библиотека поисковой системы Pure Python)
pdf.js
Электрон
Фотон
Вяз
вяз-электрон