Angelina Braille Reader est un système de reconnaissance optique en braille. Il est conçu pour convertir du texte braille sur des photos en texte brut.
Cette solution est disponible en tant que
Notez que ces solutions utilisent le modèle neural le plus réel tandis que le modèle d'installation autonome disponible ici n'est pas toujours à jour.
La solution est un service Web.
Les utilisateurs interagissent avec lui via un navigateur Web standard sur un smartphone ou un ordinateur de bureau. Les résultats sont affichés à l'écran sous forme d'images et de texte et peuvent être envoyés à l'e-mail de l'utilisateur.
Cette solution peut également être installée en tant que programme autonome sur un ordinateur personnel et peut être utilisé via une interface de ligne de commande.
Présentation vidéo: https://youtu.be/_vcvxptazom
Ce service est disponible à l'adresse: http://angelina-reader.ru
La station de travail autonome nécessite NVIDIA GPU avec au moins 3 Go de mémoire (c'est-à-dire GeForce GTX 1050 3 Go ou mieux), le serveur Web nécessite au moins 4 Go de mémoire GPU (GeForce GTX 1050Ti ou mieux)
OS: Ubuntu, Windows
Cuda 10.2
Python 3.6+
packages python voir exigences.txt
Le chemin Python doit être ajouté au chemin.
Un client a besoin d'un navigateur Web standard (Chrome, Firefox)
git clone --recursive https://github.com/IlyaOvodov/AngelinaReader.git
cd AngelinaReader
pip install --upgrade pip
pip install -r requirements.txt
wget -O weights/model.t7 http://ovdv.ru/files/retina_chars_eced60.clr.008
Notez que ces solutions utilisent le modèle neural le plus réel tandis que le modèle d'installation autonome disponible ici n'est pas toujours à jour.
Télécharger et installer Liblouis:
Pour Windows: Mettez à jour le paramètre liblouis_tables_path_prefix
dans le fichier AngelinaReaderlocal_config.py
avec le chemin des tables Liblouis, y compris la fin "/"
python run_web_app.py
Windows: le répertoire PIP (IE <python>Scripts
) doit être ajouté au chemin.
Assurez-vous python
et pip
démarrent Python3 si Python 3 et Python 2.7 sont installés.
Ouvrez http://127.0.0.1:5000 dans un navigateur. La page principale de l'application doit être affichée.
Pour accéder à l'application depuis Internet Port 80 au port 5000 du serveur. Il n'est pas nécessaire de tester le service localement (à l'adresse http://127.0.0.1:5000).
Server de démarrage: python run_web_app.py
pour Windows: vous pouvez utiliser le file de batte start_web_app.bat
Ouvrez la page http://127.0.0.1:5000 dans un navigateur. Suivez les instructions.
Si certains symboles braille ne peuvent pas être interprétés par l'application, ils sont affichés comme ~?~
.
L'utilisation de l'application Web est démontrée dans une brève vidéo: https://youtu.be/_vcvxptazom et dans une présentation vidéo https://youtu.be/_vcvxptazom
python run_local.py [-h] [-l LANG] [-o] [-2] input [results_dir]
ou, dans les fenêtres:
start.bat [-h] [-l LANG] [-o] [-2] input [results_dir]
Paramètres:
input
- Fichier image (JPG, PNG etc.), fichier PDF, fichier zip avec images ou nom de répertoire.
Si le nom du répertoire ou le fichier ZIP est fourni, tous les fichiers d'image et de PDF sont traités.
results_dir
- folder to place results in. If not supplied, the input files folder will be used. Pour chaque fichier d'entrée sera créé des fichiers <input file>.marked.txt
avec les résultats dans un formulaire de texte brut et <input file>.marked.jpg
avec un texte brut imprimé sur l'image d'entrée.
-l <language>
- Langue de document d'entrée (la valeur par défaut est RU). Utilisez -l EN
pour les textes anglais, -l GR
pour le grec, etc. Voir la liste des langues ci-dessous. -o
- switch off automatic orientation search. Parfois, l'orientation automatique peut fonctionner de manière incorrecte (pour les textes non typiques ou s'il existe de nombreuses erreurs de reconnaissance). Dans de tels cas, ajustez manuellement l'orientation de l'image et utilisez l'option -o
.
-2
- Reconnaissez les côtés recto et verso des impressions à deux côtés. Les résultats latéraux de verso sont stockés dans <input file>.rev.marked.txt
и <input file>.rev.marked.jpg
.
-h
- print help.
Langues: RU
- Russian EN
- anglais (grade 1) DE
- allemand GR
- grec LV
- latton PL
- polonais UZ
- Uzbek (cyrillique) UZL
- Uzbek (latin)
Poids du réseau: voir le dossier du référentiel ./weights
.
Aucun.