Angelina Braille Reader ist ein optisches Braille -Erkennungssystem. Es wurde entwickelt, um Braille -Text auf Fotos in einfache Text umzuwandeln.
Diese Lösung ist als verfügbar als
Beachten Sie, dass diese Lösungen das tatsächlichste neuronale Netzmodell verwenden, während das hier verfügbare Modell für die eigenständige Installation nicht immer auf dem neuesten Stand ist.
Die Lösung ist ein Web-Service.
Benutzer interagieren mit IT über einen Standard -Webbrowser auf einem Smartphone oder einem Desktop -Computer. Die Ergebnisse werden auf dem Bildschirm als Bilder und Text angezeigt und können an die E-Mail des Benutzers gesendet werden.
Diese Lösung kann auch als eigenständiges Programm auf einem PC installiert und über eine Befehlszeilenschnittstelle verwendet werden.
Videopräsentation: https://youtu.be/_vcvxptazom
Dieser Service ist unter der Adresse erhältlich: http://angelina-reader.ru
Die eigenständige Workstation erfordert die NVIDIA-GPU mit mindestens 3 GB Speicher (dh Geforce GTX 1050 3 GB oder besser). Web-Server benötigt mindestens 4 GB GPU-Speicher (GeForce GTX 1050TI oder besser)
OS: Ubuntu, Windows
CUDA 10.2
Python 3.6+
Python -Pakete siehe Anforderungen.txt
Der Python -Pfad sollte zum Pfad hinzugefügt werden.
Ein Client benötigt einen Standard-Webbrowser (Chrome, Firefox)
git clone --recursive https://github.com/IlyaOvodov/AngelinaReader.git
cd AngelinaReader
pip install --upgrade pip
pip install -r requirements.txt
wget -O weights/model.t7 http://ovdv.ru/files/retina_chars_eced60.clr.008
Beachten Sie, dass diese Lösungen das tatsächlichste neuronale Netzmodell verwenden, während das hier verfügbare Modell für die eigenständige Installation nicht immer auf dem neuesten Stand ist.
Liblouis herunterladen und installieren:
Für Windows: Aktualisieren Sie liblouis_tables_path_prefix
Parameter in AngelinaReaderlocal_config.py
-Datei mit Pfad zu LIBLOUIS -Tabellen, einschließlich Nachverfolgung "/"
python run_web_app.py
Windows: PIP -Verzeichnis (dh <python>Scripts
) sollte zum Pfad hinzugefügt werden.
Stellen Sie sicher, dass python
und pip
Python3 starten, wenn sowohl Python 3 als auch Python 2.7 installiert sind.
Öffnen Sie http://127.0.0.1:5000 in einem Browser. Die Hauptseite der Anwendung sollte angezeigt werden.
So greifen Sie auf die Anwendung vom Internet -Forward -Port 80 auf Port 5000 des Servers zu. Es ist nicht erforderlich, den Dienst lokal zu testen (unter http://127.0.0.1:5000 Adresse).
Startserver: python run_web_app.py
für Windows: Sie können Bat-File start_web_app.bat
verwenden
Öffnen Sie die Seite http://127.0.0.1:5000 in einem Browser. Befolgen Sie die Anweisungen.
Wenn einige Braille -Symbole nicht von der Anwendung interpretiert werden können, werden sie als ~?~
angezeigt.
Die Verwendung von Web-Application wird in einem kurzen Video demonstriert: https://youtu.be/_vcvxptazom und in einer Videopräsentation https://youtu.be/_vcvxptazom
python run_local.py [-h] [-l LANG] [-o] [-2] input [results_dir]
oder in Windows:
start.bat [-h] [-l LANG] [-o] [-2] input [results_dir]
Parameter:
input
- Bilddatei (JPG, PNG usw.), PDF -Datei, ZIP -Datei mit Bildern oder Verzeichnisnamen.
Wenn der Verzeichnisname oder die ZIP -Datei geliefert wird, werden alle Bild- und PDF -Dateien darin verarbeitet.
results_dir
- Ordner zum Platzieren von Ergebnissen. Wenn nicht geliefert wird, wird der Ordner "Inputdateien" verwendet. Für jede Eingabedatei wird Dateien erstellt <input file>.marked.txt
mit Ergebnissen in einem Klartextformular und <input file>.marked.jpg
mit einem übergab gedruckten Text.
-l <language>
- Dokumentsprache eingeben (Standard ist Ru). Verwenden Sie -l EN
für englische Texte, -l GR
für Griechisch usw. Siehe Sprachenliste unten. -o
- Suchen Sie die automatische Ausrichtung aus. Manchmal kann die Autoorientierung falsch funktionieren (für nichttypische Texte oder wenn es viele Erkennungsfehler gibt). In solchen Fällen passen Sie die Bildorientierung manuell an und verwenden Sie die Option -o
.
-2
-Erkennen Sie sowohl Recto- als auch Verso -Seiten von zweiseitigen Ausdrucken. Die Verso -Seiteergebnisse werden in <input file>.rev.marked.txt
и <input file>.rev.marked.jpg
-Dateien gespeichert.
-h
- Druckhilfe.
Sprachen: RU
LV
Russian EN
- Englisch (Klasse 1) DE
- Deutsch Griechisch GR
- Lettisch PL
- Polnisch UZ
- Usbek (kyrillisch) UZL
- Usbek (Latein)
Netzwerkgewichte: Siehe Repository ./weights
Ordner.
Keiner.