Angelina Braille Reader es un sistema de reconocimiento óptico de Braille. Está diseñado para convertir el texto de Braille en fotos en texto sin formato.
Esta solución está disponible como
Tenga en cuenta que estas soluciones utilizan el modelo de red neuronal más real, mientras que el modelo para la instalación independiente disponible aquí no siempre está actualizada.
La solución es un servicio web.
Los usuarios interactúan con él a través de un navegador web estándar en un teléfono inteligente o en una computadora de escritorio. Los resultados se muestran en la pantalla como imágenes y texto y se pueden enviar al correo electrónico del usuario.
Esta solución también se puede instalar como un programa independiente en una computadora personal y se puede usar a través de una interfaz de línea de comandos.
Presentación de video: https://youtu.be/_vcvxptazom
Este servicio está disponible en la dirección: http://angelina-reader.ru
La estación de trabajo independiente requiere NVIDIA GPU con al menos 3 GB de memoria (es decir, GeForce GTX 1050 3GB o mejor), Web-servidor requiere al menos 4 GB de memoria GPU (GeForce GTX 1050TI o mejor)
OS: Ubuntu, Windows
CUDA 10.2
Python 3.6+
Paquetes de Python Ver requisitos.txt
Python Rath debe agregarse a la ruta.
Un cliente requiere un navegador web estándar (Chrome, Firefox)
git clone --recursive https://github.com/IlyaOvodov/AngelinaReader.git
cd AngelinaReader
pip install --upgrade pip
pip install -r requirements.txt
wget -O weights/model.t7 http://ovdv.ru/files/retina_chars_eced60.clr.008
Tenga en cuenta que estas soluciones utilizan el modelo de red neuronal más real, mientras que el modelo para la instalación independiente disponible aquí no siempre está actualizado.
Descargar e instalar Liblouis:
Para Windows: actualizar el parámetro liblouis_tables_path_prefix
en AngelinaReaderlocal_config.py
con ruta a las tablas de Liblouis, incluido el final "/"
python run_web_app.py
Windows: Pip Directory (es decir, <python>Scripts
) debe agregarse a la ruta.
Asegúrese de que python
y pip
inicien Python3 si se instalan Python 3 y Python 2.7.
Abra http://127.0.0.1:5000 en un navegador. Se debe mostrar la página principal de la aplicación.
Para acceder a la aplicación desde Internet Reenviar el puerto 80 al puerto 5000 del servidor. No es necesario probar el servicio localmente (en http://127.0.0.1:5000 de la dirección).
Start Server: python run_web_app.py
para Windows: puede usar BAT-File start_web_app.bat
Abra la página http://127.0.0.1:5000 en un navegador. Sigue las instrucciones.
Si la aplicación no puede interpretar algunos símbolos Braille, se muestran como ~?~
.
El uso de la aplicación web se demuestra en un breve video: https://youtu.be/_vcvxptazom y en una presentación de video https://youtu.be/_vcvxptazom
python run_local.py [-h] [-l LANG] [-o] [-2] input [results_dir]
O, en Windows:
start.bat [-h] [-l LANG] [-o] [-2] input [results_dir]
Parámetros:
input
: archivo de imagen (JPG, PNG, etc.), archivo PDF, archivo zip con imágenes o nombre de directorio.
Si se suministra el nombre del directorio o el archivo zip, se procesarán todas las imágenes y los archivos PDF.
results_dir
- Carpeta para colocar los resultados. Si no se suministra, se utilizará la carpeta de archivos de entrada. Para cada archivo de entrada se creará archivos <input file>.marked.txt
con resultados en un formulario de texto sin formato y <input file>.marked.jpg
con texto sin formato impreso a través de la imagen de entrada.
-l <language>
- Idioma de documento de entrada (el valor predeterminado es RU). Use -l EN
para textos en inglés, -l GR
para griego, etc. Consulte la lista de idiomas a continuación. -o
- Apagar la búsqueda de orientación automática. A veces, la orientación automática puede funcionar incorrectamente (para textos no típicos o si hay muchos errores de reconocimiento). En tales casos, ajuste la orientación de la imagen manualmente y use la opción -o
.
-2
-Reconocer lados de recto y verso de impresiones de dos partes. Los resultados del lado del verso se almacenan en <input file>.rev.marked.txt
и <input file>.rev.marked.jpg
.
-h
- Ayuda de impresión.
Idiomas: RU
- ruso EN
- inglés (grado 1) DE
- alemán GR
- griego LV
- latvian PL
- polaco UZ
- uzbek (cirílico) UZL
- uzbek (latín)
Peso de la red: consulte la carpeta del repositorio ./weights
.
Ninguno.