Angelina Braille Reader adalah sistem pengenalan braille optik. Ini dirancang untuk mengonversi teks Braille pada foto menjadi teks biasa.
Solusi ini tersedia sebagai
Perhatikan bahwa solusi ini menggunakan model bersih saraf yang paling aktual sementara model untuk pemasangan mandiri yang tersedia di sini tidak selalu terkini.
Solusinya adalah layanan web.
Pengguna berinteraksi dengannya melalui browser web standar pada smartphone atau komputer desktop. Hasil ditampilkan di layar sebagai gambar dan teks dan dapat dikirim ke email pengguna.
Solusi ini juga dapat diinstal sebagai program mandiri di komputer pribadi dan dapat digunakan melalui antarmuka baris perintah.
Presentasi Video: https://youtu.be/_vcvxptazom
Layanan ini tersedia di alamat: http://angelina-reader.ru
Standalone Workstation membutuhkan GPU NVIDIA dengan setidaknya memori 3GB (yaitu GeForce GTX 1050 3GB atau lebih baik), server web membutuhkan setidaknya memori GPU 4GB (GeForce GTX 1050TI atau lebih baik)
OS: Ubuntu, Windows
CUDA 10.2
Python 3.6+
paket python lihat persyaratan.txt
Jalur Python harus ditambahkan ke jalur.
Klien membutuhkan browser web standar (Chrome, Firefox)
git clone --recursive https://github.com/IlyaOvodov/AngelinaReader.git
cd AngelinaReader
pip install --upgrade pip
pip install -r requirements.txt
wget -O weights/model.t7 http://ovdv.ru/files/retina_chars_eced60.clr.008
Perhatikan bahwa solusi ini menggunakan model bersih saraf yang paling aktual sementara model untuk pemasangan mandiri yang tersedia di sini tidak selalu terkini.
Unduh dan Instal Liblouis:
Untuk windows: perbarui parameter liblouis_tables_path_prefix
di AngelinaReaderlocal_config.py
file dengan jalur ke tabel liblouis, termasuk trailing "/"
python run_web_app.py
Windows: PIP Directory (yaitu <python>Scripts
) harus ditambahkan ke jalur.
Pastikan python
dan pip
mulai Python3 jika Python 3 dan Python 2.7 dipasang.
Buka http://127.0.0.1:5000 di browser. Halaman utama aplikasi harus ditampilkan.
Untuk mengakses aplikasi dari Internet Forward Port 80 ke Port 5000 dari server. Tidak diperlukan untuk menguji layanan secara lokal (di http://127.0.0.1:5000 alamat).
Mulai Server: python run_web_app.py
untuk windows: Anda dapat menggunakan batang batang start_web_app.bat
Buka halaman http://127.0.0.1:5000 di browser. Ikuti instruksi.
Jika beberapa simbol Braille tidak dapat ditafsirkan oleh aplikasi, mereka ditampilkan sebagai ~?~
.
Penggunaan aplikasi web ditunjukkan dalam video singkat: https://youtu.be/_vcvxptazom dan dalam presentasi video https://youtu.be/_vcvxptazom
python run_local.py [-h] [-l LANG] [-o] [-2] input [results_dir]
Atau, di Windows:
start.bat [-h] [-l LANG] [-o] [-2] input [results_dir]
Parameter:
input
- File Gambar (JPG, PNG dll.), File PDF, File Zip dengan Gambar atau Nama Direktori.
Jika nama direktori atau file zip disediakan, semua file gambar dan PDF di dalamnya akan diproses.
results_dir
- folder untuk menempatkan hasil. Jika tidak disediakan, folder file input akan digunakan. Untuk setiap file input akan dibuat file <input file>.marked.txt
dengan hasil dalam formulir teks biasa dan <input file>.marked.jpg
dengan teks biasa dicetak di atas gambar input.
-l <language>
- Input Dokumen Bahasa (default adalah RU). Gunakan -l EN
untuk teks bahasa Inggris, -l GR
untuk bahasa Yunani dll. Lihat daftar bahasa di bawah ini. -o
- Matikan pencarian orientasi otomatis. Terkadang orientasi otomatis dapat bekerja secara tidak benar (untuk teks non-tipikal atau jika ada banyak kesalahan pengakuan). Dalam kasus seperti itu sesuaikan orientasi gambar secara manual dan gunakan -o
opsi.
-2
-Kenali sisi recto dan verso dari cetakan dua sisi. Hasil sisi verso disimpan dalam <input file>.rev.marked.txt
и <input file>.rev.marked.jpg
file.
-h
- Cetak Bantuan.
Bahasa: RU
- Rusia EN
- Bahasa Inggris (Kelas 1) DE
- Jerman GR
- Yunani LV
- Latvian PL
- Polandia UZ
- Uzbek (Cyrillic) UZL
- Uzbek (Latin)
Bobot jaringan: lihat folder repositori ./weights
.
Tidak ada.