Angelina Braille Reader เป็นระบบจดจำอักษรเบรลล์แบบออพติคอล มันถูกออกแบบมาเพื่อแปลงข้อความอักษรเบรลล์บนรูปภาพเป็นข้อความธรรมดา
โซลูชันนี้มีให้เป็น
โปรดทราบว่าโซลูชันเหล่านี้ใช้โมเดล Neural Net ที่เกิดขึ้นจริงมากที่สุดในขณะที่โมเดลสำหรับการติดตั้งแบบสแตนด์อโลนที่มีอยู่ที่นี่ไม่ได้ทันสมัยเสมอไป
โซลูชันคือบริการเว็บ
ผู้ใช้โต้ตอบกับเว็บเบราว์เซอร์มาตรฐานบนสมาร์ทโฟนหรือคอมพิวเตอร์เดสก์ท็อป ผลลัพธ์จะปรากฏบนหน้าจอเป็นรูปภาพและข้อความและสามารถส่งไปยังอีเมลของผู้ใช้
โซลูชันนี้ยังสามารถติดตั้งเป็นโปรแกรมแบบสแตนด์อโลนบนคอมพิวเตอร์ส่วนบุคคลและสามารถใช้งานผ่านอินเทอร์เฟซบรรทัดคำสั่ง
การนำเสนอวิดีโอ: https://youtu.be/_vcvxptazom
บริการนี้มีอยู่ตามที่อยู่: http://angelina-reader.ru
เวิร์กสเตชันแบบสแตนด์อโลนต้องการ Nvidia GPU ที่มีหน่วยความจำอย่างน้อย 3GB (เช่น GeForce GTX 1050 3GB หรือดีกว่า) เว็บเซิร์ฟเวอร์ต้องใช้หน่วยความจำ GPU อย่างน้อย 4GB (GeForce GTX 1050TI หรือดีกว่า)
OS: Ubuntu, Windows
Cuda 10.2
Python 3.6+
แพ็คเกจ Python ดู required.txt
ควรเพิ่มเส้นทาง Python ลงในเส้นทาง
ไคลเอนต์ต้องการเว็บเบราว์เซอร์มาตรฐาน (Chrome, Firefox)
git clone --recursive https://github.com/IlyaOvodov/AngelinaReader.git
cd AngelinaReader
pip install --upgrade pip
pip install -r requirements.txt
wget -O weights/model.t7 http://ovdv.ru/files/retina_chars_eced60.clr.008
โปรดทราบว่าโซลูชันเหล่านี้ใช้โมเดล Neural Net ที่เกิดขึ้นจริงมากที่สุดในขณะที่โมเดลสำหรับการติดตั้งแบบสแตนด์อโลนที่มีอยู่ที่นี่ไม่ได้ทันสมัยเสมอไป
ดาวน์โหลดและติดตั้ง liblouis:
สำหรับ Windows: อัปเดตพารามิเตอร์ liblouis_tables_path_prefix
ในไฟล์ AngelinaReaderlocal_config.py
พร้อมเส้นทางไปยังตาราง liblouis รวมถึง training "/"
python run_web_app.py
ควรเพิ่มไดเรกทอรี PIP (เช่น <python>Scripts
) ลงในเส้นทาง
ตรวจสอบให้แน่ใจว่า python
และ pip
Start Python3 หากติดตั้งทั้ง Python 3 และ Python 2.7
เปิด http://127.0.0.1:5000 ในเบราว์เซอร์ หน้าหลักของแอปพลิเคชันควรแสดง
ในการเข้าถึงแอปพลิเคชันจากอินเทอร์เน็ตไปข้างหน้าพอร์ต 80 ไปยังพอร์ต 5000 ของเซิร์ฟเวอร์ ไม่จำเป็นต้องทดสอบบริการในเครื่อง (ที่ http://127.0.0.1:5000 ที่อยู่)
Start Server: python run_web_app.py
สำหรับ windows: คุณสามารถใช้ bat-file start_web_app.bat
เปิดหน้า http://127.0.0.1:5000 ในเบราว์เซอร์ ทำตามคำแนะนำ
หากแอปพลิเคชันบางอย่างไม่สามารถตีความได้โดยแอปพลิเคชันพวกเขาจะแสดงเป็น ~?~
การใช้งานเว็บแอปพลิเคชันแสดงในวิดีโอสั้น ๆ : https://youtu.be/_vcvxptazom และในการนำเสนอวิดีโอ https://youtu.be/_vcvxptazom
python run_local.py [-h] [-l LANG] [-o] [-2] input [results_dir]
หรือใน Windows:
start.bat [-h] [-l LANG] [-o] [-2] input [results_dir]
พารามิเตอร์:
input
- image file (jpg, png etc.), pdf file, zip file with images or directory name.
หากมีการจัดทำชื่อไดเรกทอรีหรือไฟล์ซิปไฟล์รูปภาพและไฟล์ PDF ทั้งหมดจะถูกประมวลผล
results_dir
- โฟลเดอร์เพื่อวางผลลัพธ์หากไม่ได้จัดหาโฟลเดอร์อินพุตไฟล์จะถูกนำมาใช้ สำหรับไฟล์อินพุตทุกไฟล์จะถูกสร้างขึ้น <input file>.marked.txt
พร้อมผลลัพธ์ในรูปแบบข้อความธรรมดาและ <input file>.marked.jpg
พร้อมข้อความธรรมดาที่พิมพ์ผ่านอิมเมจอินพุต
-l <language>
- อินพุตภาษาเอกสาร (ค่าเริ่มต้นคือ RU) ใช้ -l EN
สำหรับข้อความภาษาอังกฤษ -l GR
สำหรับภาษากรีก ฯลฯ ดูรายการภาษาด้านล่าง -o
- ปิดการค้นหาการวางแนวอัตโนมัติ บางครั้งการวางแนวอัตโนมัติสามารถทำงานได้อย่างไม่ถูกต้อง (สำหรับข้อความที่ไม่ธรรมดาหรือหากมีข้อผิดพลาดในการรับรู้มากมาย) ในกรณีเช่นนี้ปรับการวางแนวของภาพด้วยตนเองและใช้ตัวเลือก -o
-2
-รับรู้ทั้ง recto และด้านข้างของการพิมพ์สองด้าน ผลลัพธ์ด้าน Verso ถูกเก็บไว้ใน <input file>.rev.marked.txt
и <input file>.rev.marked.jpg
ไฟล์
-h
- ความช่วยเหลือพิมพ์
ภาษา: RU
- RUSSIAN EN
- ภาษาอังกฤษ (เกรด 1) DE
- GERMAN GR
- กรีก LV
- ลัตเวีย PL
- โปแลนด์ UZ
- Uzbek (Cyrillic) UZL
- Uzbek (ละติน)
น้ำหนักเครือข่าย: ดูที่เก็บ ./weights
โฟลเดอร์ WEIGHTS
ไม่มี.