アンジェリーナブリールリーダーは、光字点字認識システムです。写真の点字テキストをプレーンテキストに変換するように設計されています。
このソリューションは次のように利用可能です
これらのソリューションは最も実際のニューラルネットモデルを使用しているが、ここで利用可能なスタンドアロンインストールのモデルは常に最新ではないことに注意してください。
ソリューションはWebサービスです。
ユーザーは、スマートフォンまたはデスクトップコンピューターの標準的なWebブラウザを介して対話します。結果は画像とテキストとして画面に表示され、ユーザーの電子メールに送信できます。
このソリューションは、パーソナルコンピューターのスタンドアロンプログラムとしてインストールすることもでき、コマンドラインインターフェイスを介して使用できます。
ビデオプレゼンテーション:https://youtu.be/_vcvxptazom
このサービスは、アドレスで入手できます:http://angelina-reader.ru
スタンドアロンワークステーションには、少なくとも3GBメモリ(つまり、GeForce GTX 1050 3GB以上)を備えたNVIDIA GPUが必要です。WebServerには、少なくとも4GB GPUメモリ(GeForce GTX 1050TI以上)が必要です。
OS:ubuntu、windows
CUDA 10.2
Python 3.6+
Pythonパッケージは、要件を参照してください。txt
Pythonパスをパスに追加する必要があります。
クライアントには標準のWebブラウザー(Chrome、Firefox)が必要です
git clone --recursive https://github.com/IlyaOvodov/AngelinaReader.git
cd AngelinaReader
pip install --upgrade pip
pip install -r requirements.txt
wget -O weights/model.t7 http://ovdv.ru/files/retina_chars_eced60.clr.008
これらのソリューションは最も実際のニューラルネットモデルを使用しているが、ここで利用可能なスタンドアロンインストールのモデルは常に最新ではないことに注意してください。
liblouisをダウンロードしてインストールします:
For Windows: update liblouis_tables_path_prefix
parameter in AngelinaReaderlocal_config.py
file with path to Liblouis tables, including trailing "/"
python run_web_app.py
Windows:PIPディレクトリ(IE <python>Scripts
)をパスに追加する必要があります。
Python 3とPython 2.7の両方がインストールされている場合は、 python
とpip
Python3を開始することを確認してください。
ブラウザでhttp://127.0.0.1:5000を開きます。アプリケーションのメインページを表示する必要があります。
インターネットフォワードポート80からサーバーのポート5000にアプリケーションにアクセスします。ローカルでサービスをテストする必要はありません(http://127.0.0.1:5000アドレス)。
Start Server: python run_web_app.py
for windows:bat-file start_web_app.bat
を使用できます
オープンページhttp://127.0.0.1:5000ブラウザで。指示に従ってください。
いくつかの点字記号をアプリケーションによって解釈できない場合、それらは~?~
として表示されます。
Webアプリケーションの使用は、簡単なビデオ:https://youtu.be/_vcvxptazomおよびビデオプレゼンテーションhttps://youtu.be/_vcvxptazomで実証されています。
python run_local.py [-h] [-l LANG] [-o] [-2] input [results_dir]
または、Windowsで:
start.bat [-h] [-l LANG] [-o] [-2] input [results_dir]
パラメーター:
input
- 画像ファイル(jpg、pngなど)、pdfファイル、画像またはディレクトリ名のzipファイル。
ディレクトリ名またはzipファイルが提供されている場合、その中のすべての画像ファイルとPDFファイルが処理されます。
results_dir
結果を配置するフォルダー。提供されない場合、入力ファイルフォルダーが使用されます。入力ファイルごとにファイルが作成されます<input file>.marked.txt
プレーンテキストフォームと<input file>.marked.jpg
が入力画像に印刷されたプレーンテキストが付いています。
-l <language>
- 入力ドキュメント言語(デフォルトはru)。英語のテキストに-l EN
、ギリシャ語などには-l GR
使用します。言語リストを参照してください。 -o
自動オフのオフをオフにします。自動オリエンテーションが誤って動作する場合があります(非典型的なテキストの場合、または多くの認識エラーがある場合)。このような場合、画像の向きを手動で調整し、 -o
オプションを使用します。
-2
両側のプリントアウトの右側と裏面の両方を認識します。 Verso Sideの結果は<input file>.rev.marked.txt
<input file>.rev.marked.jpg
ファイルに保存されます。
-h
ヘルプを印刷します。
言語: RU
ロシア語EN
英語(グレード1) DE
ドイツ語GR
ギリシャLV
ラトビアPL
ポーランドUZ
-UZBEK(キリル語) UZL
-UZBEK(ラテン)
ネットワークの重み:Repository ./weights
フォルダーを参照してください。
なし。