PaddleOCR は、ユーザーがより優れたモデルをトレーニングして実装できるように、豊富で優れた実用的な OCR ツール ライブラリを作成することを目的としています。
PP-OCR は実用的な超軽量 OCR システムです。主に DB テキスト検出、検出枠補正、CRNN テキスト認識の 3 つの部分で構成されます。このシステムは、バックボーン ネットワークの選択と調整、予測ヘッドの設計、データ強化、学習率変換戦略、正則化パラメーターの選択、事前トレーニング モデルの使用、モデルの自動トリミングと定量化の 8 つの側面から 19 の効果的な戦略を採用し、モデルが最適化されました。薄型化を進め、最終的に全体サイズ 350 万の超軽量の中国語と英語 OCR、および 280 万の英語デジタル OCR が得られました。
1. PPOCRシリーズ高品質事前学習モデル、正確な認識効果
超軽量 ppocr_mobile モバイル シリーズ: 検出 (2.6M) + 方向分類器 (0.9M) + 認識 (4.6M) = 8.1M
一般的な ppocr_server シリーズ: 検出 (47.2M) + 方向分類器 (0.9M) + 認識 (107M) = 155.1M
超軽量圧縮 ppocr_mobile_slim シリーズ: 検出 (1.4M) + 方向識別器 (0.5M) + 認識 (1.6M) = 3.5M
2.中国語と英語の数字の組み合わせ認識、縦書きテキスト認識、長文認識をサポート
3. 多言語認識をサポート: 韓国語、日本語、ドイツ語、フランス語
4. ユーザー定義のトレーニングをサポートし、豊富な予測推論展開ソリューションを提供します
5. PIP のクイックインストールと使用をサポートします。
6. Linux、Windows、MacOS、その他のシステムで実行可能