PaddleOCR工具庫v2.8.1
2.8.1
PaddleOCR旨在打造一套豐富、領先、且實用的OCR工具庫,協助使用者訓練出更好的模型,並應用落地。
PP-OCR是一個實用的超輕量OCR系統。主要由DB文字偵測、偵測框架矯正和CRNN文字辨識三部分組成。該系統從骨幹網路選擇和調整、預測頭部的設計、資料增強、學習率變換策略、正則化參數選擇、預訓練模型使用以及模型自動裁剪量化8個方面,採用19個有效策略,對各個模組的模型進行效果調優和瘦身,最終得到整體大小為3.5M的超輕量中英文OCR和2.8M的英文數字OCR。
1、PPOCR系列高品質預訓練模型,準確的辨識效果
超輕量ppocr_mobile行動端系列:偵測(2.6M)+方向分類器(0.9M)+ 辨識(4.6M)= 8.1M
通用ppocr_server系列:偵測(47.2M)+方向分類器(0.9M)+ 辨識(107M)= 155.1M
超輕量壓縮ppocr_mobile_slim系列:偵測(1.4M)+方向分類器(0.5M)+ 辨識(1.6M)= 3.5M
2、支援中英文數字組合識別、垂直文本識別、長文本識別
3.支援多語言辨識:韓語、日語、德語、法語
4.支援使用者自訂訓練,提供豐富的預測推理部署方案
5.支援PIP快速安裝使用
6.可運行於Linux、Windows、MacOS等多種系統