PaddleOCR은 사용자가 더 나은 모델을 훈련하고 구현하는 데 도움이 되는 풍부하고 선도적이며 실용적인 OCR 도구 라이브러리를 만드는 것을 목표로 합니다.
PP-OCR은 실용적인 초경량 OCR 시스템입니다. 이는 주로 DB 텍스트 탐지, 탐지 프레임 수정, CRNN 텍스트 인식의 세 부분으로 구성됩니다. 시스템은 백본 네트워크 선택 및 조정, 예측 헤드 설계, 데이터 강화, 학습률 변환 전략, 정규화 매개변수 선택, 사전 훈련 모델 사용, 자동 모델 자르기 및 정량화 등 8가지 측면에서 19가지 효과적인 전략을 채택했습니다. 슬림화하여 최종적으로 전체 크기 3.5M의 초경량 중국어 및 영어 OCR과 2.8M의 영어 디지털 OCR을 획득하였습니다.
1. PPOCR 시리즈 고품질 사전 훈련 모델, 정확한 인식 효과
초경량 ppocr_mobile 모바일 시리즈 : 감지(2.6M) + 방향분류(0.9M) + 인식(4.6M) = 8.1M
일반 ppocr_server 시리즈 : 탐지(47.2M) + 방향분류기(0.9M) + 인식(107M) = 155.1M
초경량 압축 ppocr_mobile_slim 시리즈 : 감지(1.4M) + 방향분류기(0.5M) + 인식(1.6M) = 3.5M
2. 중국어 및 영어 숫자 조합 인식, 세로 텍스트 인식, 긴 텍스트 인식 지원
3. 다국어 인식 지원 : 한국어, 일본어, 독일어, 프랑스어
4. 사용자 정의 훈련을 지원하고 풍부한 예측 추론 배포 솔루션을 제공합니다.
5. PIP 빠른 설치 및 사용 지원
6. Linux, Windows, MacOS 및 기타 시스템에서 실행 가능