영어 | 중국어 간체
PaddleOCR은 개발자가 더 나은 모델을 교육하고 구현하는 데 도움이 되는 풍부하고 선도적이며 실용적인 OCR 도구 라이브러리를 만드는 것을 목표로 합니다.
PaddleOCR은 PMC가 감독합니다. 이슈와 PR은 최선을 다해 검토됩니다. PaddlePaddle 커뮤니티에 대한 전체 개요를 보려면 커뮤니티를 방문하세요.
"PaddleOCR 2.9 출시, 공식 오픈 소스 텍스트 이미지 지능형 분석 도구", 텍스트 이미지 레이아웃 분석을 통해 고정밀 실시간 예측, 로우 코드 전체 프로세스 개발을 통해 산업 애플리케이션을 가속화합니다. 통합된 문자 이미지 수정, 레이아웃 영역 감지, 일반 문자 감지, 인감 문자 감지, 문자 인식, 양식 인식 및 기타 기능. 6개 모델 생산 라인을 한 번의 클릭으로 호출할 수 있어 개발 비용이 대폭 절감됩니다. 고성능 추론, 서비스 기반 배포, 클라이언트 측 배포 등 다양한 배포 방법을 지원합니다. 10월 24일(목) 19시 생방송을 통해 최신 업그레이드 하이라이트를 심층 분석해보겠습니다. 등록 링크
?2024.10.1 OCR 분야에 로우코드 풀 프로세스 개발 기능 추가 :
? 원클릭 호출로 모델 강화 : 최소한의 Python API Key 호출을 통해 텍스트 이미지 지능형 분석, 일반 OCR, 일반 레이아웃 분석, 일반 테이블 인식, 수식 인식 및 인감 텍스트 인식과 관련된 17개 모델을 6개 모델 생산 라인에 통합합니다. 모델 효과를 빠르게 경험해보세요. 또한 동일한 API 세트는 이미지 분류, 타겟 감지, 이미지 분할, 시계열 예측 등 총 200개 이상의 모델을 지원하여 개발자가 모델 조합을 쉽게 사용할 수 있도록 20개 이상의 단일 기능 모듈을 구성합니다.
? 효율성 향상 및 문턱 낮추기 : 통합된 명령 과 그래픽 인터페이스를 기반으로 두 가지 방법을 제공하여 모델의 간단하고 효율적인 사용, 조합 및 사용자 정의를 실현합니다. 고성능 추론, 서비스 기반 배포, 클라이언트 측 배포 등 다양한 배포 방법을 지원합니다. 또한 모델 개발 시 NVIDIA GPU, Kunlun Core, Ascend, Cambrian 및 Haiguang 과 같은 다양한 메인스트림 하드웨어 간에 원활하게 전환 할 수 있습니다.
로우 코드 개발 도구인 PaddleX는 PaddleOCR의 고급 기술을 사용하여 OCR 분야에서 로우 코드 전체 프로세스 개발 기능을 지원합니다.
문서 장면 정보 추출 v3PP-ChatOCRv3-doc, RT-DETR 및 PicoDet의 고효율 레이아웃 영역 감지 모델 기반의 고정밀 레이아웃 영역 감지 모델, 고정밀 테이블 구조 인식 모델 SLANet_Plus, 텍스트 이미지 보정 모델 UVDoc 및 수식 지원 인식 모델 LatexOCR, PP-LCNet 기반 문서 이미지 방향 분류 모델
?2024.7 PaddleOCR 알고리즘 모델 챌린지 챔피언 솔루션 추가 :
경쟁 질문 1: OCR 엔드투엔드 인식 작업 챔피언 솔루션 - 장면 텍스트 인식 알고리즘-SVTRv2;
경쟁 질문 2: 일반 테이블 인식 작업을 위한 챔피언 솔루션 - 테이블 인식 알고리즘-SLANet-LCNetV2.
다양한 OCR 관련 첨단 알고리즘을 지원하며, 이를 기반으로 산업용 등급의 특성 모델인 PP-OCR, PP-Structure, PP-ChatOCR을 생성하고, 데이터 생성, 모델 훈련, 압축, 압축 등의 전 과정을 연결합니다. 예측 배포.
전체 문서를 보려면 문서로 이동하세요.
"OCR 실습 학습" 전자책
이 프로젝트는 Apache License 버전 2.0에 따라 릴리스됩니다.