PaddleOCR tem como objetivo criar uma biblioteca de ferramentas de OCR rica, líder e prática para ajudar os usuários a treinar melhores modelos e implementar aplicativos.
PP-OCR é um sistema OCR prático e ultraleve. Consiste principalmente em três partes: detecção de texto DB, correção de quadro de detecção e reconhecimento de texto CRNN. O sistema adota 19 estratégias eficazes de 8 aspectos: seleção e ajuste de rede de backbone, design de cabeça de previsão, aprimoramento de dados, estratégia de transformação de taxa de aprendizagem, seleção de parâmetros de regularização, uso de modelo de pré-treinamento e corte e quantificação automática de modelo. reduzido e, finalmente, um OCR ultraleve em chinês e inglês com um tamanho total de 3,5M e um OCR digital em inglês de 2,8M foram obtidos.
1. Modelo de pré-treinamento de alta qualidade da série PPOCR, efeito de reconhecimento preciso
Série móvel ppocr_mobile ultraleve: detecção (2,6M) + classificador de direção (0,9M) + reconhecimento (4,6M) = 8,1M
Série ppocr_server geral: detecção (47,2M) + classificador de direção (0,9M) + reconhecimento (107M) = 155,1M
Série ppocr_mobile_slim de compressão ultraleve: detecção (1,4M) + classificador de direção (0,5M) + reconhecimento (1,6M) = 3,5M
2. Suporta reconhecimento de combinação de números em chinês e inglês, reconhecimento de texto vertical e reconhecimento de texto longo
3. Suporta reconhecimento multilíngue: coreano, japonês, alemão, francês
4. Apoie o treinamento definido pelo usuário e forneça soluções avançadas de implantação de inferência preditiva
5. Suporte para instalação e uso rápido do PIP
6. Pode ser executado em Linux, Windows, MacOS e outros sistemas