PaddleOCR tiene como objetivo crear una biblioteca de herramientas de OCR rica, líder y práctica para ayudar a los usuarios a entrenar mejores modelos e implementar aplicaciones.
PP-OCR es un práctico sistema OCR ultraligero. Consta principalmente de tres partes: detección de texto DB, corrección de cuadros de detección y reconocimiento de texto CRNN. El sistema adopta 19 estrategias efectivas de 8 aspectos: selección y ajuste de la red troncal, diseño del cabezal de predicción, mejora de datos, estrategia de transformación de la tasa de aprendizaje, selección de parámetros de regularización, uso del modelo previo al entrenamiento y recorte y cuantificación automática del modelo. Se redujo y finalmente se obtuvo un OCR ultraligero en chino e inglés con un tamaño total de 3,5 M y un OCR digital en inglés de 2,8 M.
1. Modelo de preentrenamiento de alta calidad de la serie PPOCR, efecto de reconocimiento preciso
Serie móvil ultraligera ppocr_mobile: detección (2,6 M) + clasificador de dirección (0,9 M) + reconocimiento (4,6 M) = 8,1 M
Serie general ppocr_server: detección (47,2 M) + clasificador de dirección (0,9 M) + reconocimiento (107 M) = 155,1 M
Serie ppocr_mobile_slim de compresión ultraligera: detección (1,4 M) + clasificador de dirección (0,5 M) + reconocimiento (1,6 M) = 3,5 M
2. Admite reconocimiento de combinación de números en chino e inglés, reconocimiento de texto vertical y reconocimiento de texto largo
3. Admite reconocimiento en varios idiomas: coreano, japonés, alemán, francés
4. Admitir capacitación definida por el usuario y brindar soluciones completas de implementación de inferencia predictiva
5. Admite la instalación y el uso rápidos de PIP
6. Puede ejecutarse en Linux, Windows, MacOS y otros sistemas.