PaddleOCR vise à créer une bibliothèque d'outils OCR riche, de pointe et pratique pour aider les utilisateurs à former de meilleurs modèles et à mettre en œuvre des applications.
PP-OCR est un système OCR ultra-léger et pratique. Il se compose principalement de trois parties : la détection de texte DB, la correction du cadre de détection et la reconnaissance de texte CRNN. Le système adopte 19 stratégies efficaces sous 8 aspects : sélection et ajustement du réseau fédérateur, conception de la tête de prédiction, amélioration des données, stratégie de transformation du taux d'apprentissage, sélection des paramètres de régularisation, utilisation du modèle de pré-entraînement et recadrage et quantification automatiques du modèle. allégé, et finalement un OCR chinois et anglais ultra-léger d'une taille globale de 3,5 M et un OCR numérique anglais de 2,8 M ont été obtenus.
1. Modèle de pré-formation de haute qualité de la série PPOCR, effet de reconnaissance précis
Série mobile ppocr_mobile ultra-légère : détection (2,6 M) + classificateur de direction (0,9 M) + reconnaissance (4,6 M) = 8,1 M
Série générale ppocr_server : détection (47,2 M) + classificateur de direction (0,9 M) + reconnaissance (107 M) = 155,1 M
Série ppocr_mobile_slim de compression ultra-légère : détection (1,4 M) + classificateur de direction (0,5 M) + reconnaissance (1,6 M) = 3,5 M
2. Prend en charge la reconnaissance des combinaisons de chiffres chinois et anglais, la reconnaissance de texte vertical et la reconnaissance de texte long
3. Prise en charge de la reconnaissance multilingue : coréen, japonais, allemand, français
4. Prend en charge la formation définie par l'utilisateur et fournit de riches solutions de déploiement d'inférence prédictive
5. Prise en charge de l'installation et de l'utilisation rapides de PIP
6. Peut fonctionner sous Linux, Windows, MacOS et autres systèmes