Anglais | Chinois simplifié
PaddleOCR vise à créer une bibliothèque d'outils OCR riche, leader et pratique pour aider les développeurs à former de meilleurs modèles et à les mettre en œuvre.
PaddleOCR est supervisé par PMC. Les problèmes et les PR seront examinés dans la mesure du possible. Pour un aperçu complet de la communauté PaddlePaddle, veuillez visiter la communauté.
??"Publication de PaddleOCR 2.9, outil d'analyse intelligent d'images de texte officiellement open source", analyse de la disposition des images de texte pour obtenir une prédiction en temps réel de haute précision, développement de processus complet à faible code pour accélérer les applications industrielles. Correction d'image de texte intégrée, détection de zone de mise en page, détection de texte ordinaire, détection de texte de sceau, reconnaissance de texte, reconnaissance de forme et autres fonctions. Six lignes de production de modèles peuvent être appelées en un seul clic, réduisant considérablement les coûts de développement. Prend en charge plusieurs méthodes de déploiement telles que l'inférence hautes performances, le déploiement basé sur les services et le déploiement côté client. La diffusion en direct à 19h00 le 24 octobre (jeudi) vous donnera une analyse approfondie des points forts de la dernière mise à jour. Lien d'inscription
?2024.10.1 Ajouter des capacités de développement de processus complets low-code dans le domaine OCR :
? Enrichissement de modèles en un seul clic : intégrez 17 modèles liés à l'analyse intelligente d'images de texte, à l'OCR générale, à l'analyse de mise en page générale, à la reconnaissance générale de tableaux, à la reconnaissance de formules et à la reconnaissance de texte de sceau dans 6 lignes de production de modèles, via un appel de clé API Python minimaliste à Découvrez rapidement l'effet de modèle. En outre, le même ensemble d'API prend également en charge un total de plus de 200 modèles tels que la classification d'images, la détection de cibles, la segmentation d'images et la prédiction de séries chronologiques, formant plus de 20 modules à fonction unique pour faciliter l'utilisation des combinaisons de modèles par les développeurs.
? Améliorer l'efficacité et abaisser le seuil : Fournit deux méthodes basées sur des commandes unifiées et une interface graphique pour réaliser une utilisation, une combinaison et une personnalisation simples et efficaces des modèles. Prend en charge plusieurs méthodes de déploiement telles que l'inférence hautes performances, le déploiement basé sur les services et le déploiement côté client . De plus, vous pouvez basculer en toute transparence entre divers matériels grand public tels que NVIDIA GPU, Kunlun Core, Ascend, Cambrian et Haiguang lors du développement de modèles.
PaddleX, un outil de développement low-code, s'appuie sur la technologie avancée de PaddleOCR pour prendre en charge les capacités de développement low-code complet dans le domaine OCR :
Prend en charge l'extraction d'informations sur la scène du document v3PP-ChatOCRv3-doc, le modèle de détection de zone de mise en page de haute précision basé sur le modèle de détection de zone de mise en page à haute efficacité de RT-DETR et PicoDet, le modèle de reconnaissance de structure de table de haute précision SLANet_Plus, le modèle de correction d'image de texte UVDoc et la formule modèle de reconnaissance LatexOCR , Modèle de classification de l'orientation des images de documents basé sur PP-LCNet
?2024.7 Ajouter la solution championne du PaddleOCR Algorithm Model Challenge :
Question du concours 1 : Solution championne des tâches de reconnaissance de bout en bout OCR - algorithme de reconnaissance de texte de scène-SVTRv2 ;
Question du concours 2 : La solution championne pour la tâche générale de reconnaissance de table - algorithme de reconnaissance de table-SLANet-LCNetV2.
Il prend en charge une variété d'algorithmes de pointe liés à l'OCR et crée sur cette base des modèles caractéristiques de qualité industrielle PP-OCR, PP-Structure et PP-ChatOCR, et connecte l'ensemble du processus de production de données, de formation de modèles, de compression et déploiement de prédiction.
Pour une documentation complète, veuillez consulter : docs
Livre électronique « Apprentissage pratique de l'OCR »
Ce projet est publié sous la licence Apache version 2.0.