PaddleOCR zielt darauf ab, eine umfangreiche, führende und praktische OCR-Toolbibliothek zu erstellen, die Benutzern dabei hilft, bessere Modelle zu trainieren und Anwendungen zu implementieren.
PP-OCR ist ein praktisches, ultraleichtes OCR-System. Es besteht hauptsächlich aus drei Teilen: DB-Texterkennung, Erkennungsrahmenkorrektur und CRNN-Texterkennung. Das System übernimmt 19 effektive Strategien aus 8 Aspekten: Auswahl und Anpassung des Backbone-Netzwerks, Design des Vorhersagekopfes, Datenverbesserung, Strategie zur Lernratentransformation, Auswahl der Regularisierungsparameter, Verwendung des Modells vor dem Training sowie automatisches Zuschneiden und Quantifizieren des Modells verkleinert, und schließlich wurde eine ultraleichte chinesische und englische OCR mit einer Gesamtgröße von 3,5 Mio. und eine englische digitale OCR von 2,8 Mio. erhalten.
1. Hochwertiges Pre-Training-Modell der PPOCR-Serie, präziser Erkennungseffekt
Ultraleichte mobile Serie ppocr_mobile: Erkennung (2,6 Mio.) + Richtungsklassifizierer (0,9 Mio.) + Erkennung (4,6 Mio.) = 8,1 Mio
Allgemeine ppocr_server-Serie: Erkennung (47,2 Mio.) + Richtungsklassifizierer (0,9 Mio.) + Erkennung (107 Mio.) = 155,1 Mio
Ultraleichte Komprimierung der ppocr_mobile_slim-Serie: Erkennung (1,4 Mio.) + Richtungsklassifizierer (0,5 Mio.) + Erkennung (1,6 Mio.) = 3,5 Mio
2. Unterstützt die Erkennung chinesischer und englischer Zahlenkombinationen, die Erkennung vertikaler Texte und die Erkennung langer Texte
3. Unterstützt die Erkennung mehrerer Sprachen: Koreanisch, Japanisch, Deutsch, Französisch
4. Unterstützen Sie benutzerdefinierte Schulungen und bieten Sie umfassende Lösungen für die Bereitstellung prädiktiver Inferenzen
5. Unterstützen Sie die schnelle Installation und Verwendung von PIP
6. Kann auf Linux, Windows, MacOS und anderen Systemen ausgeführt werden