Englisch |. Vereinfachtes Chinesisch
PaddleOCR zielt darauf ab, eine umfangreiche, führende und praktische OCR-Toolbibliothek zu erstellen, um Entwicklern dabei zu helfen, bessere Modelle zu trainieren und diese zu implementieren.
PaddleOCR wird von PMC überwacht. Probleme und PRs werden nach bestem Wissen und Gewissen geprüft. Für einen vollständigen Überblick über die PaddlePaddle-Community besuchen Sie bitte Community.
„PaddleOCR 2.9 veröffentlicht, offiziell Open-Source-Tool zur intelligenten Textbildanalyse“, Textbild-Layoutanalyse zur Erzielung hochpräziser Echtzeitvorhersagen, Low-Code-Vollprozessentwicklung zur Beschleunigung industrieller Anwendungen. Integrierte Textbildkorrektur, Layoutbereichserkennung, normale Texterkennung, Siegeltexterkennung, Texterkennung, Formularerkennung und andere Funktionen. Sechs Modellfertigungslinien können mit einem Klick aufgerufen werden, wodurch die Entwicklungskosten deutlich gesenkt werden. Unterstützt mehrere Bereitstellungsmethoden wie Hochleistungsinferenz, servicebasierte Bereitstellung und clientseitige Bereitstellung. Die Live-Übertragung am 24. Oktober (Donnerstag) um 19:00 Uhr bietet Ihnen eine ausführliche Analyse der Highlights des neuesten Upgrades. Registrierungslink
?2024.10.1 Low-Code-Vollprozess-Entwicklungsfunktionen im OCR-Bereich hinzufügen :
? Modellanreicherung mit einem Klick-Aufruf : Integrieren Sie 17 Modelle im Zusammenhang mit der intelligenten Textbildanalyse, der allgemeinen OCR, der allgemeinen Layoutanalyse, der allgemeinen Tabellenerkennung, der Formelerkennung und der Siegeltexterkennung in 6 Modellproduktionslinien über einen minimalistischen Python-API-Schlüsselaufruf Erleben Sie schnell den Modelleffekt. Darüber hinaus unterstützt derselbe API-Satz auch insgesamt mehr als 200 Modelle wie Bildklassifizierung, Zielerkennung, Bildsegmentierung und Zeitreihenvorhersage und bildet mehr als 20 Einzelfunktionsmodule, um Entwicklern die Verwendung von Modellkombinationen zu erleichtern.
? Verbesserung der Effizienz und Senkung der Schwelle : Bietet zwei Methoden, die auf einheitlichen Befehlen und einer grafischen Benutzeroberfläche basieren, um eine einfache und effiziente Verwendung, Kombination und Anpassung von Modellen zu realisieren. Unterstützt mehrere Bereitstellungsmethoden wie Hochleistungsinferenz, servicebasierte Bereitstellung und clientseitige Bereitstellung . Darüber hinaus können Sie bei der Modellentwicklung nahtlos zwischen verschiedenen Mainstream-Hardware wie NVIDIA GPU, Kunlun Core, Ascend, Cambrian und Haiguang wechseln .
PaddleX, ein Low-Code-Entwicklungstool, basiert auf der fortschrittlichen Technologie von PaddleOCR, um Low-Code-Vollprozessentwicklungsfunktionen im OCR-Bereich zu unterstützen:
Unterstützt die Extraktion von Dokumentenszeneninformationen v3PP-ChatOCRv3-doc, ein hochpräzises Layoutbereichserkennungsmodell basierend auf RT-DETR und dem hocheffizienten Layoutbereichserkennungsmodell von PicoDet, das hochpräzise Tabellenstrukturerkennungsmodell SLANet_Plus, das Textbildkorrekturmodell UVDoc und Formel Erkennungsmodell LatexOCR, Klassifizierungsmodell für die Dokumentbildorientierung basierend auf PP-LCNet
?2024.7 Fügen Sie die Champion-Lösung der PaddleOCR Algorithm Model Challenge hinzu :
Wettbewerbsfrage 1: Championlösung für OCR-End-to-End-Erkennungsaufgaben – Szenentexterkennungsalgorithmus-SVTRv2;
Wettbewerbsfrage 2: Die beste Lösung für die allgemeine Tabellenerkennungsaufgabe – Tabellenerkennungsalgorithmus-SLANet-LCNetV2.
Es unterstützt eine Vielzahl von OCR-bezogenen Spitzenalgorithmen und erstellt auf dieser Basis industrietaugliche Charakteristikmodelle PP-OCR, PP-Structure und PP-ChatOCR und verbindet den gesamten Prozess der Datenproduktion, Modellschulung, Komprimierung usw Vorhersagebereitstellung.
Die vollständige Dokumentation finden Sie unter: Dokumente
E-Book „OCR praxisnah erlernen“.
Dieses Projekt wird unter der Apache-Lizenz Version 2.0 veröffentlicht.