يهدف PaddleOCR إلى إنشاء مكتبة أدوات OCR غنية ورائدة وعملية لمساعدة المستخدمين على تدريب نماذج أفضل وتنفيذ التطبيقات.
PP-OCR هو نظام OCR عملي وخفيف الوزن للغاية. يتكون بشكل أساسي من ثلاثة أجزاء: الكشف عن نص قاعدة البيانات، وتصحيح إطار الكشف، والتعرف على نص CRNN. يعتمد النظام 19 استراتيجية فعالة من 8 جوانب: اختيار الشبكة الأساسية وتعديلها، تصميم رأس التنبؤ، تحسين البيانات، استراتيجية تحويل معدل التعلم، اختيار معلمات التنظيم، استخدام نموذج ما قبل التدريب، واقتصاص النموذج التلقائي وتقديره تم تقليص حجمه، وأخيرًا تم الحصول على جهاز التعرف الضوئي على الحروف الصيني وإنجليزي خفيف الوزن للغاية بحجم إجمالي يبلغ 3.5 ميجا بايت ونظام التعرف الضوئي على الحروف الرقمي باللغة الإنجليزية يبلغ 2.8 ميجا بايت.
1. نموذج ما قبل التدريب عالي الجودة من سلسلة PPOCR، وتأثير التعرف الدقيق
سلسلة هواتف ppocr_mobile خفيفة الوزن للغاية: الكشف (2.6 ميجا) + مصنف الاتجاه (0.9 ميجا) + التعرف (4.6 ميجا) = 8.1 ميجا
سلسلة ppocr_server العامة: الكشف (47.2 ميجا) + مصنف الاتجاه (0.9 ميجا) + التعرف (107 ميجا) = 155.1 ميجا
سلسلة ضغط خفيفة الوزن للغاية ppocr_mobile_slim: الكشف (1.4M) + مصنف الاتجاه (0.5M) + التعرف (1.6M) = 3.5M
2. دعم التعرف على مجموعة الأرقام الصينية والإنجليزية، والتعرف على النص الرأسي، والتعرف على النص الطويل
3. دعم التعرف على اللغات المتعددة: الكورية واليابانية والألمانية والفرنسية
4. دعم التدريب المحدد من قبل المستخدم وتوفير حلول نشر الاستدلال التنبؤي الغنية
5. دعم التثبيت والاستخدام السريع PIP
6. يمكن تشغيله على أنظمة Linux وWindows وMacOS وأنظمة أخرى