يهدف PaddleOCR إلى إنشاء مكتبة أدوات التعرف الضوئي على الحروف الغنية والرائدة والعملية لمساعدة المستخدمين على تدريب نماذج أفضل وتنفيذها.
PP-OCR هو نظام OCR عملي وخفيف الوزن للغاية. يتكون بشكل أساسي من ثلاثة أجزاء: الكشف عن نص قاعدة البيانات، وتصحيح إطار الكشف، والتعرف على نص CRNN. يعتمد النظام 19 استراتيجية فعالة من ثمانية جوانب: اختيار الشبكة الأساسية وتعديلها، وتصميم رأس التنبؤ، وتعزيز البيانات، واستراتيجية تحويل معدل التعلم، واختيار معلمات التنظيم، واستخدام نماذج ما قبل التدريب، واقتصاص النموذج التلقائي وتقديره وتم تقليص حجمه، وأخيرًا تم الحصول على جهاز التعرف الضوئي على الحروف الصيني وإنجليزي خفيف الوزن للغاية بحجم إجمالي يبلغ 3.5 ميجا بايت ونظام التعرف الضوئي على الحروف الرقمي باللغة الإنجليزية يبلغ 2.8 ميجا بايت.
1. نموذج ما قبل التدريب عالي الجودة من سلسلة PPOCR، وتأثير التعرف الدقيق
سلسلة هواتف ppocr_mobile خفيفة الوزن للغاية: الكشف (2.6 ميجا) + مصنف الاتجاه (0.9 ميجا) + التعرف (4.6 ميجا) = 8.1 ميجا
سلسلة ppocr_server العامة: الكشف (47.2 ميجا) + مصنف الاتجاه (0.9 ميجا) + التعرف (107 ميجا) = 155.1 ميجا
سلسلة ضغط خفيفة الوزن للغاية ppocr_mobile_slim: الكشف (1.4M) + مصنف الاتجاه (0.5M) + التعرف (1.6M) = 3.5M
2. دعم التعرف على مجموعة الأرقام الصينية والإنجليزية، والتعرف على النص الرأسي، والتعرف على النص الطويل
3. دعم التعرف على اللغات المتعددة: الكورية واليابانية والألمانية والفرنسية
4. دعم التدريب المحدد من قبل المستخدم وتوفير حلول نشر التفكير التنبؤي الغنية
5. دعم التثبيت والاستخدام السريع PIP
6. يمكن تشغيله على أنظمة Linux وWindows وMacOS وأنظمة أخرى