الإنجليزية |. الصينية المبسطة
يهدف PaddleOCR إلى إنشاء مكتبة أدوات التعرف الضوئي على الحروف الغنية والرائدة والعملية لمساعدة المطورين على تدريب نماذج أفضل وتنفيذها.
تتم مراقبة PaddleOCR بواسطة PMC. سيتم مراجعة القضايا والعلاقات العامة على أساس أفضل جهد. للحصول على نظرة عامة كاملة عن مجتمع PaddlePaddle، يرجى زيارة المجتمع.
??؟"تم إصدار PaddleOCR 2.9، وهي أداة تحليل ذكية للصور النصية مفتوحة المصدر رسميًا"، وتحليل تخطيط الصور النصية لتحقيق تنبؤ عالي الدقة في الوقت الفعلي، وتطوير عملية كاملة منخفضة التعليمات البرمجية لتسريع التطبيقات الصناعية. تصحيح متكامل للصور النصية، والكشف عن منطقة التخطيط، والكشف عن النص العادي، والكشف عن نص الختم، والتعرف على النص، والتعرف على النماذج وغيرها من الوظائف. يمكن استدعاء ستة خطوط إنتاج نموذجية بنقرة واحدة، مما يقلل بشكل كبير من تكاليف التطوير. يدعم طرق نشر متعددة مثل الاستدلال عالي الأداء والنشر القائم على الخدمة والنشر من جانب العميل. سيمنحك البث المباشر الساعة 19:00 يوم 24 أكتوبر (الخميس) تحليلًا متعمقًا لأبرز مميزات التحديث الأخير. رابط التسجيل
?2024.10.1 إضافة إمكانات تطوير عملية كاملة ذات تعليمات برمجية منخفضة في مجال التعرف الضوئي على الحروف :
إثراء النموذج بنقرة واحدة : دمج 17 نموذجًا يتعلق بالتحليل الذكي للصور النصية، والتعرف الضوئي على الحروف العام، وتحليل التخطيط العام، والتعرف على الجدول العام، والتعرف على الصيغة، والتعرف على النص في 6 خطوط إنتاج نموذجية، من خلال استدعاء مفتاح Python API البسيط إلى تجربة تأثير النموذج بسرعة. بالإضافة إلى ذلك، تدعم نفس المجموعة من واجهات برمجة التطبيقات أيضًا ما يزيد عن 200 نموذج مثل تصنيف الصور، واكتشاف الأهداف، وتجزئة الصور، والتنبؤ بالسلاسل الزمنية، مما يشكل أكثر من 20 وحدة أحادية الوظيفة لتسهيل على المطورين استخدام مجموعات النماذج .
تحسين الكفاءة وخفض الحد الأدنى : يوفر طريقتين تعتمدان على أوامر موحدة وواجهة رسومية لتحقيق الاستخدام البسيط والفعال والجمع بين النماذج وتخصيصها. يدعم طرق نشر متعددة مثل الاستدلال عالي الأداء والنشر القائم على الخدمة والنشر من جانب العميل . بالإضافة إلى ذلك، يمكنك التبديل بسلاسة بين الأجهزة السائدة المختلفة مثل NVIDIA GPU وKunlun Core وAscend وCambrian وHaiguang عند تطوير النماذج.
تعتمد PaddleX، وهي أداة تطوير ذات تعليمات برمجية منخفضة، على تقنية PaddleOCR المتقدمة لدعم قدرات تطوير العملية الكاملة ذات التعليمات البرمجية المنخفضة في مجال التعرف الضوئي على الحروف:
يدعم استخراج معلومات مشهد المستند v3PP-ChatOCRv3-doc، ونموذج الكشف عن منطقة التخطيط عالي الدقة استنادًا إلى نموذج اكتشاف منطقة التخطيط عالي الكفاءة RT-DETR وPicoDet، ونموذج التعرف على هيكل الجدول عالي الدقة SLANet_Plus، ونموذج تصحيح الصور النصية UVDoc، والصيغة نموذج التعرف LatexOCR، نموذج تصنيف اتجاه صورة المستند استنادًا إلى PP-LCNet
?2024.7 أضف الحل البطل لتحدي نموذج خوارزمية PaddleOCR :
سؤال المنافسة 1: الحل الرئيسي لمهمة التعرف الضوئي على الحروف (OCR) - خوارزمية التعرف على نص المشهد-SVTRv2؛
سؤال المسابقة 2: الحل الرئيسي لمهمة التعرف على الجدول العامة - خوارزمية التعرف على الجدول-SLANet-LCNetV2.
وهو يدعم مجموعة متنوعة من الخوارزميات المتطورة ذات الصلة بالتعرف الضوئي على الحروف، وعلى هذا الأساس يقوم بإنشاء نماذج مميزة من الدرجة الصناعية PP-OCR وPP-Structure وPP-ChatOCR، ويربط العملية الكاملة لإنتاج البيانات والتدريب النموذجي والضغط والطباعة. نشر التنبؤ.
للحصول على التوثيق الكامل، يرجى الانتقال إلى: docs
الكتاب الإلكتروني "التعلم العملي للتعرف الضوئي على الحروف".
تم إصدار هذا المشروع بموجب ترخيص Apache الإصدار 2.0.