يحتوي هذا الريبو على مجموعات مختلفة من .traineddata
التي يمكن استخدامها بواسطة Tesseract.js. يتضمن ذلك الملفات التي يستخدمها Tesseract.js افتراضيًا، بالإضافة إلى الإصدارات البديلة. يتم شرح محتويات الملفات وكيفية استخدامها مع Tesseract.js أدناه.
يوجد وصف لكل مجموعة من الملفات أدناه. تم إدراج المصدر أيضًا، على الرغم من أن الإصدار المستخدم هنا قد لا يعكس أحدث إصدار من الملفات الموجودة في الريبو المرتبط.
4.0.0_best_int
- النسخة المتكاملة من "Tessdata Best"4.0.0
- "تيسداتا"4.0.0-fast
- "Tessdata سريع"4.0.0_best
- "Tessdata الأفضل"3.0.2
- ملفات Tessdata التاريخية من Tesseract v3 يتم نشر الملفات 4.0.0
و4.0.0_ 4.0.0_best_int
لكل لغة في حزمة NPM خاصة باللغة. كل لغة لها حزمتها الخاصة حيث أن دمجها في حزمة واحدة سيؤدي إلى تنزيل هائل. تتم تسمية الحزم @tesseract.js-data/{lang}
. على سبيل المثال، الحزمة الإنجليزية تحمل اسم @tesseract.js-data/eng
.
راجع وثائق Tesseract.js للحصول على تعليمات حول كيفية ضبط langPath
يدويًا. التفاصيل المتعلقة بمكان العثور على الملفات الموجودة في هذا الريبو أدناه.
يمكن الوصول إلى هذه الملفات باستخدام أي CDN يعكس NPM تلقائيًا. الأمثلة الشعبية أدناه.
بشكل افتراضي، يستخدم Tesseract.js JSDelivr CDN. الرابط للبيانات الإنجليزية الافتراضية على JSDelivr موجود أدناه. https://cdn.jsdelivr.net/npm/@tesseract.js-data/[email protected]/4.0.0_best_int/eng.traineddata.gz
Unpkg هو CDN آخر يعكس NPM. في معظم المناطق، يبدو أن unpkg أقل موثوقية قليلاً من JSDelivr (على الرغم من أنه لا يزال قابلاً للاستخدام). ومع ذلك، أبلغ المستخدمون أن unpkg يمكن الوصول إليه في أجزاء من الصين التي تم حظر JSDelivr فيها، لذا استخدم unpkg لهذا السبب. يمكن العثور هنا على مناقشة حول هذه المشكلة، بالإضافة إلى مثال للتعليمات البرمجية التي تتحول من JSDelivr إلى unkpg
.
الرابط للبيانات الإنجليزية الافتراضية على unkpkg موجود أدناه. https://unpkg.com/@tesseract.js-data/eng/4.0.0_best_int/eng.traineddata.gz
يتمتع المستخدمون بحرية استخدام نسختهم المحلية من هذه الملفات بدلاً من الاعتماد على CDN بعيد. بالنسبة إلى Node.js، يمكنك ببساطة إضافة حزم NPM ذات الصلة باعتبارها تبعية، أو تنزيل الملف وتضمينه كمورد مشروع. بالنسبة لإصدار المتصفح، ما عليك سوى تنزيل الملفات ذات الصلة واستضافتها بنفسك على موقع الويب الخاص بك.
تم استهلاك موقع tessdata.projectnaptha.com
، ولم يعد يتم تحديثه. لا تشير إلى رمز جديد لهذا الموقع.
في الإصدارات القديمة من Tesseract.js، كان موقع langPath
الافتراضي هو موقع صفحات GitHub البسيط الذي يستضيف هذا الريبو. ومع ذلك، بالإضافة إلى إبلاغ المستخدمين بأن صفحات GitHub كانت غير موثوقة، فقد تجاوز هذا الريبو الآن الحد الأقصى لحجم صفحات GitHub. ولذلك، لم يعد يتم تحديث هذا الموقع. يتم ترك الموقع كما هو لتجنب كسر التعليمات البرمجية القديمة، ولكن يتم تشجيع المطورين على التبديل.