الصينية • الإنجليزية • اليابانية
برنامج OCR مجاني ومفتوح المصدر وقابل للدفعات
ينطبق على Windows7 x64، Linux x64
مجاني : جميع الأكواد الموجودة في هذا المشروع مفتوحة المصدر ومجانية تمامًا.
ملائم : قم بفك الضغط والاستخدام، والتشغيل دون الاتصال بالإنترنت، ولا حاجة إلى شبكة.
الكفاءة : يأتي مزودًا بمحرك التعرف الضوئي على الحروف (OCR) عالي الكفاءة دون اتصال بالإنترنت ومكتبات مدمجة للتعرف على اللغات المتعددة.
مرن : يدعم طرق الاتصال الخارجية مثل سطر الأوامر وواجهة HTTP.
الوظائف : التعرف الضوئي على الحروف للقطة الشاشة / التعرف الضوئي على الحروف دفعة واحدة / التعرف على ملفات PDF / رمز الاستجابة السريعة / التعرف على الصيغة
التعرف على لقطة الشاشة
تحليل التنضيد - تحديد أنواع مختلفة من الأنواع وإخراج النص بالترتيب الصحيح
تحديد الدفعة
تجاهل المنطقة - استبعد النص الموجود على العلامة المائية في لقطة الشاشة
يدعم رمز الاستجابة السريعة المسح الضوئي أو إنشاء صور لرمز الاستجابة السريعة
يقوم التعرف على المستندات باستخراج النص من عمليات مسح PDF أو تحويلها إلى ملفات PDF ذات طبقتين يمكن البحث فيها
الإعدادات العالمية
استدعاء سطر الأوامر
واجهة HTTP
بناء المشروع (ويندوز، لينكس)
يرجى التأكد من المطورين قراءة مشاريع البناء.
يتم الاحتفاظ بروابط الإصدار التالية لفترة طويلة وتوفر تنزيلات للإصدارات الثابتة.
سحابة لانزول https://hiroi-sora.lanzoul.com/s/umi-ocr (توصية محلية، بدون تسجيل/سرعة غير محدودة)
جيثب https://github.com/hiroi-sora/Umi-OCR/releases/latest
سورس فورج https://sourceforge.net/projects/umi-ocr
Scoop هو برنامج تثبيت سطر أوامر ضمن Windows يمكنه إدارة تطبيقات متعددة بسهولة. يمكنك تثبيت Scoop أولاً، ثم استخدام الإرشادات التالية لتثبيت Umi-OCR
:
إضافة دلو extras
:
scoop bucket add extras
(اختياري 1) تثبيت Umi-OCR (يأتي مع محرك Rapid-OCR
، توافق جيد):
scoop install extras/umi-ocr
(اختياري 2) تثبيت Umi-OCR (يأتي مع محرك Paddle-OCR
، أسرع قليلاً):
scoop install extras/umi-ocr-paddle
لا تقم بتثبيت كليهما في نفس الوقت، فقد تتم الكتابة فوق الاختصارات. ولكن يمكنك استيراد مكونات إضافية إضافية والتبديل إلى محركات التعرف الضوئي على الحروف المختلفة في أي وقت.
يتم تنزيل حزمة إصدار البرنامج كحزمة مضغوطة .7z
أو حزمة استخراج ذاتي .7z.exe
. يمكن لحزم الاستخراج الذاتي فك ضغط الملفات الموجودة على أجهزة الكمبيوتر التي لم يتم تثبيت برامج الضغط عليها.
هذا البرنامج لا يتطلب التثبيت. بعد فك الضغط، انقر فوق Umi-OCR.exe
لبدء البرنامج.
إذا واجهت أي مشاكل، يرجى إرسال مشكلة وسأبذل قصارى جهدي لمساعدتك.
الواجهة التي يدعمها Umi-OCR متوفرة بلغات متعددة. عند فتح البرنامج لأول مرة، سيتم تبديل اللغة تلقائيًا وفقًا لإعدادات نظام الكمبيوتر الخاص بك.
إذا كنت بحاجة إلى تبديل اللغة يدويًا، فيرجى الرجوع إلى الشكل أدناه،全局设置
→语言/Language
.
يتكون Umi-OCR v2 من سلسلة من علامات التبويب المرنة وسهلة الاستخدام. يمكنك فتح علامات التبويب المطلوبة وفقًا لتفضيلاتك.
يمكنك تبديل النافذة إلى الأعلى في الزاوية اليسرى العليا من شريط علامات التبويب. يمكن قفل علامات التبويب في الزاوية اليمنى العليا لمنع إغلاق علامات التبويب عن طريق الخطأ أثناء الاستخدام اليومي.
Screenshot OCR : بعد فتح هذه الصفحة، يمكنك استخدام مفاتيح الاختصار لاستحضار لقطة الشاشة والتعرف على النص الموجود في الصورة.
في شريط معاينة الصورة الموجود على اليسار، يمكنك التحديد والنسخ مباشرةً باستخدام الماوس.
في عمود سجل التعريف الموجود على اليمين، يمكن تحرير النص ويمكن تحديد سجلات متعددة ونسخها.
كما أنه يدعم نسخ الصور في مكان آخر ولصقها في Umi-OCR للتعرف عليها.
حول وظيفة التعرف على الصيغة
حول المعالجة اللاحقة للنص التعرف الضوئي على الحروف - حل تحليل التنضيد : يمكن تنظيم التنضيد وترتيب نتائج التعرف الضوئي على الحروف لجعل النص أكثر ملاءمة للقراءة والاستخدام. الخطة الافتراضية:
多栏-按自然段换行
: مناسب لمعظم السيناريوهات، ويتعرف تلقائيًا على التخطيط متعدد الأعمدة ويغلف الأسطر وفقًا لقواعد الفقرة الطبيعية.
多栏-总是换行
: يتم تغليف كل عبارة.
多栏-无换行
: يفرض دمج جميع العبارات في نفس السطر.
单栏-按自然段换行
/总是换行
/无换行
: مشابه لما ورد أعلاه، ولكنه لا يميز بين التخطيطات متعددة الأعمدة.
单栏-保留缩进
: مناسب لتحليل لقطات الشاشة للكود، مع الاحتفاظ بالمسافة البادئة في بداية السطر والمسافات الموجودة في السطر.
不做处理
: الإخراج الأصلي لمحرك التعرف الضوئي على الحروف، مع فواصل أسطر لكل عبارة بشكل افتراضي.
يمكن للحلول المذكورة أعلاه التعامل تلقائيًا مع التنضيد الأفقي والرأسي (من اليمين إلى اليسار). (يتطلب النص الرأسي أيضًا دعم محرك التعرف الضوئي على الحروف نفسه)
دفعة التعرف الضوئي على الحروف : يتم استخدام هذه الصفحة لاستيراد الصور المحلية دفعة واحدة للتعرف عليها.
التنسيقات المدعومة: jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff
.
التنسيقات المدعومة لحفظ نتائج التعرف: txt, jsonl, md, csv(Excel)
.
مثل Screen OCR، فهو يدعم وظيفة文本后处理
لتنظيم تخطيط وترتيب نص OCR.
لا يوجد حد أعلى للعدد، ويمكن استيراد مئات الصور في وقت واحد للمهام.
يدعم الإغلاق التلقائي/الاستعداد بعد الانتهاء من المهمة.
إذا كنت تريد التعرف على الصور الطويلة أو الكبيرة ذات وحدات البكسل كبيرة الحجم، فيرجى ضبط: إعدادات الصفحة ← التعرف على النص ← الحد من طول جانب الصورة ← [زيادة القيمة] .
لديه وظيفة خاصة忽略区域
.
حول المعالجة اللاحقة لنص التعرف الضوئي على الحروف - تجاهل المناطق : وظيفة خاصة في التعرف الضوئي على الحروف دفعة واحدة، مناسبة لاستبعاد النص غير المرغوب فيه في الصور.
يمكن إدخال محرر منطقة التجاهل في إعدادات العمود الأيمن لصفحة تعريف الدُفعة.
كما في المثال أعلاه، توجد علامات مائية/شعارات متعددة في الزاوية اليمنى العلوية والسفلية من الصورة. إذا تم التعرف على هذه الصور على دفعات، فسوف تتداخل العلامات المائية مع نتائج التعرف.
اضغط باستمرار على الزر الأيمن وارسم عدة مربعات مستطيلة. سيتم تجاهل النص الموجود داخل هذه المناطق في المهمة.
يرجى محاولة جعل الإطار المستطيل أكبر حجم ممكن لتغطية جميع المواقع المحتملة للعلامة المائية بالكامل.
لاحظ أنه سيتم تجاهل كتلة النص بالكامل داخل مربع منطقة التجاهل (وليس الأحرف الفردية). كما هو موضح في الشكل أدناه، فإن المستطيل الداكن ذو الحدود الصفراء عبارة عن منطقة تم تجاهلها. وبعد ذلك سيتم تجاهل key_mouse
فقط. يتم الاحتفاظ بالكتلتين النصيتين pubsub_connector.py
و pubsub_service.py
.
تحديد الوثيقة :
التنسيقات المدعومة: pdf, xps, epub, mobi, fb2, cbz
.
قم بإجراء التعرف الضوئي على الحروف (OCR) على المستندات الممسوحة ضوئيًا أو استخرج النص الأصلي. يمكن تصديره كملف PDF قابل للبحث في طبقتين .
يدعم إعداد مناطق التجاهل ، والتي يمكن استخدامها لاستبعاد نص الرأس والتذييل.
يمكن ضبطه على إيقاف التشغيل/الإسبات تلقائيًا بعد اكتمال المهمة.
رمز المسح :
التقط لقطة شاشة/الصقها/اسحبها إلى صورة محلية واقرأ رمز الاستجابة السريعة والرمز الشريطي الموجود فيها.
يدعم رموز متعددة لصورة واحدة.
يدعم 19 بروتوكولًا، على النحو التالي:
Aztec
، Codabar
، Code128
، Code39
، Code93
، DataBar
، DataBarExpanded
، DataMatrix
، EAN13
، EAN8
، ITF
، LinearCodes
، MatrixCodes
، MaxiCode
، MicroQRCode
، PDF417
، QRCode
، UPCA
، UPCE
توليد الكود :
أدخل النص وقم بإنشاء صورة رمز الاستجابة السريعة.
يدعم 19 بروتوكولًا ومستويات تصحيح الأخطاء والمعلمات الأخرى.
الإعدادات العامة : هنا يمكنك ضبط المعلمات العامة للبرنامج. الوظائف شائعة الاستخدام هي كما يلي:
أضف اختصارات أو قم بتعيين التشغيل التلقائي عند التشغيل بنقرة واحدة.
تغيير لغة الواجهة . يدعم Umi اللغات الصينية التقليدية والإنجليزية واليابانية وغيرها من اللغات.
تبديل موضوع الواجهة. لدى Umi عدة سمات فاتحة/داكنة.
ضبط حجم وخط نص الواجهة .
قم بتبديل المكون الإضافي للتعرف الضوئي على الحروف (OCR).
العارض : تدعم واجهة البرنامج العرض المتسارع لبطاقة الرسومات بشكل افتراضي. إذا تومض لقطات الشاشة وكانت واجهة المستخدم غير محاذية على جهازك، فيرجى ضبط界面和外观
→渲染器
، أو حاول التبديل إلى نظام عرض مختلف، أو قم بإيقاف تشغيل تسريع الأجهزة.
دليل سطر الأوامر
دليل واجهة HTTP
شكرًا للمترجمين المذكورين أدناه الذين ساهموا في أعمال الترجمة التعريبية لـ Umi-OCR: (مدرجون بدون ترتيب معين)
مترجم | لغة المساهمة |
---|---|
بوب | الإنجليزية، الصينية التقليدية، اليابانية |
كينغزينغ جاو | الإنجليزية، الصينية التقليدية |
ونغ، تشيا لينغ | الإنجليزية، الصينية التقليدية |
com.linzow | الإنجليزية، الصينية التقليدية |
إريك قوه | إنجليزي |
ستيفن0081 | إنجليزي |
ماركوس آي | إنجليزي |
بلوم7x | الصينية التقليدية |
Hugoalh | الصينية التقليدية |
ドコモ光 | اليابانية |
يانغ بنغ | البرتغالية |
إذا كانت هناك معلومات غير صحيحة أو أفراد مفقودون، يرجى الرد في هذه المناقشة.
يستخدم هذا المشروع النظام الأساسي عبر الإنترنت Weblate: Umi-OCR للتعاون في الترجمة التعريبية. نحن نرحب بأي مستخدم للمشاركة في أعمال الترجمة، ويمكنك التدقيق اللغوي أو استكمال اللغات الموجودة أو إضافة لغات جديدة.
المستودع الرئيسي؟
مكتبة المكونات الإضافية
وقت تشغيل ويندوز
وقت تشغيل لينكس
تشير اللاحقة **
إلى المحتوى الموجود في هذا المستودع (主仓库
).
Umi-OCR ├─ Umi-OCR.exe ├─ umi-ocr.sh └─ UmiOCR-data ├─ main.py ** ├─ version.py ** ├─ qt_res ** │ └─ 项目qt资源,包括图标和qml源码 ├─ py_src ** │ └─ 项目python源码 ├─ plugins │ └─ 插件 └─ i18n ** └─ 翻译文件
محركات التعرف الضوئي على الحروف غير المتصلة بالإنترنت المدعومة:
PaddleOCR-json
RapidOCR-json
إطار بيئة التشغيل:
نسخة مخصصة من PyStand
يرجى الرجوع إلى التعليمات الموجودة في بداية سجل التغيير.
يرجى الانتقال إلى المستودع التالي لإكمال نشر بيئة التطوير/التشغيل للنظام الأساسي المقابل.
ويندوز
لينكس
تم تطوير مشروع Umi-OCR وصيانته بشكل أساسي بواسطة المؤلف hiroi-sora في أوقات فراغه. إذا كنت تحب هذا البرنامج، يرجى رعايته.
يمكن للمستخدمين المحليين رعاية المؤلفين من خلال iPower.
إطار علامة التبويب.
وحدة تحكم واجهة برمجة تطبيقات التعرف الضوئي على الحروف (OCR).
وحدة التحكم في مهام التعرف الضوئي على الحروف (OCR).
يدعم مدير السمات التبديل بين السمات الفاتحة والداكنة.
تنفيذ دفعة التعرف الضوئي على الحروف .
تنفيذ لقطة الشاشة OCR .
آلية مفتاح الاختصار.
قائمة علبة النظام.
كتلة النص بعد المعالجة (تحسين التنضيد).
تنظيف ذاكرة المحرك.
واجهة البرنامج متاحة بلغات متعددة.
وضع سطر الأوامر.
متوافق مع Win7.
تنسيق إخراج Excel (csv).
Esc
يقاطع عملية لقطة الشاشة
ملفات المواضيع الخارجية
تبديل الخط
تحميل الرسوم المتحركة
تجاهل المنطقة.
التعرف على رمز الاستجابة السريعة.
نافذة معاينة الصورة لصفحة التعرف على الدفعة.
التعرف على قوات الدفاع الشعبي.
اتصل بمتصفح الصور المحلي لفتح الصورة. #335
كرر لقطة الشاشة الأخيرة. #357
إصلاح الخلل: مشكلة توافق التعرف على المستندات في نظام Windows 7.
تضيف واجهة HTTP/سطر الأوامر وظيفة التعرف على رمز الاستجابة السريعة/إنشاءها. (#423)
توثيق واجهة رمز الاستجابة السريعة.
نقل منصة لينكس.
واجهة التعرف على مستندات HTTP.
هذه هي الوظائف المتوقعة التي تم حجزها في المراحل الأولى من التطوير وسيتم تنفيذها ببطء على المدى الطويل.
ومع ذلك، نظرًا للظروف الفعلية أثناء التطوير، قد يتم تغيير التصميم الوظيفي، ويمكن إضافة وظائف أو إلغاؤها.
إعادة هيكلة آلية المكونات الإضافية الأساسية.
البرنامج الإضافي لـ OCR API عبر الإنترنت.
مكون إضافي مستقل للتعرف على الصيغة الرياضية.
توفر علامة التبويب "الصيغة الرياضية" التعرف المستقل على الصيغة الرياضية/عرض اللاتكس.
التحقق من آلية التحديث.
وحدات ما بعد معالجة النص بخلاف تحليل التنضيد (مثل الحفاظ على الأرقام، وتحويل الأحرف بنصف العرض، وتصحيح أخطاء النص).
تضيف وظائف الواجهة الرئيسية طرقًا لبدء الأحداث.
تقنية التعرف الضوئي على الحروف (OCR) المعتمدة على وحدة معالجة الرسومات (GPU).
ترجمة الصور
الترجمة حاليا.
التعرف على المنطقة الثابتة.
التعرف على صور الجدول وإخراجها إلى Excel.
نظام تسجيل التاريخ.
متوافق مع MacOS / Ubuntu والأنظمة الأساسية الأخرى.