تنزيل Umi OCR - تنزيل كود مصدر Umi OCR

Umi OCR

شفرة المصدر الأخرى

v2.1.4

تنزيل

الصينية • الإنجليزية • اليابانية

QQ浏览器截图20241118145224.png

أداة التعرف على النص Umi-OCR

تعليمات الاستخدام • عنوان التنزيل • سجل التحديث • الإبلاغ عن خطأ

برنامج OCR مجاني ومفتوح المصدر وقابل للدفعات
_{ينطبق على Windows7 x64، Linux x64}

مجاني : جميع التعليمات البرمجية في هذا المشروع مفتوحة المصدر ومجانية تمامًا.
ملائم : قم بفك الضغط والاستخدام، والتشغيل دون الاتصال بالإنترنت، ولا حاجة إلى شبكة.
الكفاءة : يأتي مزودًا بمحرك التعرف الضوئي على الحروف عالي الكفاءة دون اتصال بالإنترنت ومكتبات مدمجة للتعرف على اللغات المتعددة.
مرن : يدعم طرق الاتصال الخارجية مثل سطر الأوامر وواجهة HTTP.
الوظائف : التعرف الضوئي على الحروف للقطة الشاشة / التعرف الضوئي على الحروف دفعة واحدة / التعرف على ملفات PDF / رمز الاستجابة السريعة / التعرف على الصيغة

جدول المحتويات

التعرف على لقطة الشاشة

تحليل التنضيد - تحديد أنواع مختلفة من الأنواع وإخراج النص بالترتيب الصحيح

تحديد الدفعة

تجاهل المنطقة - استبعد النص الموجود على العلامة المائية في لقطة الشاشة

يدعم رمز الاستجابة السريعة المسح الضوئي أو إنشاء صور رمز الاستجابة السريعة
يقوم التعرف على المستندات باستخراج النص من عمليات مسح PDF أو تحويلها إلى ملفات PDF ذات طبقتين يمكن البحث فيها
الإعدادات العالمية
استدعاء سطر الأوامر
واجهة HTTP
بناء المشروع (ويندوز، لينكس)

استخدم كود المصدر

يرجى التأكد من المطورين قراءة مشاريع البناء.

تحميل التوزيعة

يتم الاحتفاظ بروابط الإصدار التالية لفترة طويلة وتوفر تنزيلات للإصدارات الثابتة.

سحابة لانزول https://hiroi-sora.lanzoul.com/s/umi-ocr (توصية محلية، بدون تسجيل/سرعة غير محدودة)
جيثب https://github.com/hiroi-sora/Umi-OCR/releases/latest
سورس فورج https://sourceforge.net/projects/umi-ocr

• Scoop Installer (انقر للتوسيع)

Scoop هو برنامج تثبيت سطر أوامر ضمن Windows يمكنه إدارة تطبيقات متعددة بسهولة. يمكنك تثبيت Scoop أولاً، ثم استخدام الإرشادات التالية لتثبيت Umi-OCR :

إضافة دلو extras :

scoop bucket add extras

(اختياري 1) تثبيت Umi-OCR (يأتي مع محرك Rapid-OCR ، توافق جيد):

scoop install extras/umi-ocr

(اختياري 2) تثبيت Umi-OCR (يأتي مع محرك Paddle-OCR ، أسرع قليلاً):

scoop install extras/umi-ocr-paddle

لا تقم بتثبيت كليهما في نفس الوقت، فقد تتم الكتابة فوق الاختصارات. ولكن يمكنك استيراد مكونات إضافية إضافية والتبديل إلى محركات التعرف الضوئي على الحروف المختلفة في أي وقت.

ابدأ

يتم تنزيل حزمة إصدار البرنامج كحزمة مضغوطة .7z أو حزمة استخراج ذاتي .7z.exe . يمكن لحزم الاستخراج الذاتي فك ضغط الملفات الموجودة على أجهزة الكمبيوتر التي لم يتم تثبيت برامج الضغط عليها.

هذا البرنامج لا يتطلب التثبيت. بعد فك الضغط، انقر فوق Umi-OCR.exe لبدء البرنامج.

إذا واجهت أي مشاكل، يرجى إرسال مشكلة وسأبذل قصارى جهدي لمساعدتك.

لغة الواجهة

الواجهة التي يدعمها Umi-OCR متوفرة بلغات متعددة. عند فتح البرنامج لأول مرة، سيتم تبديل اللغة تلقائيًا وفقًا لإعدادات نظام الكمبيوتر الخاص بك.

إذا كنت بحاجة إلى تبديل اللغة يدويًا، فيرجى الرجوع إلى الشكل أدناه،全局设置→语言/Language .

صفحة علامة التبويب

يتكون Umi-OCR v2 من سلسلة من علامات التبويب المرنة وسهلة الاستخدام. يمكنك فتح علامات التبويب المطلوبة وفقًا لتفضيلاتك.

يمكنك تبديل النافذة إلى الأعلى في الزاوية اليسرى العليا من شريط علامات التبويب. يمكن قفل علامات التبويب في الزاوية اليمنى العليا لمنع إغلاق علامات التبويب عن طريق الخطأ أثناء الاستخدام اليومي.

لقطة شاشة التعرف الضوئي على الحروف

Screenshot OCR : بعد فتح هذه الصفحة، يمكنك استخدام مفاتيح الاختصار لاستحضار لقطة الشاشة والتعرف على النص الموجود في الصورة.

في شريط معاينة الصورة الموجود على اليسار، يمكنك التحديد والنسخ مباشرةً باستخدام الماوس.
في عمود سجل التعريف الموجود على اليمين، يمكن تحرير النص ويمكن تحديد سجلات متعددة ونسخها.
كما أنه يدعم نسخ الصور في مكان آخر ولصقها في Umi-OCR للتعرف عليها.
حول وظيفة التعرف على الصيغة

معالجة النص بعد

حول المعالجة اللاحقة للنص التعرف الضوئي على الحروف - حل تحليل التنضيد : يمكن تنظيم التنضيد وترتيب نتائج التعرف الضوئي على الحروف لجعل النص أكثر ملاءمة للقراءة والاستخدام. الخطة الافتراضية:

多栏-按自然段换行: مناسب لمعظم السيناريوهات، ويتعرف تلقائيًا على التخطيط متعدد الأعمدة ويغلف الأسطر وفقًا لقواعد الفقرة الطبيعية.
多栏-总是换行: يتم تغليف كل عبارة.
多栏-无换行: يفرض دمج جميع العبارات في نفس السطر.
单栏-按自然段换行/总是换行/无换行: مشابه لما ورد أعلاه، ولكنه لا يميز بين التخطيطات متعددة الأعمدة.
单栏-保留缩进: مناسب لتحليل لقطات الشاشة للكود، مع الاحتفاظ بالمسافة البادئة في بداية السطر والمسافات الموجودة في السطر.
不做处理: الإخراج الأصلي لمحرك التعرف الضوئي على الحروف، مع فواصل الأسطر لكل عبارة بشكل افتراضي.

يمكن للحلول المذكورة أعلاه التعامل تلقائيًا مع التنضيد الأفقي والرأسي (من اليمين إلى اليسار). (يتطلب النص الرأسي أيضًا دعم محرك التعرف الضوئي على الحروف نفسه)

دفعة التعرف الضوئي على الحروف

دفعة التعرف الضوئي على الحروف : يتم استخدام هذه الصفحة لاستيراد الصور المحلية دفعة واحدة للتعرف عليها.

التنسيقات المدعومة: jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff .
التنسيقات المدعومة لحفظ نتائج التعرف: txt, jsonl, md, csv(Excel) .
مثل Screen OCR، فهو يدعم وظيفة文本后处理لتنظيم تخطيط وترتيب نص OCR.
لا يوجد حد أعلى للعدد، ويمكن استيراد مئات الصور في وقت واحد للمهام.
يدعم الإغلاق التلقائي/الاستعداد بعد الانتهاء من المهمة.
إذا كنت تريد التعرف على الصور الطويلة أو الكبيرة ذات وحدات البكسل كبيرة الحجم، فيرجى ضبط: إعدادات الصفحة ← التعرف على النص ← تحديد طول جانب الصورة ← [زيادة القيمة] .
لديه وظيفة خاصة忽略区域.

تجاهل المنطقة

حول المعالجة اللاحقة لنص التعرف الضوئي على الحروف - تجاهل المناطق : وظيفة خاصة في التعرف الضوئي على الحروف دفعة واحدة، مناسبة لاستبعاد النص غير المرغوب فيه في الصور.

يمكن إدخال محرر منطقة التجاهل في إعدادات العمود الأيمن لصفحة تعريف الدُفعة.
كما في المثال أعلاه، توجد علامات مائية/شعارات متعددة في الزاوية اليمنى العلوية والسفلية من الصورة. إذا تم التعرف على هذه الصور على دفعات، فسوف تتداخل العلامات المائية مع نتائج التعرف.
اضغط باستمرار على الزر الأيمن وارسم عدة مربعات مستطيلة. سيتم تجاهل النص الموجود داخل هذه المناطق في المهمة.
يرجى محاولة جعل الإطار المستطيل أكبر حجم ممكن لتغطية جميع المواقع المحتملة للعلامة المائية بالكامل.
لاحظ أنه سيتم تجاهل كتلة النص بالكامل داخل مربع منطقة التجاهل (وليس الأحرف الفردية). كما هو موضح في الشكل أدناه، فإن المستطيل الداكن ذو الحدود الصفراء عبارة عن منطقة تم تجاهلها. وبعد ذلك سيتم تجاهل key_mouse فقط. يتم الاحتفاظ بالكتلتين النصيتين pubsub_connector.py و pubsub_service.py .

68747470733a2f2f74757069616e2e6c692f696d616765732f323032342f30352f33302f363635383762663033616531352e706e67.png

التعرف على المستندات

تحديد الوثيقة :

التنسيقات المدعومة: pdf, xps, epub, mobi, fb2, cbz .
قم بإجراء التعرف الضوئي على الحروف (OCR) على المستندات الممسوحة ضوئيًا أو استخرج النص الأصلي. يمكن تصديره كملف PDF قابل للبحث في طبقتين .
يدعم إعداد مناطق التجاهل ، والتي يمكن استخدامها لاستبعاد نص الرأس والتذييل.
يمكن ضبطه على إيقاف التشغيل/الإسبات تلقائيًا بعد اكتمال المهمة.

رمز الاستجابة السريعة

رمز المسح :

التقط لقطة شاشة/الصقها/اسحبها إلى صورة محلية واقرأ رمز الاستجابة السريعة والرمز الشريطي الموجود فيها.
يدعم رموز متعددة لصورة واحدة.
يدعم 19 بروتوكولًا، على النحو التالي:

Aztec ، Codabar ، Code128 ، Code39 ، Code93 ، DataBar ، DataBarExpanded ، DataMatrix ، EAN13 ، EAN8 ، ITF ، LinearCodes ، MatrixCodes ، MaxiCode ، MicroQRCode ، PDF417 ، QRCode ، UPCA ، UPCE

توليد الكود :

أدخل النص وقم بإنشاء صورة رمز الاستجابة السريعة.
يدعم 19 بروتوكولًا ومستويات تصحيح الأخطاء والمعلمات الأخرى.

الإعدادات العالمية

الإعدادات العامة : هنا يمكنك ضبط المعلمات العامة للبرنامج. الوظائف شائعة الاستخدام هي كما يلي:

أضف اختصارات أو قم بتعيين التشغيل التلقائي عند التشغيل بنقرة واحدة.
تغيير لغة الواجهة . يدعم Umi اللغات الصينية التقليدية والإنجليزية واليابانية وغيرها من اللغات.
تبديل موضوع الواجهة. لدى Umi عدة سمات فاتحة/داكنة.
ضبط حجم وخط نص الواجهة .
قم بتبديل المكون الإضافي للتعرف الضوئي على الحروف (OCR).
العارض : تدعم واجهة البرنامج العرض المتسارع لبطاقة الرسومات بشكل افتراضي. إذا تومض لقطات الشاشة وكانت واجهة المستخدم غير محاذية على جهازك، فيرجى ضبط界面和外观→渲染器، أو حاول التبديل إلى نظام عرض مختلف، أو قم بإيقاف تشغيل تسريع الأجهزة.

واجهة المكالمة:

دليل سطر الأوامر
دليل واجهة HTTP

ترجمة تعريب البرمجيات:

شكرًا للمترجمين المذكورين أدناه الذين ساهموا في الترجمة التعريبية لـ Umi-OCR: (مدرجون بدون ترتيب معين)

مترجم	لغة المساهمة
بوب	الإنجليزية، الصينية التقليدية، اليابانية
كينغزينغ جاو	الإنجليزية، الصينية التقليدية
ونغ، تشيا لينغ	الإنجليزية، الصينية التقليدية
com.linzow	الإنجليزية، الصينية التقليدية
إريك قوه	إنجليزي
ستيفن0081	إنجليزي
ماركوس آي	إنجليزي
بلوم7x	الصينية التقليدية
Hugoalh	الصينية التقليدية
ドコモ光	اليابانية
يانغ بنغ	البرتغالية

إذا كانت هناك معلومات غير صحيحة أو أفراد مفقودون، يرجى الرد في هذه المناقشة.

يستخدم هذا المشروع النظام الأساسي عبر الإنترنت Weblate: Umi-OCR للتعاون في الترجمة التعريبية. نحن نرحب بأي مستخدم للمشاركة في أعمال الترجمة، ويمكنك التدقيق اللغوي أو استكمال اللغات الموجودة أو إضافة لغات جديدة.

حول هيكل المشروع

كل مستودع:

المستودع الرئيسي؟
مكتبة المكونات الإضافية
وقت تشغيل ويندوز
وقت تشغيل لينكس

الهيكل الهندسي:

تشير اللاحقة ** إلى المحتوى الموجود في هذا المستودع (主仓库).

Umi-OCR
├─ Umi-OCR.exe
├─ umi-ocr.sh
└─ UmiOCR-data
   ├─ main.py **
   ├─ version.py **
   ├─ qt_res **
   │  └─ 项目qt资源，包括图标和qml源码
   ├─ py_src **
   │  └─ 项目python源码
   ├─ plugins
   │  └─ 插件
   └─ i18n **
      └─ 翻译文件

محركات التعرف الضوئي على الحروف غير المتصلة بالإنترنت المدعومة:

PaddleOCR-json
RapidOCR-json

إطار بيئة التشغيل:

نسخة مخصصة من PyStand

بناء المشروع

الخطوة 0: (اختياري) افصل هذا المشروع

الخطوة 1: تنزيل الكود

يرجى الرجوع إلى التعليمات الموجودة في بداية سجل التغيير.

الخطوات التالية:

يرجى الانتقال إلى المستودع التالي لإكمال نشر بيئة التطوير/التشغيل للنظام الأساسي المقابل.

ويندوز
لينكس

راعي

تم تطوير مشروع Umi-OCR وصيانته بشكل أساسي بواسطة المؤلف hiroi-sora في أوقات فراغه. إذا كنت تحب هذا البرنامج، يرجى رعايته.

يمكن للمستخدمين المحليين رعاية المؤلفين من خلال iPower.

تاريخ النجوم

تغيير السجل

خطة التنمية

الانتهاء من العمل

إطار علامة التبويب.
وحدة تحكم واجهة برمجة تطبيقات التعرف الضوئي على الحروف (OCR).
وحدة التحكم في مهام التعرف الضوئي على الحروف (OCR).
يدعم مدير السمات التبديل بين السمات الفاتحة والداكنة.
تنفيذ دفعة التعرف الضوئي على الحروف .
تنفيذ لقطة الشاشة OCR .
آلية مفتاح الاختصار.
قائمة علبة النظام.
كتلة النص بعد المعالجة (تحسين التنضيد).
تنظيف ذاكرة المحرك.
واجهة البرنامج متاحة بلغات متعددة.
وضع سطر الأوامر.
متوافق مع Win7.
تنسيق إخراج Excel (csv).
Esc يقاطع عملية لقطة الشاشة
ملفات المواضيع الخارجية
تبديل الخط
تحميل الرسوم المتحركة
تجاهل المنطقة.
التعرف على رمز الاستجابة السريعة.
نافذة معاينة الصورة لصفحة تعريف الدفعة.
التعرف على قوات الدفاع الشعبي.
اتصل بمتصفح الصور المحلي لفتح الصورة. #335
كرر لقطة الشاشة الأخيرة. #357
إصلاح الخلل: مشكلة توافق التعرف على المستندات في نظام Windows 7.
تضيف واجهة HTTP/سطر الأوامر وظيفة التعرف على رمز الاستجابة السريعة/إنشاءها. (#423)
وثائق لواجهة رمز الاستجابة السريعة.
نقل منصة لينكس.
واجهة التعرف على مستندات HTTP.

التخطيط المستقبلي

يوسع

هذه هي الوظائف المتوقعة التي تم حجزها في المراحل الأولى من التطوير وسيتم تنفيذها ببطء على المدى الطويل.

ومع ذلك، نظرًا للظروف الفعلية أثناء التطوير، قد يتم تغيير التصميم الوظيفي، ويمكن إضافة وظائف أو إلغاؤها.

إعادة هيكلة آلية المكونات الإضافية الأساسية.
البرنامج الإضافي لـ OCR API عبر الإنترنت.
مكون إضافي مستقل للتعرف على الصيغة الرياضية.
توفر علامة التبويب "الصيغة الرياضية" التعرف المستقل على الصيغة الرياضية/عرض اللاتكس.
التحقق من آلية التحديث.
وحدات ما بعد معالجة النص بخلاف تحليل التنضيد (مثل الحفاظ على الأرقام، وتحويل الأحرف بنصف العرض، وتصحيح أخطاء النص).
تضيف وظائف الواجهة الرئيسية طرقًا لبدء الأحداث.
تقنية التعرف الضوئي على الحروف (OCR) المعتمدة على وحدة معالجة الرسومات (GPU).
ترجمة الصور
الترجمة حاليا.
التعرف على المنطقة الثابتة.
تحديد صور الجدول وإخراجها إلى Excel.
نظام تسجيل التاريخ.
متوافق مع MacOS / Ubuntu والأنظمة الأساسية الأخرى.

يوسع

معلومات إضافية

الإصدار v2.1.4
النوع شفرة المصدر الأخرى
وقت التحديث 2024-11-21
الحجم 50MB
من Github

تطبيقات ذات صلة

تطبيق الماسح الضوئي OCR

2023-09-03
تطبيق ويسكر OCR

2023-07-06
تطبيق استخراج النصوص OCR

2023-06-26
الماسح الضوئي للملك عز وجل OCR

2023-04-12
سيد المسح الضوئي OCR

2023-04-12
مسح OCR بنقرة واحدة

2023-04-11

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
SmartTube

شفرة المصدر الأخرى

24.71 Stable
Sunamu

شفرة المصدر الأخرى

Release 2.2.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
termwind

فئات أخرى

v2.3.0
wp functions

فئات أخرى

1.0.0

أخبار ذات صلة الكل