تحسين إمكانية الوصول من خلال التعرف السلس على الشاشة
مرحبًا بك في VOCR
اكتشف الإمكانات المتطورة لـ VOCR، أداة التعرف على الشاشة المدعمة بالذكاء الاصطناعي والتعرف الضوئي على الحروف (OCR) والمصممة لتعزيز تجربة الوصول الرقمي لديك. بالإضافة إلى ميزة التنقل البسيطة مع التعرف الضوئي على الحروف، يتكامل VOCR بسلاسة مع VoiceOver، مما يتيح للمستخدمين التقاط محتوى الشاشة والتعرف عليه بسهولة باستخدام اختصارات بديهية وقابلة للتخصيص. بفضل ميزات مثل التعرف الضوئي على الحروف في الوقت الحقيقي، يمكن للمستخدمين مراقبة المحتوى المباشر وقراءته بشكل مستمر، مثل الترجمة. تتيح لك وظيفة ASK AI الاستفادة من نماذج الذكاء الاصطناعي المتقدمة، بما في ذلك OpenAI GPT لطرح أسئلة مفصلة حول الصور والحصول على إجابات ثاقبة. كما أنه يدعم نماذج لغة الرؤية المحلية عبر Ollama لخصوصيتك. يأخذ الاستكشاف باستخدام الذكاء الاصطناعي خطوة أخرى إلى الأمام من خلال تحليل الصور وتحديد المناطق المختلفة وتقديم أوصاف شاملة.
توفر مجموعة ميزات VOCR القوية تحكمًا ودقة لا مثيل لهما، مما يجعلها أداة لا غنى عنها للمستخدمين الذين يبحثون عن حل التعرف الضوئي على الحروف (OCR) الذي يتميز بالسلاسة والفعالية والفعالية العالية. سواء كنت تتنقل بين التطبيقات التي يتعذر الوصول إليها أو كنت مهتمًا بالصور، فإن VOCR يمكّنك من القيام بالمزيد بسهولة وثقة.
تحذير : استخدمه على مسؤوليتك الخاصة!
يتم توزيع VOCR على أمل أن يكون مفيدًا، ولكن دون أي ضمان، صريحًا أو ضمنيًا، لقابلية التسويق أو الملاءمة لغرض معين. يرجى الاطلاع على رخصة جنو العامة لمزيد من التفاصيل.
تحميل
هنا هو الرابط المباشر لتحميل VOCR v2.0.1.
يثبت
لضمان عمل VOCR بشكل صحيح، من الضروري اتباع كل خطوة بدقة. يمكن أن يؤدي فقدان خطوة واحدة إلى منع VOCR من العمل بشكل صحيح.
- بعد فك ضغط الملف المضغوط الذي تم تنزيله، انقل التطبيق إلى مجلد التطبيقات وقم بتشغيله.
- تأكد من تشغيل VOCR في شريط القائمة بالضغط على vo+m مرتين.
- في أداة VoiceOver، ضمن الفئة "عام"، حدد المربع "السماح بالتحكم في VoiceOver باستخدام AppleScript".
- إذا كان نشطًا، فأوقف ستارة الشاشة باستخدام vo+shift+f11. لاحظ أنه يجب إيقاف ستارة الشاشة حتى يعمل التطبيق بشكل صحيح.
- إخفاء مرئيات VoiceOver باستخدام vo+command+f11 إذا تم عرضها. إذا لم تكن مخفية، فسيتم التعرف على عناصر مثل لوحة التسمية التوضيحية لـ VoiceOver بالإضافة إلى محتوى الشاشة الآخر.
- اضغط على Command+Shift+Control+W. يجب أن تتلقى إشعارًا يطلب إذن الوصول. إذا لم يركز VoiceOver تلقائيًا على النافذة، فاضغط على vo+f1 مرتين لعرض قائمة التطبيقات قيد التشغيل حاليًا؛ يجب أن يكون مربع حوار النظام في هذه القائمة.
- بعد منح إذن الوصول، اضغط على Command+shift+control+w مرة أخرى لتلقي إشعار يطلب إذنًا لـ VOCR لالتقاط لقطة شاشة. إذا لم تتلق التنبيه، فحدد موقع مربع حوار النظام كما هو موضح سابقًا.
- إذا لم تتمكن من تحديد موقع مربع حوار النظام، فانتقل إلى إعدادات النظام، ثم الخصوصية والأمان، ثم اختر تسجيل الشاشة، وابحث عن تطبيق VOCR.
- بعد منح إذن الوصول، أعد تشغيل التطبيق كما هو مطلوب.
- تحقق من وجود التطبيق في شريط القائمة بالضغط على vo+m مرتين.
- اضغط على Command+Shift+Control+W. من المفترض أن تسمع صوت تنبيه ومطالبة صوتية تقول "انتهى".
- يمكنك الآن التنقل بين النتائج التي تم التعرف عليها باستخدام الأمر+التحكم+الأسهم. راجع قسم الاختصارات أدناه لمزيد من المعلومات.
- عند التنقل بين النتائج للمرة الأولى، سيطالبك تنبيه بالسماح لـ VOCR بالتحكم في VoiceOver لنطق الإعلانات.
- اضغط على Escape للخروج من وضع التنقل في VOCR وتحرير اختصارات التنقل.
مؤشر OCR VoiceOver
تعد هذه الميزة مفيدة لالتقاط أجزاء معينة من الشاشة، مثل مشغل فيديو على صفحة ويب أو صور على وسائل التواصل الاجتماعي.
- حرك مؤشر VoiceOver إلى العنصر الذي تريد التعرف عليه.
- اضغط على Command+Shift+Control+V.
- في المرة الأولى التي تستخدم فيها هذه الميزة، ستتلقى تنبيهًا للسماح لـ VOCR بتشغيل AppleScript.
- بعد منح الإذن، اضغط على Command+shift+control+v مرة أخرى.
التعرف الضوئي على الحروف في الوقت الحقيقي
اضغط على Command+Shift+Control+R بعد مسح نافذة أو استخدام VOCursor لبدء أو إيقاف التعرف الضوئي على الحروف في الوقت الحقيقي. عند تفعيله، سيقوم VOCR بمسح المحتوى الجديد فقط والإبلاغ عنه بشكل مستمر. وهذا مفيد لقراءة المحتوى المباشر مثل الترجمة.
إعداد نموذج الذكاء الاصطناعي
يمكنك استضافة نموذج لغة الرؤية الخاص بك باستخدام Ollama أو استخدام OpenAI GPT لطرح أسئلة حول الصور الملتقطة باستخدام VOCR.
لاستخدام نموذج OpenAI GPT:
- شراء أرصدة API لحسابك.
- قم بإنشاء مفتاح OpenAI API.
- أدخل مفتاح OpenAI API الخاص بك في قائمة VOCR: الإعدادات > المحرك > مفتاح OpenAI API.
ملاحظة: قد يستغرق الأمر عدة ساعات حتى تصبح واجهة برمجة التطبيقات (API) الخاصة بك نشطة بعد شراء الاعتمادات.
تكلفة الاستخدام من VOCR هي تكلفة تقديرية. لمعرفة الاستخدام الرسمي والتكلفة، يرجى الرجوع إلى لوحة معلومات الاستخدام على موقع OpenAI.
للاستفادة من نموذج لغة الرؤية المحلية مع Ollama:
تطبيق Olma مجاني وخاص، ولكنه أقل دقة ويتطلب قدرًا كبيرًا من القوة الحاسوبية. أوصي بشريحة M1 أو الإصدارات الأحدث بذاكرة لا تقل عن 16 جيجابايت.
قم بتنزيل وتثبيت أولاما.
قم بتنزيل نموذج متعدد الوسائط (لغة الرؤية) عن طريق تنفيذ الأمر التالي في جهازك الطرفي:
لاحظ أن هناك أيضًا طرازات llava:13b
و llava:34b
، والتي توفر دقة أعلى ولكنها تتطلب مساحة تخزين وذاكرة وقوة حوسبة أكبر.
قد ترغب أيضًا في تجربة تطبيق ذي صلة يسمى VOLlama. إنه عميل دردشة يمكن الوصول إليه لـ Ollama، مما يسمح لك بالتفاعل بسهولة مع نموذج لغة كبير مفتوح المصدر يتم تشغيله محليًا على جهاز الكمبيوتر الخاص بك.
اسأل منظمة العفو الدولية
بعد إعداد OpenAI و/أو Ollama:
- اختر Ollama أو GPT في قائمة VOCR > الإعدادات > المحرك.
- قم بمسح نافذة/مؤشر VOC أو التقط صورة من الكاميرا.
- اضغط على Command+Shift+Control+A لطرح سؤال على النموذج المحدد حول الصورة.
سيتم نسخ الرد إلى الحافظة حتى تتمكن من مراجعته في حالة تفويته.
يمكنك أيضًا تحديد ملف صورة في Finder، وإظهار القائمة السياقية باستخدام VO+Shift+M، والانتقال إلى "فتح باستخدام"، واختيار VOCR لطرح سؤال حول الصورة.
استكشف باستخدام الذكاء الاصطناعي
- اختر GPT في قائمة VOCR > الإعدادات > المحرك.
- قم بتوفير مفتاح OpenAI API الخاص بك في قائمة VOCR > الإعدادات > المحرك > مفتاح OpenAI API.
- قم بمسح نافذة أو استخدم VOCursor.
- اضغط على Command+Shift+Control+E.
سيطلب VOCR من GPT تحليل الصورة وتحديد المناطق المختلفة ووصف محتويات كل منها. يمكنك التنقل بين النتائج باستخدام الاختصارات Command + Control + Arrows.
ملاحظة: هذه الميزة تجريبية وغالبًا ما تنتج أوصافًا غير دقيقة للمواقع والمحتوى.
الاختصارات العالمية
تعمل هذه الاختصارات في جميع الأوقات:
- قائمة VOCR: Command+Shift+Control+S
- نافذة التعرف الضوئي على الحروف: Command+Shift+Control+W
- مؤشر OCR VoiceOver: Command+Shift+Control+V
- التقاط الكاميرا: Command+Shift+Control+C
- تبديل التعرف الضوئي على الحروف في الوقت الحقيقي: Command+Shift+Control+R
- اسأل الذكاء الاصطناعي: Command+Shift+Control+A
- الاستكشاف باستخدام الذكاء الاصطناعي: Command+Shift+Control+E
اختصارات التنقل
تعمل هذه الاختصارات فقط عندما يكون التنقل نشطًا بعد الفحص:
- تحريك لأسفل/لأعلى: Command+Control+سهم لأسفل/لأعلى
- التحرك يسارًا/يمينًا: Command+Control+سهم يسار/يمين
- الحرف السابق/التالي: Command+Shift+Control+سهم يسار/يمين
- انتقل إلى الأعلى/الأسفل: Command+Control+Page Up/Down
- انتقل إلى البداية/النهاية أفقيًا: Command+Control+Home/End
- الخروج من التنقل: هروب
- الموقع: Command+Control+L (الإحداثيات الحالية للتقارير)
- تحديد الكائن: Command+Control+I (يحدد الكائن الحالي باستخدام الذكاء الاصطناعي عند تمكين اكتشاف الكائن في الإعدادات)
إعدادات
قم بالوصول إلى قائمة VOCR باستخدام Command+Control+Shift+S. تحتوي هذه القائمة على جميع الإعدادات والعمليات.
- النافذة المستهدفة: تتيح لك فحص نافذة مختلفة عن النافذة الحالية.
- المسح التلقائي: يتم الفحص تلقائيًا بعد النقر فوق عنصر ما باستخدام VO+Shift+Space.
- كشف الكائن: يحدد موقع الكائنات التي لا تحتوي على نص مثل الرموز.
- استخدام المطالبة الأخيرة: إعادة استخدام المطالبة الأخيرة عند سؤال الذكاء الاصطناعي باستخدام Command+Shift+Control+A.
- تحريك الماوس: لتحريك مؤشر الماوس عند التنقل.
- الصوت الموضعي: يوفر ردود فعل صوتية أثناء تحرك مؤشر الماوس. تتوافق تغييرات التردد مع الموقع الرأسي، ويتوافق تحريك الصوت مع الوضع الأفقي. إذا لم تسمع التعليقات الصوتية، فانتقل إلى الإعدادات > إخراج الصوت.
- إعادة تعيين الموضع: عند التعطيل، لن يتم إعادة تعيين المؤشر إلى الزاوية العلوية اليسرى بعد كل عملية مسح جديدة.
- التشغيل عند تسجيل الدخول: يقوم بتشغيل VOCR تلقائيًا عند تسجيل الدخول.
- السجل: يبدأ كتابة السجلات إلى VOCR.txt في مجلد المستندات.
- إخراج الصوت: اختر جهازًا صوتيًا للحصول على تعليقات صوتية موضعية.
- اختر الكاميرا: حدد الكاميرا التي تريد استخدامها لالتقاط صورة.
- الاختصارات: تخصيص الاختصارات.
- المحرك: اختر بين GPT أو Ollama.
لاحظ أن Llama.cpp أوقف مؤقتًا دعم نموذج لغة الرؤية على الخادم الخاص به.
عملية
عند فتح قائمة VOCR، تتوفر بعض العمليات بعد الفحص:
- حفظ الصورة الأخيرة
- حفظ نتيجة التعرف الضوئي على الحروف
- التحديثات
استكشاف الأخطاء وإصلاحها
- إذا سمعت "لم يتم العثور على أي شيء"، فمن المحتمل أن تحتاج إلى إيقاف تشغيل ستارة شاشة VoiceOver باستخدام vo+shift+f11 أو ضبط إمكانية الوصول وأذونات تسجيل الشاشة في إعدادات النظام > الخصوصية والأمان.
- إذا لم تسمع أي شيء بعد استخدام ميزة "OCR VoiceOver Cursor"، فربما تحتاج إلى منح أذونات VOCR من أجل: إرسال أحداث Apple.
عادةً ما تؤدي إعادة تشغيل VOCR وإعادة إصدار الأمر إلى إعادة تشغيل التنبيهات لتظهر مرة أخرى في مربعات حوار النظام كما هو موضح أعلاه.
وأخيرًا، يرجى الاستمتاع باستخدام VOCR!