Study-Bot هو مشروع مفتوح المصدر تم تطويره بواسطة Edumakers من شركة Tecnológico de Monterrey . وهو مصمم لمساعدة الطلاب ضعاف البصر على مراجعة المواد الدراسية الأكاديمية الخاصة بهم. إنه رفيق دراسة مدعوم بالذكاء الاصطناعي ويتضمن تقنيات مختلفة، بما في ذلك Whisper وGPT-3.5-turbo-16k وElevenlabs لتحويل النص إلى كلام وOpenCV. ولأغراض الاختبار، تم إنشاء عينة من المواد الدراسية باستخدام ChatGPT.
يستطيع برنامج Study-Bot : الاستماع إلى سؤال المستخدم، وتحليل المادة المصدر للموضوع الذي يريد دراسته، واكتشاف المادة التعليمية المادية التي يحملها من خلال لونها أو علامة ArUco، وإنشاء إجابة، وقراءتها بصوت عالٍ أمام المشاركين. المستخدم كتطبيق قابل للتنفيذ يمكن الوصول إليه. لأغراض التطوير والاختبار، يمكن تشغيله من خلال مترجم Python كبرنامج CLI أو باستخدام واجهة المستخدم الرسومية .
قد تكون بعض الخطوات التالية الجيدة هي تضمين هذا النظام في واجهة مستخدم أكثر تقدمًا للتوزيع كتطبيق سطح مكتب، وإنشاء نموذج رؤية حاسوبية يمكنه اكتشاف المواد التعليمية المادية دون الاعتماد على اللون أو علامات ArUco، بالإضافة إلى بعض تحسينات الأداء و ميزات تفاعلية جديدة.
يوصى باستخدام Python 3.9.9 حتى يمكن استخدام مكتبة whisper
دون مشاكل. لتجنب الاضطرار إلى إزالة تثبيت Python الحالي، قد ترغب في استخدام بيئة افتراضية لاستخدام هذا الإصدار المحدد من Python . لتثبيت التبعيات المطلوبة، قم بتشغيل الأمر التالي:
pip install -r requirements.txt
هناك بعض الخطوات الإضافية التي يجب اتخاذها قبل أن تتمكن من تشغيل المشروع، مثل الحصول على مفاتيح API الخاصة بك لخدمات الذكاء الاصطناعي المستخدمة هنا. لمزيد من المعلومات، يرجى الرجوع إلى مجلد Documentation
للحصول على دليل شامل حول كيفية استخدام هذا المشروع.
يعتمد Study-Bot على الخدمات والتقنيات الحالية التالية:
Whisper: يُستخدم لتحويل الكلام إلى نص، مما يسمح للمستخدمين بطرح أسئلتهم ليتم إدخالها في نموذج GPT.
gpt-3.5-turbo-16k: يستخدم لمعالجة الأسئلة وتوليد الإجابات. تم اختيار الإصدار 16 كيلو بايت من النموذج لحجم نافذة السياق الذي يبلغ 16385 رمزًا، وهو أمر ضروري لمعالجة كمية كبيرة من المواد المصدر.
Elevenlabs تحويل النص إلى كلام: يستخدم لتحويل النص إلى كلام، مما يسمح للمستخدمين بسماع الإجابات الناتجة عن نموذج GPT.
OpenCV: يستخدم لتحديد الأشياء المادية، لمساعدة نموذج GPT-3.5-16k في الإجابة على الأسئلة مع السياق الإضافي لما يحمله المستخدم.
استخدم هذا المشروع كمرجع لمشروعك الخاص، أو قم بتفرعه لتقديم مساهماتك الخاصة. نرحب بمشاكل GitHub المتعلقة بطلبات الميزات وتقارير الأخطاء ونحظى بتقدير خاص إذا كانت تتضمن تعليقات من المستخدمين ضعاف البصر.