يحتوي هذا المستودع على تعليمات برمجية وموارد ذات صلة بجيل الاسترجاع المعزز (RAG)، وهي تقنية مصممة لمعالجة مشكلة حداثة البيانات في نماذج اللغات الكبيرة (LLMs) مثل Llama-2. غالبًا ما يفتقر LLMs إلى الوعي بالأحداث الأخيرة والمعلومات الحديثة. يدمج RAG المعرفة الخارجية من قاعدة المعرفة في استجابات LLM، مما يتيح استجابات دقيقة وراسخة.
src
: يحتوي على الكود المصدري لتطبيق تقنية RAG والتفاعلات مع قاعدة المعرفة.data
: يخزن مجموعات البيانات والموارد ذات الصلة لبناء قاعدة المعرفة.db
: لإدارة وتخزين عمليات تضمين الرموز المميزة أو تمثيلات المتجهات لعمليات البحث في قاعدة المعرفة.requirements.txt
: حزم Python المطلوبة لتشغيل التعليمات البرمجية في هذا المستودع. RAG هو نهج جديد يجمع بين قدرات نماذج اللغات الكبيرة (LLMs) وقواعد المعرفة الخارجية لتعزيز جودة ونضارة الاستجابات الناتجة. إنه يعالج التحدي المتمثل في المعلومات القديمة من خلال استرداد المعرفة ذات الصلة بالسياق من مصادر خارجية ودمجها في المحتوى الذي تم إنشاؤه بواسطة LLM.
Gradio هي مكتبة Python تساعدك على إنشاء واجهات مستخدم لنماذج التعلم الآلي الخاصة بك بسرعة. فهو يسمح لك بنشر النماذج بسرعة وإتاحة الوصول إليها من خلال واجهة سهلة الاستخدام دون الحاجة إلى تطوير الواجهة الأمامية على نطاق واسع.
يتم تشغيل تطبيق Gradio عند تشغيل كود gradio_chatbot.py
. يحتوي على عناصر قابلة للتعديل مثل نموذج التضمين ونموذج التوليد وموجه النظام القابل للتحرير والمعلمات القابلة للضبط لمادة LLM المختارة.
لاستخدام الكود الموجود في هذا المستودع، اتبع الخطوات التالية:
استنساخ المستودع على جهازك المحلي.
انتقل إلى دليل المستودع باستخدام سطر الأوامر.
قم بتثبيت الحزم المطلوبة باستخدام الأمر التالي:
pip install -r requirements.txt
قم بتشغيل تطبيق chatbot باستخدام الأمر:
python src/gradio_chatbot.py
بمجرد تشغيل تطبيق Gradio، قم بتحميل مستند (pdf أو csv)، واختر النماذج (التضمين والإنشاء)، واضبط المعلمات القابلة للضبط، وتلاعب بموجه النظام، واطلب أي شيء تحتاجه!