؟ الأخبار : 21 أغسطس 2023 - يمكن للمستخدمين الآن إنشاء المعرفة وإلحاقها بسرعة من خلال Knowledge Tab
المضافة حديثًا في واجهة المستخدم الرسومية. تمت أيضًا إضافة أشرطة التقدم في علامتي التبويب "التكوين والمعرفة".
SimpleRetrieve هي أداة مفتوحة المصدر تهدف إلى توفير واجهة مستخدم رسومية وواجهة برمجة تطبيقات مترجمة بالكامل وخفيفة الوزن وسهلة الاستخدام لنهج الإنشاء المتمركز على الاسترجاع (RCG) لمجتمع التعلم الآلي.
قم بإنشاء أداة دردشة باستخدام مستنداتك ونماذج اللغة الخاصة بك، وهي قابلة للتخصيص بدرجة كبيرة. الميزات هي:
يتوفر تقرير فني حول هذه الأداة على arXiv.
يتوفر مقطع فيديو قصير حول هذه الأداة على YouTube.
نحن نهدف إلى المساهمة في تطوير LLMs آمنة وقابلة للتفسير ومسؤولة من خلال مشاركة أداتنا مفتوحة المصدر لتنفيذ نهج RCG. نأمل أن تمكّن هذه الأداة مجتمع التعلم الآلي من استكشاف استخدام LLMs بطريقة أكثر كفاءة، مع الحفاظ على الخصوصية والتنفيذ المحلي. إن الجيل المتمحور حول الاسترجاع، والذي يعتمد على مفهوم الجيل الاسترجاعي المعزز (RAG) من خلال التأكيد على الدور الحاسم لماجستير القانون في تفسير السياق وإسناد حفظ المعرفة إلى مكون المسترد، لديه القدرة على إنتاج توليد أكثر كفاءة وقابلة للتفسير، وتقليل حجم LLMs المطلوبة للمهام التوليدية. يمكن تشغيل هذه الأداة على وحدة معالجة رسومات Nvidia واحدة، مثل T4 أو V100 أو A100، مما يجعلها في متناول مجموعة واسعة من المستخدمين.
تم إنشاء هذه الأداة بشكل أساسي استنادًا إلى المكتبات الرائعة والمألوفة مثل Hugging Face وGradio وPyTorch وFaiss. LLM الافتراضي الذي تم تكوينه في هذه الأداة هو Wizard-Vicuna-13B-Uncentriced الذي تم ضبطه بدقة للتعليمات. نموذج التضمين الافتراضي للمسترد هو متعدد اللغات e5-base. لقد وجدنا أن هذه النماذج تعمل بشكل جيد في هذا النظام، بالإضافة إلى العديد من الأحجام المختلفة الأخرى من LLMs والمستردات مفتوحة المصدر المتوفرة في Hugging Face. يمكن تشغيل هذه الأداة بلغات أخرى بالإضافة إلى اللغة الإنجليزية، وذلك عن طريق تحديد شهادات LLM المناسبة وتخصيص قوالب المطالبة وفقًا للغة الهدف.
pip install -r requirements.txt
chat/data/
وقم بتشغيل البرنامج النصي لإعداد البيانات ( cd chat/
ثم الأمر التالي) CUDA_VISIBLE_DEVICES=0 python prepare.py --input data/ --output knowledge/ --config configs/default_release.json
pdf, txt, doc, docx, ppt, pptx, html, md, csv
، ويمكن توسيعها بسهولة عن طريق تحرير ملف التكوين. اتبع النصائح حول هذه المشكلة في حالة حدوث خطأ متعلق بـ NLTK.Knowledge Tab
في أداة واجهة المستخدم الرسومية. يمكن للمستخدمين الآن إضافة المعرفة بسرعة. إن تشغيل البرنامج النصي Prepar.py أعلاه قبل تشغيل الأداة ليس ضروريًا. بعد إعداد المتطلبات الأساسية أعلاه، قم بتعيين المسار الحالي لدليل chat
( cd chat/
)، ثم قم بتنفيذ الأمر أدناه. ثم grab a coffee!
حيث سيستغرق التحميل بضع دقائق فقط.
CUDA_VISIBLE_DEVICES=0 python chat.py --config configs/default_release.json
بعد ذلك، قم بالوصول إلى واجهة المستخدم الرسومية المستندة إلى الويب من متصفحك المفضل بالانتقال إلى http://<LOCAL_SERVER_IP>:7860
. استبدل <LOCAL_SERVER_IP>
بعنوان IP الخاص بخادم GPU الخاص بك. وهذا كل شيء، أنت على استعداد للذهاب!
GUI operation manual
، يرجى الرجوع إلى الملف التمهيدي لواجهة المستخدم الرسومية الموجود في الدليل docs/
.API access manual
، يرجى الرجوع إلى الملف التمهيدي لواجهة برمجة التطبيقات (API) ونماذج البرامج النصية الموجودة في الدليل examples/
.فيما يلي لقطة شاشة للدردشة لواجهة المستخدم الرسومية. إنه يوفر واجهة chatbot متدفقة مألوفة مع لوحة ضبط RCG شاملة.
ليس لديك خادم GPU محلي لتشغيل هذه الأداة في هذه اللحظة؟ لا مشكلة. قم بزيارة هذا المستودع. يعرض التعليمات الخاصة بتجربة هذه الأداة في النظام الأساسي السحابي AWS EC2.
لا تتردد في تعطينا أي ردود فعل وتعليقات. نحن نرحب بشدة بأي مناقشة ومساهمة حول هذه الأداة، بما في ذلك الميزات الجديدة والتحسينات والوثائق الأفضل. لا تتردد في فتح موضوع أو مناقشة. ليس لدينا أي نموذج للقضية أو المناقشة حتى الآن، لذلك كل شيء سيكون مناسبًا في الوقت الحالي.
التطورات المستقبلية
من المهم ملاحظة أن هذه الأداة لا توفر حلاً مضمونًا لضمان استجابة آمنة ومسؤولة تمامًا من نماذج الذكاء الاصطناعي التوليدية، حتى ضمن نهج يركز على الاسترجاع. يظل تطوير أنظمة الذكاء الاصطناعي الأكثر أمانًا وقابلية للتفسير والمسؤولية مجالًا نشطًا للبحث والجهد المستمر.
قد تظهر النصوص التي تم إنشاؤها من هذه الأداة اختلافات، حتى عند تعديل المطالبات أو الاستعلامات بشكل طفيف فقط، وذلك بسبب سلوك التنبؤ بالرمز المميز التالي لمجالس LLM من الجيل الحالي. وهذا يعني أن المستخدمين قد يحتاجون إلى ضبط كل من المطالبات والاستعلامات بعناية للحصول على الاستجابات المثلى.
إذا وجدت أن عملنا مفيد، يرجى ذكرنا على النحو التالي:
@article{ng2023simplyretrieve,
title={SimplyRetrieve: A Private and Lightweight Retrieval-Centric Generative AI Tool},
author={Youyang Ng and Daisuke Miyashita and Yasuto Hoshi and Yasuhiro Morioka and Osamu Torii and Tomoya Kodama and Jun Deguchi},
year={2023},
eprint={2308.03983},
archivePrefix={arXiv},
primaryClass={cs.CL},
journal={arXiv preprint arXiv:2308.03983}
}
⁉️ الانتساب: معهد البحث والتطوير لتكنولوجيا الذاكرة، شركة كيوكسيا، اليابان