لم تتم صيانة هذا المستودع وتمت أرشفته.
Donkeybot هو نظام شامل للإجابة على الأسئلة. ويستخدم مصادر بيانات متعددة وجدول الأسئلة الشائعة ونماذج نقل التعلم اللغوي مثل BERT للإجابة على أسئلة دعم Rucio.
الهدف من المشروع في إطار GSoC 2020 هو استخدام معالجة اللغات الطبيعية (NLP) لتطوير نموذج أولي ذكي لروبوت قادر على تقديم إجابات مُرضية لمستخدمي Rucio والتعامل مع طلبات الدعم حتى مستوى معين من التعقيد، وإعادة توجيه الطلبات المتبقية فقط إلى خبراء.
يمكن توسيع Donkeybot وتطبيقه كنظام للإجابة على الأسئلة لاحتياجاتك. يلزم إجراء تغييرات على الكود لاستخدام Donkeybot لحالة الاستخدام والبيانات المحددة الخاصة بك. ينطبق التنفيذ الحالي على مصادر بيانات Rucio المحددة.
تخزين البيانات : مخزن بيانات يحتوي على بيانات خاصة بمجال Rucio. يتم التنفيذ الحالي للوحدة في SQLite للنماذج الأولية السريعة التي توفرها. تتضمن مصادر البيانات رسائل بريد إلكتروني آمنة ومجهولة للدعم من مستخدمي Rucio، ومشكلات Rucio GitHub ووثائق Rucio.
اكتشاف الأسئلة : وحدة لاكتشاف الأسئلة واستخراجها من أي نص معين. يتم استخدام هذا لاستخراج الأسئلة السابقة من رسائل البريد الإلكتروني الخاصة بالدعم ومشكلات GitHub من خلال استخدام التعبيرات العادية. يتم أرشفة هذه الأسئلة كمستندات واستخدامها من قبل الوحدات الأخرى.
استرجاع المستندات : وحدة محرك بحث تستخدم خوارزمية BM25 لاسترجاع المستندات الأكثر تشابهًا (الأسئلة المطروحة مسبقًا أو وثائق Rucio) لاستخدامها كسياق بواسطة وحدة اكتشاف الإجابات.
اكتشاف الإجابة : وحدة الكشف عن الإجابة التي تتبع كلاً من منهج نقل التعلم والنهج الخاضع للإشراف.
تشمل الميزات الإضافية ما يلي :
واجهة المستخدم الرسومية لإنشاء الأسئلة الشائعة : يمكن للمستخدم استخدام واجهة المستخدم الرسومية المتوفرة كواجهة للتفاعل مع تخزين البيانات، وإدراج الأسئلة الشائعة، وإعادة فهرسة محرك البحث وتوسيع قاعدة معارف Donkeybot.
تجزئة الاسم : برنامج نصي يستخدم علامة NER الخاصة بستانفورد لاكتشاف معلومات المستخدم الخاصة من رسائل البريد الإلكتروني الخاصة بالدعم وتجزئتها. وبالتالي، اتباع إرشادات الخصوصية الخاصة بـ CERN والحفاظ على سرية جميع البيانات.
راجع الوثائق الكاملة للحصول على الأمثلة والتفاصيل التشغيلية وغيرها من المعلومات.
راجع الأسئلة الشائعة: GSoC للحصول على جدول زمني مفصل ومعلومات الطلاب والمشكلات التي يواجهونها واقتراحات التحسين المستقبلية وقائمة القراءة والمزيد.
يمكنك محاولة سؤال Donkeybot بنفسك!
باستخدام slackbot:
أو يمكنك استخدام سطر الأوامر:
$ python . s cripts a sk_donkeybot.py
يمكن العثور على المزيد من الأمثلة والمعلومات في قسم كيفية الاستخدام.
الخطوة 1: يتطلب PyTorch تثبيت Python 3.x 64 بت.
الخطوة 2: لتثبيت PyTorch، انتقل إلى https://pytorch.org/ واتبع دليل البدء السريع بناءً على نظام التشغيل الخاص بك.
# versions used in development
torch == 1.6 . 0 - - find - links https : // download . pytorch . org / whl / torch_stable . html
torchvision == 0.7 . 0 - - find - links https : // download . pytorch . org / whl / torch_stable . html
الخطوة 3: استنساخ المستودع إلى جهاز التطوير الخاص بك.
$ git clone https://github.com/rucio/donkeybot.git
$ cd donkeybot
الخطوة 4: تشغيل المتطلبات الإضافية.
$ pip install -r requirements.txt
الخطوة 5: إنشاء وتعبئة مخزن بيانات Donkeybot.
$ python scripts/build_donkeybot -t < GITHUB_API_TOKEN >
راجع صفحة البدء للحصول على مزيد من التفاصيل حول المساهمة وبدء وضع المطور والاختبار.
بالنسبة للأخطاء والأسئلة والمناقشات، يرجى استخدام مشكلات GitHub أو الاتصال بالطالب @mageirakos.
مرخص بموجب ترخيص Apache، الإصدار 2.0؛
http://www.apache.org/licenses/LICENSE-2.0