يخدم هذا المشروع مفتوح المصدر غرضين.
- جمع وتقييم مجموعة بيانات الإجابة على الأسئلة لتحسين طرق ضمان الجودة/البحث الحالية - COVID-QA
- إمكانات مطابقة الأسئلة: تقديم إجابات جديرة بالثقة على الأسئلة المتعلقة بـCOVID-19 عبر البرمجة اللغوية العصبية (NLP) - قديمة
كوفيد-QA
- رابط إلى مجموعة بيانات COVID-QA
- الورقة المصاحبة على OpenReview
- إرشادات التعليقات التوضيحية بتنسيق pdf أو مقاطع فيديو
- Deepset/roberta-base-squad2-covid نموذج ضمان الجودة تم تدريبه على COVID-QA
التحديث بتاريخ 14 أبريل 2020: نحن نوفر مصادر مفتوحة للدفعة الأولى من التعليقات التوضيحية التي تجيب على أسئلة نمط SQuAD. شكرًا لتوني رينا على إدارة العملية والعديد من المعلقين المحترفين الذين يقضون وقتًا ثمينًا في البحث عن الأوراق البحثية المتعلقة بكوفيد.
مطابقة الأسئلة الشائعة
تحديث 17 يونيو، 2020 : نظرًا لتباطؤ الوباء ولحسن الحظ ومواكبة مصادر المعلومات الأخرى، قررنا جعل واجهة برمجة التطبيقات وواجهة المستخدم المستضافة لدينا غير متصلة بالإنترنت. سنحتفظ بالمستودع هنا كمصدر إلهام لمشاريع أخرى ولمشاركة مجموعة بيانات COVID-QA.
⚡ مشكلة
- لدى الناس العديد من الأسئلة حول فيروس كورونا (COVID-19).
- الإجابات منتشرة على مواقع مختلفة
- يستغرق العثور على الإجابات الصحيحة الكثير من الوقت
- من الصعب الحكم على مصداقية الإجابات
- العديد من الإجابات أصبحت قديمة قريبًا
فكرة
- تجميع الأسئلة الشائعة والنصوص من مصادر البيانات الموثوقة (منظمة الصحة العالمية، مراكز مكافحة الأمراض والوقاية منها ...)
- توفير واجهة مستخدم حيث يمكن للأشخاص طرح الأسئلة
- استخدم البرمجة اللغوية العصبية (NLP) لمطابقة الأسئلة الواردة للمستخدمين بإجابات ذات معنى
- يمكن للمستخدمين تقديم تعليقات حول الإجابات لتحسين نموذج البرمجة اللغوية العصبية ووضع علامة على الإجابات القديمة أو الخاطئة
- عرض الاستعلامات الأكثر شيوعًا بدون إجابات جيدة لتوجيه جمع البيانات وتحسينات النموذج
التكنولوجيا
- كاشطات لجمع البيانات
- Elasticsearch لتخزين النصوص والأسئلة الشائعة والتضمينات
- يتم تنفيذ نماذج البرمجة اللغوية العصبية (NLP) عبر Haystack للعثور على إجابات عبر أ) اكتشاف سؤال مماثل في الأسئلة الشائعة ب) اكتشاف الإجابات في النصوص المجانية (ضمان الجودة الاستخراجي)
- رد الفعل الواجهة الأمامية