يحتوي هذا المستودع على الكود الخاص بورقة ACL 2021 "إنشاء الأسئلة للتعليم التكيفي".
رمز نماذج التدريب والاختبار موجود في الدليل الفرعي ./src
. الكود الخاص بتكرار النتائج والتحليلات المبلغ عنها، بالإضافة إلى التحليل الإضافي (الموصوف أدناه)، موجود في الدليل الفرعي ./results
. نوفر أيضًا نصين لتشغيلهما بسهولة باستخدام نموذج تتبع معرفة الطلاب LMKT ( play_student_model.py
) ونموذج توليد الأسئلة ( play_qg_model.py
).
إذا وجدت هذا المستودع مفيدًا، فيرجى ذكر ما يلي:
@InProceedings{acl21srivastava,
title = {Question Generation for Adaptive Education},
author = {Srivastava, Megha and Goodman, Noah},
booktitle = {Association for Computational Linguistics (ACL)},
year = {2021},
}
يتم توفير ملفات البيانات الأولية الأصلية بواسطة Duolingo ويمكن الوصول إليها على: https://sharedtask.duolingo.com/2018.html. إذا كنت تستخدم بيانات Duolingo، فيرجى التأكد من الاستشهاد بما يلي:
@inproceedings{settles-etal-2018-second,
title = "Second Language Acquisition Modeling",
author = "Settles, Burr and
Brust, Chris and
Gustafson, Erin and
Hagiwara, Masato and
Madnani, Nitin",
booktitle = "Proceedings of the Thirteenth Workshop on Innovative Use of {NLP} for Building Educational Applications",
year = "2018",
}
يحتوي requirements.txt
على التبعيات المطلوبة لهذا الكود، كما أننا نستخدم أيضًا الإصدار 3.4.0
من مكتبة HuggingFaces Transformers. للوصول إلى كافة ملفات البيانات، قم بتشغيل الأوامر cd data; unzip data.zip
. للوصول إلى جميع النماذج، بما في ذلك تلك التي يمكنك من خلالها استخدام البرنامج النصي play_student_model.py
، قم بتشغيل mkdir models; cd models
، قم بتنزيل الملف acl2021_models.zip
(من https://www.dropbox.com/s/chkdhmn54l2ptzf/acl2021_models.zip?dl=0) في دليل models
، وقم بتشغيل unzip acl2021_models.zip
.
بمجرد تنزيل النماذج، يمكنك استخدام نماذج التفاعل مع الطلاب المدربين لمتعلمي اللغتين الفرنسية والإسبانية (من الإنجليزية). مثال على أمر لنموذج الطالب الفرنسي هو:
python play_student_model.py -m models/lmkt_student/french_student_model
لتجربة مطالبات مختلفة (والتي تمثل سجل أسئلة/إجابات الطالب)، قم بتعديل متغير prompts
في البرنامج النصي.
يمكنك أيضًا التفاعل مع نماذج توليد الأسئلة المدربة لمتعلمي اللغة الفرنسية والإسبانية. مثال على الأمر لطلاب تعلم اللغة الإسبانية هو:
python play_qg_model.py -g models/question_generation/spanish_qg
لتجربة مطالبات مختلفة (والتي تمثل سجل أسئلة/إجابات الطالب والتحكم في الصعوبة )، قم بتعديل متغير prompts
في البرنامج النصي.
في قاعدة التعليمات البرمجية هذه، قمنا بتضمين المزيد من التحليل الاستكشافي الذي لم يتم تضمينه في الورقة الرئيسية. يمكن العثور على هذا على ./results/further_analysis
.
في دفتر lmkt_trends.ipynb
، نتحقق من أسئلة Duolingo التي تتنبأ بها نماذج LM-KT الخاصة بنا على أنها سهلة لجميع الطلاب (على سبيل المثال، "لا، شكرًا")، وصعبة على جميع الطلاب (على سبيل المثال، "لماذا لا تلمس السلحفاة؟") ، أو تتنوع بدرجة كبيرة في الصعوبة بين الطلاب (على سبيل المثال "سنة جديدة سعيدة!").
في دفتر new_vocab.ipynb
، اكتشفنا أنه بالإضافة إلى إنشاء أسئلة جديدة للطلاب، قام نموذج توليد الأسئلة الخاص بنا بإنشاء مفردات جديدة ، مثل عامل التشغيل والتدريس ، ويرجع ذلك على الأرجح إلى ظهور كلمات من نفس عائلة الكلمات في مجموعة بيانات Duolingo.
إذا كانت لديك أية أسئلة، يرجى الاتصال بـ [email protected]!