พื้นที่เก็บข้อมูลนี้มีโค้ดสำหรับรายงาน ACL 2021 เรื่อง "การสร้างคำถามเพื่อการศึกษาแบบปรับเปลี่ยนได้"
โค้ดสำหรับโมเดลการฝึกและการทดสอบอยู่ในไดเร็กทอรีย่อย ./src
โค้ดสำหรับจำลองผลลัพธ์และการวิเคราะห์ที่รายงาน รวมถึงการวิเคราะห์เพิ่มเติม (อธิบายไว้ด้านล่าง) อยู่ในไดเร็กทอรี ./results
นอกจากนี้เรายังมีสคริปต์สองสคริปต์เพื่อให้เล่นกับโมเดลการติดตามความรู้ของนักเรียน LMKT ( play_student_model.py
) และโมเดลการสร้างคำถาม ( play_qg_model.py
) ได้อย่างง่ายดาย
หากคุณพบว่าพื้นที่เก็บข้อมูลนี้มีประโยชน์ โปรดอ้างอิง:
@InProceedings{acl21srivastava,
title = {Question Generation for Adaptive Education},
author = {Srivastava, Megha and Goodman, Noah},
booktitle = {Association for Computational Linguistics (ACL)},
year = {2021},
}
ไฟล์ข้อมูลดิบต้นฉบับจัดทำโดย Duolingo และสามารถเข้าถึงได้ที่: https://sharedtask.duolingo.com/2018.html หากคุณใช้ข้อมูล Duolingo โปรดตรวจสอบให้แน่ใจว่าได้อ้างอิง:
@inproceedings{settles-etal-2018-second,
title = "Second Language Acquisition Modeling",
author = "Settles, Burr and
Brust, Chris and
Gustafson, Erin and
Hagiwara, Masato and
Madnani, Nitin",
booktitle = "Proceedings of the Thirteenth Workshop on Innovative Use of {NLP} for Building Educational Applications",
year = "2018",
}
requirements.txt
มีการขึ้นต่อกันที่จำเป็นสำหรับโค้ดนี้ และเรายังใช้ไลบรารี HuggingFaces Transformers เวอร์ชัน 3.4.0
เพิ่มเติมอีกด้วย ในการเข้าถึงไฟล์ข้อมูลทั้งหมด ให้รันคำสั่ง cd data; unzip data.zip
หากต้องการเข้าถึงโมเดลทั้งหมด รวมถึงโมเดลที่คุณสามารถใช้สคริปต์ play_student_model.py
ให้รัน mkdir models; cd models
ให้ดาวน์โหลดไฟล์ acl2021_models.zip
(จาก https://www.dropbox.com/s/chkdhmn54l2ptzf/acl2021_models.zip?dl=0) ลงในไดเร็กทอรี models
และรัน unzip acl2021_models.zip
เมื่อดาวน์โหลดโมเดลแล้ว คุณจะสามารถใช้โต้ตอบกับโมเดลนักเรียนที่ผ่านการฝึกอบรมสำหรับผู้เรียนภาษาฝรั่งเศสและสเปน (จากภาษาอังกฤษ) คำสั่งตัวอย่างสำหรับโมเดลนักเรียนชาวฝรั่งเศสคือ:
python play_student_model.py -m models/lmkt_student/french_student_model
หากต้องการลองใช้พร้อมท์ที่แตกต่างกัน (ซึ่งแสดงถึงประวัติคำถาม/คำตอบของนักเรียน) ให้แก้ไขตัวแปรของ prompts
ในสคริปต์
คุณยังสามารถโต้ตอบกับโมเดลการสร้างคำถามที่ได้รับการฝึกอบรมสำหรับผู้เรียนภาษาฝรั่งเศสและสเปน ตัวอย่างคำสั่งสำหรับนักเรียนที่เรียนภาษาสเปนคือ:
python play_qg_model.py -g models/question_generation/spanish_qg
หากต้องการลองใช้พรอมต์ที่แตกต่างกัน (ซึ่งแสดงถึงประวัติคำถาม/คำตอบของนักเรียน และการควบคุมความยาก ) ให้แก้ไขตัวแปรของ prompts
ในสคริปต์
ในโค้ดเบสนี้ เราได้รวมการวิเคราะห์เชิงสำรวจเพิ่มเติมที่ไม่ได้รวมอยู่ในรายงานหลัก สามารถพบได้ที่ ./results/further_analysis
ในสมุดบันทึก lmkt_trends.ipynb
เราจะตรวจสอบว่า Duolingo ถามอะไร โมเดล LM-KT ของเราทำนายว่าง่ายสำหรับนักเรียนทุกคน (เช่น "ไม่ ขอบคุณ") ยากสำหรับนักเรียนทุกคน (เช่น "ทำไมคุณไม่จับเต่า") หรือความยากต่างกันอย่างมากในนักเรียน (เช่น "สวัสดีปีใหม่!")
ในสมุดบันทึก new_vocab.ipynb
เราค้นพบว่านอกเหนือจากการสร้างคำถามใหม่ๆ ให้กับนักเรียนแล้ว โมเดลการสร้างคำถามของเรายังสร้าง คำศัพท์ใหม่ๆ เช่น ตัวดำเนินการ และ การสอน ซึ่งอาจเนื่องมาจากคำจากตระกูลคำเดียวกันที่ปรากฏในชุดข้อมูล Duolingo
หากมีคำถามใด ๆ โปรดติดต่อ [email protected]!