이 저장소에는 ACL 2021 논문 "적응형 교육을 위한 질문 생성"에 대한 코드가 포함되어 있습니다.
모델 학습 및 테스트용 코드는 ./src
하위 디렉터리에 있습니다. 보고된 결과 및 분석과 추가 분석(아래 설명)을 복제하기 위한 코드는 ./results
하위 디렉터리에 있습니다. 또한 LMKT 학생 지식 추적 모델( play_student_model.py
)과 질문 생성 모델( play_qg_model.py
)을 쉽게 사용할 수 있는 두 개의 스크립트도 제공합니다.
이 저장소가 유용하다고 생각되면 다음을 인용해 주세요.
@InProceedings{acl21srivastava,
title = {Question Generation for Adaptive Education},
author = {Srivastava, Megha and Goodman, Noah},
booktitle = {Association for Computational Linguistics (ACL)},
year = {2021},
}
원본 원시 데이터 파일은 듀오링고에서 제공하며 https://sharedtask.duolingo.com/2018.html에서 액세스할 수 있습니다. 듀오링고 데이터를 사용하는 경우 다음을 인용하세요.
@inproceedings{settles-etal-2018-second,
title = "Second Language Acquisition Modeling",
author = "Settles, Burr and
Brust, Chris and
Gustafson, Erin and
Hagiwara, Masato and
Madnani, Nitin",
booktitle = "Proceedings of the Thirteenth Workshop on Innovative Use of {NLP} for Building Educational Applications",
year = "2018",
}
requirements.txt
에는 이 코드에 대한 필수 종속성이 포함되어 있으며 추가적으로 HuggingFaces Transformers 라이브러리 버전 3.4.0
을 사용합니다. 모든 데이터 파일에 액세스하려면 cd data; unzip data.zip
. play_student_model.py
스크립트를 사용할 수 있는 모델을 포함하여 모든 모델에 액세스하려면 mkdir models; cd models
사용하려면 acl2021_models.zip
파일(https://www.dropbox.com/s/chkdhmn54l2ptzf/acl2021_models.zip?dl=0에서)을 models
디렉터리에 다운로드하고 unzip acl2021_models.zip
실행하세요.
모델이 다운로드되면 프랑스어 및 스페인어 학습자(영어)를 위해 훈련된 학생 모델과 상호 작용할 수 있습니다. 프랑스어 학생 모델의 명령 예는 다음과 같습니다.
python play_student_model.py -m models/lmkt_student/french_student_model
학생의 질문/답변 기록을 나타내는 다른 프롬프트를 시도하려면 스크립트에서 prompts
변수를 수정하세요.
프랑스어 및 스페인어 학습자를 위해 훈련된 질문 생성 모델과 상호 작용할 수도 있습니다. 스페인어를 학습하는 학생을 위한 예제 명령은 다음과 같습니다.
python play_qg_model.py -g models/question_generation/spanish_qg
다른 프롬프트(학생의 질문/답변 기록 및 난이도 제어를 나타냄)를 시도하려면 스크립트에서 prompts
변수를 수정하십시오.
이 코드베이스에는 본 논문에 포함되지 않은 추가 탐색적 분석이 포함되어 있습니다. 이는 ./results/further_analysis
에서 찾을 수 있습니다.
lmkt_trends.ipynb
노트북에서 우리는 LM-KT 모델이 모든 학생에게 쉬운 것으로 예측하는 듀오링고 질문(예: "아니요, 고마워요")과 모든 학생에게 어려운 질문(예: "거북이를 만지는 게 어때요?")을 조사합니다. , 또는 학생마다 난이도가 매우 다양합니다(예: "새해 복 많이 받으세요!").
new_vocab.ipynb
노트북에서 우리는 새로운 학생 질문을 생성하는 것 외에도 질문 생성 모델이 듀오링고 데이터세트에 나타나는 동일한 단어 계열의 단어로 인해 연산자 및 교육 과 같은 새로운 어휘를 생성했음을 발견했습니다.
질문이 있으시면 [email protected]로 연락주세요!