PERSUADE 2.0 코퍼스는 PERSUADE 1.0 코퍼스의 각 설득 에세이에 전체적인 에세이 점수와 초기 코퍼스에 있는 각 논증 및 담론 요소에 대한 숙련도 점수를 제공하여 PERSUADE 1.0 코퍼스를 기반으로 합니다. 이 버전에는 모든 에세이도 포함되어 있습니다(Kaggle 대회용 훈련 세트를 연결한 1.0과 비교).
전체적으로 PERSUADE 2.0 코퍼스는 미국의 6~12학년 학생들이 작성한 25,000개 이상의 논쟁 에세이로 구성되어 있으며, 두 가지 작문 과제(독립 작문 및 원본 기반 작문)에 대한 15개의 프롬프트로 구성되어 있습니다. PERSUADE 2.0 코퍼스는 각 작가에 대한 자세한 개인 및 인구통계 정보는 물론 PERSUADE 1.0에서 발견된 논증 및 담화 요소에 대한 초기 주석을 제공합니다.
.csv 파일은 github에 비해 너무 큽니다. 데이터 프레임에 대한 링크는 다음과 같습니다.
모든 논쟁 및 담화 요소 주석과 유효성 점수는 다음에서 확인할 수 있습니다.
트레이닝 세트
테스트 세트
참고 사항 : 테스트 세트는 비밀번호로 보호된 zip 파일입니다. 비밀번호는 설득_테스트 입니다.
Windows용 7-Zip이나 Mac용 Keka와 같은 zip 파일을 해독하려면 특정 소프트웨어를 사용해야 할 수도 있습니다.
데이터세트에 대해 출판된 논문이 여기에 출판되어 있습니다.
해당 논문의 참고문헌은
Crossley, S. A, Baffour, P., Tian, Y., Franklin, A., Benner, M., & Boser., U. (2024). 서면 논증 평가를 위한 대규모 코퍼스: PERSUADE 2.0. 글쓰기 평가, 61.
관련 논문의 사전 인쇄가 zenodo에 있습니다.
데이터는 CC BY-NC-SA 4.0 DEED Attribution-NonCommercial-ShareAlike 4.0 국제 라이선스(https://creativecommons.org/licenses/by-nc-sa/4.0/deed.en)에 따라 제공됩니다.