PERSUADE 2.0 語料庫建立在 PERSUADE 1.0 語料庫的基礎上,為 PERSUADE 1.0 語料庫中的每篇說服力文章提供整體論文分數,以及初始語料庫中每個論證和話語元素的熟練程度分數。該版本還包含所有論文(與連結 Kaggle 競賽訓練集的 1.0 相比)
PERSUADE 2.0 語料庫總共包含美國 6 至 12 年級學生撰寫的 25,000 多篇議論文,針對兩項寫作任務的 15 條提示:獨立寫作和基於來源的寫作。 PERSUADE 2.0 語料庫提供了每位作者詳細的個人和人口統計信息,以及 PERSUADE 1.0 中論證和話語元素的初始註釋。
.csv 檔案對於 github 來說太大。數據框的連結如下
所有論證和話語元素註釋以及有效性分數均可在
訓練集
測試集
請注意:測試集是受密碼保護的 zip 檔案。密碼是說服_測試。
您可能需要使用特定的軟體來解密 zip 文件,例如 Windows 版的 7-Zip 或 Mac 版的 Keka。
已發表的數據集論文已在此處發布。
論文的參考文獻是
Crossley, S. A.、Baffour, P.、Tian, Y.、Franklin, A.、Benner, M. 與 Boser., U. (2024)。用於評估書面論證的大型語料庫:PERSUADE 2.0。評估寫作,61。
相關論文的預印本位於 zenodo 上。
資料依據 CC BY-NC-SA 4.0 DEED Attribution-NonCommercial-ShareAlike 4.0 國際授權 (https://creativecommons.org/licenses/by-nc-sa/4.0/deed.en)