PERSUADE 2.0 语料库建立在 PERSUADE 1.0 语料库的基础上,为 PERSUADE 1.0 语料库中的每篇说服性文章提供整体论文分数,以及初始语料库中每个论证和话语元素的熟练程度分数。该版本还包含所有论文(与链接 Kaggle 竞赛训练集的 1.0 相比)
PERSUADE 2.0 语料库总共包含美国 6 至 12 年级学生撰写的 25,000 多篇议论文,针对两项写作任务的 15 条提示:独立写作和基于来源的写作。 PERSUADE 2.0 语料库提供了每位作者详细的个人和人口统计信息,以及 PERSUADE 1.0 中论证和话语元素的初始注释。
.csv 文件对于 github 来说太大。数据框的链接如下
所有论证和话语元素注释以及有效性分数均可在
训练集
测试集
请注意:测试集是受密码保护的 zip 文件。密码是说服_测试。
您可能需要使用特定的软件来解密 zip 文件,例如 Windows 版的 7-Zip 或 Mac 版的 Keka。
已发表的数据集论文已在此处发布。
论文的参考文献是
Crossley, S. A.、Baffour, P.、Tian, Y.、Franklin, A.、Benner, M. 和 Boser., U. (2024)。用于评估书面论证的大型语料库:PERSUADE 2.0。评估写作,61。
相关论文的预印本位于 zenodo 上。
数据根据 CC BY-NC-SA 4.0 DEED Attribution-NonCommercial-ShareAlike 4.0 国际许可证提供 (https://creativecommons.org/licenses/by-nc-sa/4.0/deed.en)