PERSUADE 2.0 コーパスは、PERSUADE 1.0 コーパス内の各説得エッセイに総合的なエッセイ スコアを提供することにより、PERSUADE 1.0 コーパスに基づいて構築されています。また、最初のコーパスにある議論要素と談話要素ごとに熟練度スコアも提供します。このバージョンには、すべてのエッセイも含まれています (Kaggle コンテストのトレーニング セットにリンクした 1.0 と比較して)
PERSUADE 2.0 コーパスは、合計で、米国の 6 年生から 12 年生が 2 つの作文タスク (独立した作文とソースベースの作文) に関する 15 のプロンプトに対して作成した 25,000 を超える議論的なエッセイで構成されています。 PERSUADE 2.0 コーパスは、PERSUADE 1.0 に見られた議論要素と談話要素の初期注釈に加えて、各作家の詳細な個人情報と人口統計情報を提供します。
.csv ファイルは github には大きすぎます。データフレームのリンクは以下にあります
すべての議論要素と談話要素の注釈と有効性スコアは、次の場所で入手できます。
トレーニングセット
テストセット
注意してください: テスト セットはパスワードで保護された zip ファイルです。パスワードはaccept_testです。
zip ファイルを復号化するには、Windows 用 7-Zip や Mac 用 Keka などの特定のソフトウェアを使用する必要がある場合があります。
データセットの公開論文はここで公開されています。
論文の参考文献は、
Crossley, S. A.、Baffour, P.、Tian, Y.、Franklin, A.、Benner, M.、および Boser., U. (2024)。書面による議論を評価するための大規模コーパス: PERSUADE 2.0。ライティングの評価、61.
関連する論文のプレプリントが zenodo にあります。
データは、CC BY-NC-SA 4.0 DEED 表示-非営利-継承 4.0 国際ライセンス (https://creativecommons.org/licenses/by-nc-sa/4.0/deed.en) に基づいて提供されています。