Le corpus PERSUADE 2.0 s'appuie sur le corpus PERSUADE 1.0 en fournissant des scores d'essai holistiques pour chaque essai persuasif du corpus PERSUADE 1.0 ainsi que des scores de compétence pour chaque élément argumentatif et discursif trouvé dans le corpus initial. Cette version contient également tous les essais (par rapport à la version 1.0 qui reliait l'ensemble d'entraînement pour le concours Kaggle)
Au total, le corpus PERSUADE 2.0 comprend plus de 25 000 essais argumentatifs produits par des élèves de la 6e à la 12e année aux États-Unis pour 15 invites sur deux tâches d'écriture : l'écriture indépendante et basée sur la source. Le corpus PERSUADE 2.0 fournit des informations individuelles et démographiques détaillées pour chaque écrivain ainsi que les annotations initiales pour les éléments argumentatifs et discursifs trouvés dans PERSUADE 1.0.
Les fichiers .csv sont trop volumineux pour github. Les liens pour les dataframes sont ci-dessous
Toutes les annotations des éléments argumentatifs et discursifs et les scores d'efficacité sont disponibles sur
Ensemble de formation
Ensemble de tests
VEUILLEZ NOTER : L'ensemble de test est un fichier zip protégé par mot de passe. Le mot de passe est persuade_test .
Vous devrez peut-être utiliser un logiciel spécifique pour décrypter le fichier zip comme 7-Zip pour Windows ou Keka pour Mac.
L'article publié pour l'ensemble de données est disponible et publié ici.
La référence de l'article est
Crossley, SA, Baffour, P., Tian, Y., Franklin, A., Benner, M. et Boser., U. (2024). Un corpus à grande échelle pour évaluer l'argumentation écrite : PERSUADE 2.0. Évaluation de l'écriture, 61.
Une pré-impression de l'article associé est sur zenodo.
Les données sont fournies sous une licence internationale CC BY-NC-SA 4.0 DEED Attribution-NonCommercial-ShareAlike 4.0 (https://creativecommons.org/licenses/by-nc-sa/4.0/deed.en)