El corpus PERSUADE 2.0 se basa en el corpus PERSUADE 1.0 al proporcionar puntuaciones de ensayo holísticas para cada ensayo persuasivo en el corpus PERSUADE 1.0, así como puntuaciones de competencia para cada elemento argumentativo y discursivo que se encuentra en el corpus inicial. Esta versión también contiene todos los ensayos (en comparación con la 1.0 que vinculaba el conjunto de entrenamiento para la competencia Kaggle)
En total, el corpus PERSUADE 2.0 comprende más de 25.000 ensayos argumentativos producidos por estudiantes de 6º a 12º grado en los Estados Unidos para 15 indicaciones sobre dos tareas de escritura: escritura independiente y basada en fuentes. El corpus PERSUADE 2.0 proporciona información individual y demográfica detallada de cada escritor, así como las anotaciones iniciales para los elementos argumentativos y discursivos encontrados en PERSUADE 1.0.
Los archivos .csv son demasiado grandes para github. Los enlaces para los marcos de datos están a continuación.
Todas las anotaciones y puntuaciones de efectividad de los elementos argumentativos y discursivos están disponibles en
conjunto de entrenamiento
conjunto de prueba
TENGA EN CUENTA : El conjunto de prueba es un archivo zip protegido con contraseña. La contraseña es persuade_test .
Es posible que necesites utilizar un software específico para descifrar el archivo zip como 7-Zip para Windows o Keka para Mac.
El artículo publicado para el conjunto de datos que está disponible se publica aquí.
La referencia del artículo es
Crossley, SA, Baffour, P., Tian, Y., Franklin, A., Benner, M. y Boser., U. (2024). Un corpus a gran escala para la evaluación de la argumentación escrita: PERSUADE 2.0. Evaluación de la escritura, 61.
Hay una preimpresión del artículo asociado en zenodo.
Los datos se proporcionan bajo una licencia CC BY-NC-SA 4.0 DEED Attribution-NonCommercial-ShareAlike 4.0 International (https://creativecommons.org/licenses/by-nc-sa/4.0/deed.en)