Корпус PERSUADE 2.0 основан на корпусе PERSUADE 1.0, предоставляя целостные оценки эссе для каждого убедительного эссе в корпусе PERSUADE 1.0, а также оценки квалификации для каждого элемента аргументации и дискурса, обнаруженных в исходном корпусе. Эта версия также содержит все эссе (по сравнению с версией 1.0, которая включала тренировочный набор для соревнований Kaggle).
В общей сложности корпус PERSUADE 2.0 включает более 25 000 аргументативных эссе, написанных учащимися 6–12 классов в США по 15 подсказкам по двум письменным заданиям: самостоятельному написанию и написанию на основе источников. Корпус PERSUADE 2.0 предоставляет подробную индивидуальную и демографическую информацию для каждого автора, а также начальные аннотации для аргументативных и дискурсивных элементов, найденных в PERSUADE 1.0.
Файлы .csv слишком велики для GitHub. Ссылки на фреймы данных приведены ниже.
Все аннотации и оценки эффективности аргументативных и дискурсивных элементов доступны по адресу:
Тренировочный набор
Тестовый набор
ОБРАТИТЕ ВНИМАНИЕ : тестовый набор представляет собой ZIP-файл, защищенный паролем. Пароль — убедить_тест .
Возможно, вам придется использовать специальное программное обеспечение для расшифровки zip-файла, например 7-Zip для Windows или Keka для Mac.
Опубликованная статья для набора данных доступна здесь.
Ссылка на статью
Кроссли, С.А., Баффур, П., Тиан, Ю., Франклин, А., Беннер, М., и Бозер, У. (2024). Крупномасштабный корпус для оценки письменной аргументации: PERSUADE 2.0. Оценка письма, 61.
Предварительная версия соответствующей статьи находится на zenodo.
Данные предоставляются по международной лицензии CC BY-NC-SA 4.0 DEED Attribution-NonCommercial-ShareAlike 4.0 (https://creativecommons.org/licenses/by-nc-sa/4.0/deed.en).