Código asociado con el documento Aumento de datos mediante modelos de transformadores previamente entrenados
El código contiene la implementación de los siguientes métodos de aumento de datos.
En papel, utilizamos tres conjuntos de datos de los siguientes recursos.
Ejecute el archivo src/utils/download_and_prepare_datasets.sh
para preparar todos los conjuntos de datos.
download_and_prepare_datasets.sh
realiza los siguientes pasos
Para ejecutar este código, necesita las siguientes dependencias
Para ejecutar un experimento de aumento de datos para un conjunto de datos determinado, ejecute el script bash en la carpeta scripts
. Por ejemplo, para ejecutar el aumento de datos en un conjunto de datos snips
,
scripts/bart_snips_lower.sh
para el experimento BARTscripts/bert_snips_lower.sh
para el resto de los métodos de aumento de datos @inproceedings{kumar-etal-2020-data,
title = "Data Augmentation using Pre-trained Transformer Models",
author = "Kumar, Varun and
Choudhary, Ashutosh and
Cho, Eunah",
booktitle = "Proceedings of the 2nd Workshop on Life-long Learning for Spoken Language Systems",
month = dec,
year = "2020",
address = "Suzhou, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.lifelongnlp-1.3",
pages = "18--26",
}
Comuníquese con [email protected] si tiene alguna pregunta relacionada con este código.
Este proyecto está bajo la licencia Creative Common Attribution Non-Commercial 4.0.