Código associado ao aumento de dados usando papel de modelos de transformadores pré-treinados
O código contém a implementação dos seguintes métodos de aumento de dados
No papel, usamos três conjuntos de dados dos seguintes recursos
Execute o arquivo src/utils/download_and_prepare_datasets.sh
para preparar todos os conjuntos de dados.
download_and_prepare_datasets.sh
executa as seguintes etapas
Para executar este código, você precisa das seguintes dependências
Para executar um experimento de aumento de dados para um determinado conjunto de dados, execute o script bash na pasta de scripts
. Por exemplo, para executar o aumento de dados no conjunto de dados snips
,
scripts/bart_snips_lower.sh
para experimento BARTscripts/bert_snips_lower.sh
para o restante dos métodos de aumento de dados @inproceedings{kumar-etal-2020-data,
title = "Data Augmentation using Pre-trained Transformer Models",
author = "Kumar, Varun and
Choudhary, Ashutosh and
Cho, Eunah",
booktitle = "Proceedings of the 2nd Workshop on Life-long Learning for Spoken Language Systems",
month = dec,
year = "2020",
address = "Suzhou, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.lifelongnlp-1.3",
pages = "18--26",
}
Entre em contato com [email protected] para qualquer dúvida relacionada a este código.
Este projeto está licenciado sob a licença Creative Common Attribution Non-Commercial 4.0.