transformers data augmentation
1.0.0
与使用预训练 Transformer 模型进行数据增强论文相关的代码
代码包含以下数据增强方法的实现
在论文中,我们使用以下资源中的三个数据集
运行src/utils/download_and_prepare_datasets.sh
文件以准备所有数据集。
download_and_prepare_datasets.sh
执行以下步骤
要运行此代码,您需要以下依赖项
要对给定数据集运行数据增强实验,请运行scripts
夹中的 bash 脚本。例如,要在snips
数据集上运行数据增强,
scripts/bart_snips_lower.sh
进行 BART 实验scripts/bert_snips_lower.sh
以获取其余的数据增强方法 @inproceedings{kumar-etal-2020-data,
title = "Data Augmentation using Pre-trained Transformer Models",
author = "Kumar, Varun and
Choudhary, Ashutosh and
Cho, Eunah",
booktitle = "Proceedings of the 2nd Workshop on Life-long Learning for Spoken Language Systems",
month = dec,
year = "2020",
address = "Suzhou, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.lifelongnlp-1.3",
pages = "18--26",
}
如果对此代码有任何疑问,请联系 [email protected]。
该项目根据 Creative Common Attribution Non-Commercial 4.0 许可证获得许可。