transformers data augmentation
1.0.0
事前トレーニングされたトランスフォーマー モデルを使用したデータ拡張に関する論文に関連するコード
コードには次のデータ拡張メソッドの実装が含まれています
論文では、次のリソースから 3 つのデータセットを使用します。
src/utils/download_and_prepare_datasets.sh
ファイルを実行して、すべてのデータセットを準備します。
download_and_prepare_datasets.sh
次の手順を実行します
このコードを実行するには、次の依存関係が必要です
特定のデータセットに対してデータ拡張実験を実行するには、 scripts
フォルダーで bash スクリプトを実行します。たとえば、 snips
データセットに対してデータ拡張を実行するには、次のようにします。
scripts/bart_snips_lower.sh
を実行します。scripts/bert_snips_lower.sh
を実行します。 @inproceedings{kumar-etal-2020-data,
title = "Data Augmentation using Pre-trained Transformer Models",
author = "Kumar, Varun and
Choudhary, Ashutosh and
Cho, Eunah",
booktitle = "Proceedings of the 2nd Workshop on Life-long Learning for Spoken Language Systems",
month = dec,
year = "2020",
address = "Suzhou, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.lifelongnlp-1.3",
pages = "18--26",
}
このコードに関するご質問については、[email protected] までお問い合わせください。
このプロジェクトは、Creative Common Attribution Non-Commercial 4.0 ライセンスに基づいてライセンスされています。