transformers data augmentation
1.0.0
사전 훈련된 변환기 모델을 사용한 데이터 증대와 관련된 코드 문서
코드에는 다음과 같은 데이터 증대 방법의 구현이 포함되어 있습니다.
논문에서는 다음 리소스의 세 가지 데이터 세트를 사용합니다.
src/utils/download_and_prepare_datasets.sh
파일을 실행하여 모든 데이터 세트를 준비합니다.
download_and_prepare_datasets.sh
다음 단계를 수행합니다.
이 코드를 실행하려면 다음 종속성이 필요합니다.
특정 데이터세트에 대한 데이터 증대 실험을 실행하려면 scripts
폴더에서 bash 스크립트를 실행하세요. 예를 들어, snips
데이터 세트에서 데이터 증대를 실행하려면 다음을 수행합니다.
scripts/bart_snips_lower.sh
실행하세요.scripts/bert_snips_lower.sh
실행하세요. @inproceedings{kumar-etal-2020-data,
title = "Data Augmentation using Pre-trained Transformer Models",
author = "Kumar, Varun and
Choudhary, Ashutosh and
Cho, Eunah",
booktitle = "Proceedings of the 2nd Workshop on Life-long Learning for Spoken Language Systems",
month = dec,
year = "2020",
address = "Suzhou, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.lifelongnlp-1.3",
pages = "18--26",
}
이 코드와 관련된 질문이 있는 경우 [email protected]으로 문의하십시오.
이 프로젝트는 Creative Common Attribution Non-Commercial 4.0 라이선스에 따라 라이선스가 부여됩니다.