transformers data augmentation
1.0.0
الكود المرتبط بتعزيز البيانات باستخدام ورق نماذج المحولات المدربة مسبقًا
يحتوي الكود على تنفيذ طرق زيادة البيانات التالية
في الورق، نستخدم ثلاث مجموعات بيانات من الموارد التالية
قم بتشغيل ملف src/utils/download_and_prepare_datasets.sh
لإعداد جميع مجموعات البيانات.
يقوم download_and_prepare_datasets.sh
بتنفيذ الخطوات التالية
لتشغيل هذا الرمز، تحتاج إلى التبعيات التالية
لتشغيل تجربة زيادة البيانات لمجموعة بيانات معينة، قم بتشغيل البرنامج النصي bash في مجلد scripts
. على سبيل المثال، لتشغيل زيادة البيانات في مجموعة بيانات snips
،
scripts/bart_snips_lower.sh
لتجربة BARTscripts/bert_snips_lower.sh
لبقية طرق زيادة البيانات @inproceedings{kumar-etal-2020-data,
title = "Data Augmentation using Pre-trained Transformer Models",
author = "Kumar, Varun and
Choudhary, Ashutosh and
Cho, Eunah",
booktitle = "Proceedings of the 2nd Workshop on Life-long Learning for Spoken Language Systems",
month = dec,
year = "2020",
address = "Suzhou, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.lifelongnlp-1.3",
pages = "18--26",
}
يرجى التواصل مع [email protected] لطرح أي أسئلة تتعلق بهذا الرمز.
تم ترخيص هذا المشروع بموجب ترخيص Creative Common Attribution Non-Commercial 4.0.