LAUG เป็นชุดเครื่องมือโอเพ่นซอร์สสำหรับการทำความเข้าใจภาษา AUGmentation เป็นวิธีอัตโนมัติในการประมาณความรบกวนตามธรรมชาติของข้อมูลที่มีอยู่ ข้อมูลเสริมสามารถนำมาใช้เพื่อทดสอบความทนทานของกล่องดำหรือปรับปรุงการฝึกอบรมได้ [กระดาษ]
ต้องการหลาม 3.6
โคลนที่เก็บนี้:
git clone https://github.com/thu-coai/LAUG.git
ติดตั้งผ่าน pip:
cd LAUG
pip install -e .
ดาวน์โหลดข้อมูลและโมเดล:
ข้อมูลที่ใช้ในพารามิเตอร์กระดาษและแบบจำลองที่เราฝึกอบรมล่วงหน้ามีอยู่ที่ลิงก์ กรุณาดาวน์โหลดและวางลงใน dir ที่เกี่ยวข้อง สำหรับพารามิเตอร์โมเดลที่เผยแพร่โดยผู้อื่น โปรดดูที่ README.md
ภายใต้ dirs ของวิธีการเสริมแต่ละวิธี เช่น LAUG/aug/Speech_Recognition/README.md
ต่อไปนี้เป็นวิธีการเสริม 4 วิธีที่อธิบายไว้ในรายงานของเรา อยู่ภายใต้ LAUG/aug
dir
Word_Perturbation/
dirText_Paraphrasing/
dirSpeech_Recognition/
dirSpeech_Disfluency/
dirโปรดดูเอกสารของเราและ README.md ในแต่ละวิธีการเสริมสำหรับข้อมูลโดยละเอียด
ดู demo.py
สำหรับการใช้วิธีการเสริมเหล่านี้
python demo.py
โปรดทราบว่าวิธีการเสริมของเรามีโมเดลประสาทหลายแบบ จึงจำเป็นต้องดาวน์โหลดพารามิเตอร์ที่ได้รับการฝึกล่วงหน้าก่อนใช้งาน พารามิเตอร์ที่เราฝึกอบรมล่วงหน้ามีอยู่ที่ลิงก์ สำหรับพารามิเตอร์ที่ผู้อื่นเผยแพร่ โปรดปฏิบัติตามคำแนะนำของแต่ละวิธี
ข้อมูลที่ใช้ในรายงานของเรามีอยู่ที่ ลิงค์ โปรดดาวน์โหลดและวางไว้ data/
dir
ข้อมูลของเราประกอบด้วยชุดข้อมูล 2 ชุด: MultiWOZ และ Frames พร้อมด้วยสำเนาเสริม
มัลติ WOZ
data/multiwoz/
dirdata/multiwoz/WP
data/multiwoz/TP
data/multiwoz/SR
data/multiwoz/SD
data/multiwoz/Enhanced
data/multiwoz/Real
dirเฟรม
data/Frames/
dirdata/Frames/WP
data/Frames/TP
data/Frames/SR
data/Frames/SD
data/Frames/Enhanced
. เรามีโมเดล NLU พื้นฐานสี่แบบตามที่อธิบายไว้ในรายงานของเรา:
โมเดลเหล่านี้ดัดแปลงมาจาก ConvLab-2 สำหรับรายละเอียดเพิ่มเติม คุณสามารถอ้างถึง README.md
ภายใต้ LUAG/nlu/$model/$dataset
dir เช่น LAUG/nlu/gpt/multiwoz/README.md
หากคุณใช้ LAUG ในการวิจัยของคุณ โปรดอ้างอิง:
@inproceedings{liu2021robustness,
title={Robustness Testing of Language Understanding in Task-Oriented Dialog},
author={Liu, Jiexi and Takanobu, Ryuichi and Wen, Jiaxin and Wan, Dazhen and Li, Hongguang and Nie, Weiran and Li, Cheng and Peng, Wei and Huang, Minlie},
year={2021},
booktitle={Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics},
}
ใบอนุญาต Apache 2.0