พื้นที่เก็บข้อมูลนี้มีซอร์สโค้ดสำหรับกระดาษ BlackBoxNLP 2024 @ EMNLP ของเรา:
การเสริมสร้างความแข็งแกร่งของฝ่ายตรงข้ามในการอนุมานภาษาธรรมชาติโดยใช้คำอธิบาย
ในงานนี้ เราตรวจสอบว่าการใช้คำอธิบายระดับกลางในงานการอนุมานภาษาธรรมชาติ (NLI) สามารถทำหน้าที่เป็นกลยุทธ์การป้องกันแบบไม่เชื่อเรื่องพระเจ้าต่อการโจมตีของฝ่ายตรงข้ามได้หรือไม่ คำกล่าวอ้างของเราคือคำอธิบายระดับกลางสามารถกรองสัญญาณรบกวนที่อาจเกิดขึ้นซึ่งซ้อนทับโดยการโจมตีของฝ่ายตรงข้ามในคู่อินพุต (หลักฐาน สมมติฐาน) จากการทดลองอย่างกว้างขวาง เราได้พิสูจน์ว่าการปรับสภาพฉลากเอาต์พุต (การมีส่วนได้ส่วนเสีย ความขัดแย้ง ความเป็นกลาง) บนคำอธิบายระดับกลางที่อธิบายความสัมพันธ์เชิงอนุมานระหว่างสถานที่ตั้งอินพุตและสมมติฐาน ความทนทานต่อความขัดแย้งนั้นเกิดขึ้นได้อย่างแน่นอน
repo ถูกจัดระเบียบในไดเร็กทอรีหลักต่อไปนี้:
fine-tuning
: รวมโค้ดสำหรับการฝึกและประเมินโมเดลทั้งหมดที่ใช้ในการทดลองของเรา ดูไฟล์ README ที่อยู่ในไดเร็กทอรี fine-tuning
สำหรับรายละเอียดเพิ่มเติมadversarial_attacks
: รวมโค้ดสำหรับทำการโจมตีฝ่ายตรงข้ามกับโมเดลดังกล่าว ดูไฟล์ README ที่อยู่ในไดเร็กทอรี adversarial_attacks
สำหรับรายละเอียดเพิ่มเติม git clone https://github.com/alexkoulakos/explain-then-predict.git
cd explain-then-predict
virtualenv --system-site-packages venv
src venv/bin/activate
(สำหรับ Linux/MacOS) หรือ ./venv/Scripts/activate.ps1
(สำหรับ Windows)pip install -r requirements.txt
หากคุณพบปัญหา ข้อบกพร่อง หรือมีคำถาม โปรดอย่าลังเลที่จะเปิดปัญหาบน GitHub อธิบายปัญหาที่คุณพบ ได้แก่:
เราจะพยายามอย่างเต็มที่เพื่อตอบกลับอย่างรวดเร็วและช่วยแก้ไขปัญหาใดๆ
หากคุณใช้สิ่งที่เราค้นพบในการทำงานของคุณ อย่าลืมอ้างอิงรายงานของเรา:
@inproceedings{koulakos-etal-2024-enhancing,
title = "Enhancing adversarial robustness in Natural Language Inference using explanations",
author = "Koulakos, Alexandros and Lymperaiou, Maria and Filandrianos, Giorgos and Stamou, Giorgos",
editor = "Belinkov, Yonatan and Kim, Najoung and Jumelet, Jaap and Mohebbi, Hosein and Mueller, Aaron and Chen, Hanjie",
booktitle = "Proceedings of the 7th BlackboxNLP Workshop: Analyzing and Interpreting Neural Networks for NLP",
month = nov,
year = "2024",
address = "Miami, Florida, US",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2024.blackboxnlp-1.7",
pages = "105--117"
}