explain then predict
1.0.0
このリポジトリには、BlackBoxNLP 2024 @ EMNLP 論文のソース コードが含まれています。
説明を使用した自然言語推論における敵対的な堅牢性の強化
この研究では、自然言語推論 (NLI) タスクにおける中間説明の使用が、敵対的な攻撃に対するモデルに依存しない防御戦略として機能するかどうかを調査します。私たちの主張は、中間の説明によって、入力ペア (前提、仮説) における敵対的攻撃によって重畳された潜在的なノイズを除去できるということです。広範な実験を通じて、入力前提と仮説の間の推論関係を記述する中間説明に基づいて出力ラベル (含意、矛盾、中立) を条件付けることで、敵対的な堅牢性が実際に達成されることを証明します。
リポジトリは、次のコア ディレクトリに編成されています。
fine-tuning
: 実験で使用されるすべてのモデルをトレーニングおよび評価するためのコードが含まれています。詳細については、 fine-tuning
ディレクトリにある README ファイルを参照してください。adversarial_attacks
: 前述のモデルに対して敵対的攻撃を実行するためのコードが含まれています。詳細については、 adversarial_attacks
ディレクトリにある README ファイルを参照してください。 git clone https://github.com/alexkoulakos/explain-then-predict.git
cd explain-then-predict
virtualenv --system-site-packages venv
src venv/bin/activate
(Linux/MacOS の場合) または./venv/Scripts/activate.ps1
(Windows の場合)pip install -r requirements.txt
問題やバグが発生した場合、または質問がある場合は、お気軽に GitHub で問題を開いてください。次のような、発生した問題について説明してください。
迅速に対応し、問題の解決に貢献できるよう最善を尽くします。
私たちの調査結果を仕事に利用する場合は、忘れずに私たちの論文を引用してください。
@inproceedings{koulakos-etal-2024-enhancing,
title = "Enhancing adversarial robustness in Natural Language Inference using explanations",
author = "Koulakos, Alexandros and Lymperaiou, Maria and Filandrianos, Giorgos and Stamou, Giorgos",
editor = "Belinkov, Yonatan and Kim, Najoung and Jumelet, Jaap and Mohebbi, Hosein and Mueller, Aaron and Chen, Hanjie",
booktitle = "Proceedings of the 7th BlackboxNLP Workshop: Analyzing and Interpreting Neural Networks for NLP",
month = nov,
year = "2024",
address = "Miami, Florida, US",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2024.blackboxnlp-1.7",
pages = "105--117"
}