機械学習 (ML) システムは、いくつかのアプリケーション ドメインで私たちの日常生活に影響を与える最新ツールの構築部分です。ブラックボックスの性質のため、これらのシステムは、意思決定プロセスを理解することが最も重要であるアプリケーション領域 (健康、金融など) ではほとんど採用されません。説明方法は、ML モデルが特定のケース/インスタンスに対してどのように特定の決定を下したかを説明するために開発されました。グラフ反事実説明 (GCE) は、グラフ学習ドメインで採用されている説明手法の 1 つです。グラフ反事実説明に関する既存の研究は、問題定義、アプリケーション ドメイン、テスト データ、および評価指標の点で主に分岐しており、既存の研究のほとんどは、文献に存在する他の反事実説明手法と徹底的に比較していません。ここでは、いくつかの設定で GCE メソッドを開発およびテストするための統合フレームワークである GRETEL [1,2] をリリースします。 GRETEL [1,2] は、グラフの反事実説明メソッドを評価するためのオープンソース フレームワークです。これは、オブジェクト指向パラダイムとファクトリー メソッド設計パターンを使用して実装されます。私たちの主な目標は、研究者が新しいグラフ反事実説明手法の開発とテストのプロセスをスピードアップできる汎用プラットフォームを作成することです。 GRETEL は、実際のデータセットと合成データセット、ML モデル、最先端の説明技術など、簡単に統合および管理するための明確に定義された一連のメカニズムを提供することで、オープン サイエンスと評価の再現性を促進する、拡張性の高い評価フレームワークです。 、評価尺度。
GRETEL [1、2] は、グラフの反事実説明メソッドを評価するためのオープンソース フレームワークです。これは、オブジェクト指向パラダイムとファクトリー メソッド設計パターンを使用して実装されます。私たちの主な目標は、研究者が新しいグラフ反事実説明手法の開発とテストのプロセスをスピードアップできる汎用プラットフォームを作成することです。
グレーテルのwikiを参照
プロジェクトで GRETEL を使用する場合は、私たちの論文を引用してください。
マリオ・アルフォンソ・プラド=ロメロとジョバンニ・スティロ。 2022. GRETEL: グラフ反事実説明評価フレームワーク。第 31 回 ACM 情報および知識管理に関する国際会議 (CIKM '22) の議事録。米国ニューヨーク州ニューヨークのコンピューティング機械協会。 https://doi.org/10.1145/3511808.3557608
@inproceedings{prado-romero2022gretel,
title={GRETEL: Graph Counterfactual Explanation Evaluation Framework},
author={Prado-Romero, Mario Alfonso and Stilo, Giovanni},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
isbn = {9781450392365},
year={2022},
doi = {10.1145/3511808.3557608},
booktitle={Proceedings of the 31st ACM International Conference on Information and Knowledge Management},
location = {Atlanta, GA, USA},
series = {CIKM '22}
}
マリオ・アルフォンソ・プラド=ロメロ、バルド・プレンカジ、ジョバンニ・スティロ。 2023. GRETEL を使用したグラフ反事実説明の開発と評価。 Web 検索とデータ マイニングに関する第 16 回 ACM 国際会議 (WSDM '23) の議事録。 Association for Computing Machinery、米国ニューヨーク州ニューヨーク、1180 ~ 1183。 https://doi.org/10.1145/3539597.3573026
@inproceedings{prado-romero2023developing,
author = {Prado-Romero, Mario Alfonso and Prenkaj, Bardh and Stilo, Giovanni},
title = {Developing and Evaluating Graph Counterfactual Explanation with GRETEL},
year = {2023},
isbn = {9781450394079},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
doi = {10.1145/3539597.3573026},
booktitle = {Proceedings of the Sixteenth ACM International Conference on Web Search and Data Mining},
pages = {1180–1183},
location = {Singapore, Singapore},
series = {WSDM '23}
}
マリオ・アルフォンソ・プラド=ロメロ、バルド・プレンカジ、ジョバンニ・スティロ、フォスカ・ジャンノッティ。 2023. グラフの反事実的説明に関する調査: 定義、方法、評価、および研究課題。 ACM コンピューティング。生き残る。承認されたばかりです (2023 年 9 月)。 https://doi.org/10.1145/3618105
@article{prado-romero2023survey,
author = {Prado-Romero, Mario Alfonso and Prenkaj, Bardh and Stilo, Giovanni and Giannotti, Fosca},
title = {A Survey on Graph Counterfactual Explanations: Definitions, Methods, Evaluation, and Research Challenges},
year = {2023},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
issn = {0360-0300},
url = {https://doi.org/10.1145/3618105},
doi = {10.1145/3618105},
journal = {ACM Comput. Surv.},
month = {sep}
}
Tree-Cycles [3]: 各インスタンスがグラフである合成データ セット。インスタンスは、ツリー、または 1 つのエッジでメイン グラフに接続された複数のサイクル パターンを持つツリーのいずれかになります。
Tree-Infinity : Tree-Cycles のアプローチに従いますが、サイクルの代わりに無限の形状があります。
ASD [4]: 自閉症スペクトラム障害 (ASD) は、Autism Brain Imagine Data Exchange (ABIDE) から引用されました。
ADHD [4]: 注意欠陥多動性障害 (ADHD) は、USC Multimodal Connectivity Database (USCD) から取得されています。
BBBP [5]: 血液脳関門透過は分子データセットです。分子が血液脳関門を透過できるかどうかを予測します。
HIV [5]: HIV を阻害する能力に基づいて化合物を分類する分子データセットです。
KNN
SVM
GCN
ASD カスタム Oracle [4] (ASD データセットに固有のルール)
Tree-Cycles Custom Oracle (Tree-Cycles データセットで 100% の精度を保証)
DCE 検索: ディストリビューション準拠 説明 検索は主にベースラインとして使用され、基礎となるデータセットについていかなる仮定も行わず、その中で反事実のインスタンスを検索します。
Oblivious Bidirection Search (OBS) [4]: 2 段階のアプローチを使用するヒューリスティックな説明方法です。
データ駆動型双方向検索 (DDBS) [4]: OBS と同じロジックに従います。主な違いは、このメソッドでは、特定のクラスのグラフに表示される各エッジの確率 (元のデータセットで計算された) を使用して、反事実検索プロセスを駆動することです。
MACCS [5]: Model Agnostic Counterfactual Compounds with STONED (MACCS) は、分子を扱うように特別に設計されています。
MEG [6]: Molecular Description Generator は、分子グラフ用の RL ベースの Explainer です。
CFF [7] は、摂動マスク生成プロセスで反事実と事実推論を使用する学習ベースの方法です。
CLEAR [8] は、グラフ上で反事実の生成的説明を提供する学習ベースの説明方法です。
CounteRGAN [9] は GAN ベースの画像説明手法の移植です
マサチューセッツ州プラド・ロメロおよびG.スティロ、2022年10月。グレーテル: グラフの反事実説明評価フレームワーク。情報および知識管理に関する第 31 回 ACM 国際会議議事録 (pp. 4389-4393)。
マサチューセッツ州プラド・ロメロ、B. プレンカジ、G. スティロ、2023 年 2 月。 GRETEL を使用したグラフ反事実説明の開発と評価。 Web 検索とデータ マイニングに関する第 16 回 ACM 国際会議議事録 (pp. 1180-1183)。
ジータオ・イン、ディラン・ブルジョワ、ジアシュアン・ユー、マリンカ・ツィトニク、ジュレ・レスコヴェツ。 2019. Gnnexplainer: グラフ ニューラル ネットワークの説明を生成します。神経情報処理システムの進歩 32 (2019)
カルロ・アブラーテとフランチェスコ・ボンキ。 2021. 脳ネットワークの説明可能な分類のための反事実グラフ。知識発見とデータ マイニングに関する第 27 回 ACM SIGKDD カンファレンスの議事録。 2495–2504
ジーミ・P・ウェラワット、アディティ・セシャドリ、アンドリュー・D・ホワイト。 2022. 分子に対する反事実的な説明のモデルに依存しない生成。化学 13、13 (2022)、3697–370
Numeroso, D. および Bacciu, D.、2021 年 7 月。 Meg: ディープ グラフ ネットワークに対する分子の反事実的な説明を生成しています。 2021 年のニューラル ネットワークに関する国際合同会議 (IJCNN) (pp. 1-8)。 IEEE。
Tan, J.、Geng, S.、Fu, Z.、Ge, Y.、Xu, S.、Li, Y.、Zhang, Y.、2022 年 4 月。反事実的および事実に基づく推論に基づいて、グラフ ニューラル ネットワークの説明を学習および評価します。 ACM Web Conference 2022 の議事録 (pp. 1018-1027)。
Ma, J.、Guo, R.、Mishra, S.、Zhang, A.、Li, J.、2022 年。明確: グラフに関する生成的な反事実の説明。神経情報処理システムの進歩、35、pp.25895-25907。
Nemirovsky, D.、Thiebaut, N.、Xu, Y.、Gupta, A.、2022 年 8 月。 CounteRGAN: 残差 GAN を使用して、リアルタイムのリソースと解釈可能性のための反事実を生成します。人工知能における不確実性 (pp. 1488-1497)。 PMLR。