機器學習 (ML) 系統是現代工具的組成部分,在多個應用領域影響著我們的日常生活。由於其黑盒子性質,這些系統很難在應用領域(例如健康、金融)中採用,在這些領域中,理解決策過程至關重要。開發了解釋方法來解釋機器學習模型如何針對給定案例/實例做出特定決策。圖反事實解釋(GCE)是圖學習領域所採用的解釋技術之一。關於圖反事實解釋的現有工作主要在問題定義、應用領域、測試數據和評估指標方面存在分歧,並且大多數現有工作沒有與文獻中存在的其他反事實解釋技術進行詳盡的比較。在這裡,我們發布了 GRETEL [1,2],這是一個用於在多種設定中開發和測試 GCE 方法的統一框架。 GRETEL [1,2] 是一個用於評估圖反事實解釋方法的開源框架。它是使用物件導向範例和工廠方法設計模式來實現的。我們的主要目標是創建一個通用平台,使研究人員能夠加快開發和測試新的圖反事實解釋方法的流程。 GRETEL 是一個高度可擴展的評估框架,透過提供一組明確的機制來輕鬆整合和管理,促進開放科學和評估的可重複性:真實和合成資料集、ML 模型、最先進的解釋技術和評估措施。
GRETEL [1, 2] 是一個用於評估圖反事實解釋方法的開源框架。它是使用物件導向範例和工廠方法設計模式來實現的。我們的主要目標是創建一個通用平台,使研究人員能夠加快開發和測試新的圖反事實解釋方法的流程。
請參閱 GRETEL 的 wiki
如果您在專案中使用 GRETEL,請引用我們的論文:
馬裡奧·阿方索·普拉多-羅梅羅和喬瓦尼·斯蒂洛。 2022. GRETEL:圖反事實解釋評估架構。第 31 屆 ACM 國際資訊與知識管理會議 (CIKM '22) 的會議記錄。電腦協會,美國紐約州紐約市。 https://doi.org/10.1145/3511808.3557608
@inproceedings{prado-romero2022gretel,
title={GRETEL: Graph Counterfactual Explanation Evaluation Framework},
author={Prado-Romero, Mario Alfonso and Stilo, Giovanni},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
isbn = {9781450392365},
year={2022},
doi = {10.1145/3511808.3557608},
booktitle={Proceedings of the 31st ACM International Conference on Information and Knowledge Management},
location = {Atlanta, GA, USA},
series = {CIKM '22}
}
馬裡奧·阿方索·普拉多-羅梅羅、巴德·普倫卡伊和喬瓦尼·斯蒂洛。 2023. 使用 GRETEL 發展和評估圖反事實解釋。第十六屆 ACM 國際網路搜尋與資料探勘會議 (WSDM '23) 論文集。電腦協會,美國紐約州紐約市,1180–1183 年。 https://doi.org/10.1145/3539597.3573026
@inproceedings{prado-romero2023developing,
author = {Prado-Romero, Mario Alfonso and Prenkaj, Bardh and Stilo, Giovanni},
title = {Developing and Evaluating Graph Counterfactual Explanation with GRETEL},
year = {2023},
isbn = {9781450394079},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
doi = {10.1145/3539597.3573026},
booktitle = {Proceedings of the Sixteenth ACM International Conference on Web Search and Data Mining},
pages = {1180–1183},
location = {Singapore, Singapore},
series = {WSDM '23}
}
馬裡奧·阿方索·普拉多-羅梅羅、巴德·普倫卡伊、喬瓦尼·斯蒂洛和福斯卡·詹諾蒂。 2023.圖反事實解釋調查:定義、方法、評估與研究挑戰。 ACM 計算。倖存者。剛接受(2023 年 9 月)。 https://doi.org/10.1145/3618105
@article{prado-romero2023survey,
author = {Prado-Romero, Mario Alfonso and Prenkaj, Bardh and Stilo, Giovanni and Giannotti, Fosca},
title = {A Survey on Graph Counterfactual Explanations: Definitions, Methods, Evaluation, and Research Challenges},
year = {2023},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
issn = {0360-0300},
url = {https://doi.org/10.1145/3618105},
doi = {10.1145/3618105},
journal = {ACM Comput. Surv.},
month = {sep}
}
Tree-Cycles [3]:合成資料集,其中每個實例都是一個圖。實例可以是一棵樹,也可以是具有多個循環模式的樹,透過一邊連接到主圖
無限樹:它遵循樹循環的方法,但不是循環,而是無限形狀。
ASD [4]:自閉症譜系障礙 (ASD),取自自閉症大腦想像資料交換 (ABIDE)。
ADHD [4]:注意力不足過動症 (ADHD),取自南加州大學多模式連結資料庫 (USCD)。
BBBP [5]:血腦障壁滲透是一個分子資料集。預測分子是否可以透過血腦障壁。
HIV [5]:這是一個分子資料集,根據化合物抑制 HIV 的能力進行分類。
克尼恩
支援向量機
GCN
ASD Custom Oracle [4](ASD 資料集的特定規則)
Tree-Cycles 自訂 Oracle (保證 Tree-Cycles 資料集 100% 準確度)
DCE搜尋:符合分佈的解釋搜索,主要用作基線,不對底層資料集做出任何假設,並在其中搜尋反事實實例。
不經意雙向搜尋(OBS) [4]:這是一種使用兩階段方法的啟發式解釋方法。
資料驅動雙向搜尋(DDBS) [4]:它遵循與OBS相同的邏輯。主要區別在於,該方法使用每條邊出現在特定類別的圖中的機率(在原始資料集上計算)來驅動反事實搜尋過程。
MACCS [5]:與 STONED 模型無關的反事實化合物 (MACCS) 專門設計用於處理分子。
MEG [6]:分子解釋生成器是基於強化學習的分子圖解釋器。
CFF [7] 是一種基於學習的方法,在擾動掩模生成過程中使用反事實和事實推理。
CLEAR [8] 是一種基於學習的解釋方法,提供圖的生成反事實解釋。
CountereRGAN [9] 是基於 GAN 的圖像解釋方法的移植
Prado-Romero, MA 和 Stilo, G.,2022 年 10 月。 Gretel:圖反事實解釋評估架構。第 31 屆 ACM 國際資訊與知識管理會議論文集(第 4389-4393 頁)。
Prado-Romero, MA、Prenkaj, B. 和 Stilo, G.,2023 年 2 月。使用 GRETEL 開發和評估圖反事實解釋。第十六屆 ACM 國際網路搜尋與資料探勘會議紀錄(第 1180-1183 頁)。
應志濤、迪倫·布爾喬亞、尤嘉軒、馬琳卡·齊特尼克和尤爾·萊斯科維奇。 2019.Gnnexplainer:生成圖神經網路的解釋。神經資訊處理系統的進展 32 (2019)
卡洛·阿布拉特和弗朗西斯科·邦奇。 2021.可解釋的大腦網路分類的反事實圖。第 27 屆 ACM SIGKDD 知識發現與資料探勘會議論文集。 2495–2504
吉米·P·維拉瓦特 (Geemi P Wellawatte)、阿迪蒂·塞沙德里 (Aditi Seshadri) 和安德魯·D·懷特 (Andrew D White)。 2022. 分子反事實解釋的模型不可知生成。化學科學 13, 13 (2022), 3697–370
Numeroso, D. 與 Bacciu, D.,2021 年 7 月。 Meg:為深層圖網絡產生分子反事實解釋。 2021 年國際神經網路聯合會議 (IJCNN)(第 1-8 頁)。 IEEE。
譚健、耿勝、付志、葛勇、徐勝、李勇、張勇,2022 年 4 月。基於反事實和事實推理來學習和評估圖神經網路解釋。 2022 年 ACM 網路會議論文集(第 1018-1027 頁)。
Ma, J.、Guo, R.、Mishra, S.、Zhang, A. 和 Li, J.,2022。神經資訊處理系統的進展,35,第 25895-25907 頁。
Nemirovsky, D.、Thiebaut, N.、Xu, Y. 和 Gupta, A.,2022 年 8 月。 CounteRGAN:使用殘差 GAN 產生反事實以實現即時資源和可解釋性。人工智慧的不確定性(第 1488-1497 頁)。 PMLR。