机器学习 (ML) 系统是现代工具的组成部分,在多个应用领域影响着我们的日常生活。由于其黑匣子性质,这些系统很难在应用领域(例如健康、金融)中采用,在这些领域中,理解决策过程至关重要。开发了解释方法来解释机器学习模型如何针对给定案例/实例做出特定决策。图反事实解释(GCE)是图学习领域采用的解释技术之一。关于图反事实解释的现有工作主要在问题定义、应用领域、测试数据和评估指标方面存在分歧,并且大多数现有工作没有与文献中存在的其他反事实解释技术进行详尽的比较。在这里,我们发布了 GRETEL [1,2],这是一个用于在多种设置中开发和测试 GCE 方法的统一框架。 GRETEL [1,2] 是一个用于评估图反事实解释方法的开源框架。它是使用面向对象范例和工厂方法设计模式来实现的。我们的主要目标是创建一个通用平台,使研究人员能够加快开发和测试新的图反事实解释方法的过程。 GRETEL 是一个高度可扩展的评估框架,通过提供一组明确的机制来轻松集成和管理,促进开放科学和评估的可重复性:真实和合成数据集、ML 模型、最先进的解释技术和评价措施。
GRETEL [1, 2] 是一个用于评估图反事实解释方法的开源框架。它是使用面向对象范例和工厂方法设计模式来实现的。我们的主要目标是创建一个通用平台,使研究人员能够加快开发和测试新的图反事实解释方法的过程。
请参阅 GRETEL 的 wiki
如果您在项目中使用 GRETEL,请引用我们的论文:
马里奥·阿方索·普拉多-罗梅罗和乔瓦尼·斯蒂洛。 2022. GRETEL:图反事实解释评估框架。第 31 届 ACM 国际信息和知识管理会议 (CIKM '22) 的会议记录。计算机协会,美国纽约州纽约市。 https://doi.org/10.1145/3511808.3557608
@inproceedings{prado-romero2022gretel,
title={GRETEL: Graph Counterfactual Explanation Evaluation Framework},
author={Prado-Romero, Mario Alfonso and Stilo, Giovanni},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
isbn = {9781450392365},
year={2022},
doi = {10.1145/3511808.3557608},
booktitle={Proceedings of the 31st ACM International Conference on Information and Knowledge Management},
location = {Atlanta, GA, USA},
series = {CIKM '22}
}
马里奥·阿方索·普拉多-罗梅罗、巴德·普伦卡伊和乔瓦尼·斯蒂洛。 2023. 使用 GRETEL 开发和评估图反事实解释。第十六届 ACM 国际网络搜索和数据挖掘会议 (WSDM '23) 论文集。计算机协会,美国纽约州纽约市,1180–1183 年。 https://doi.org/10.1145/3539597.3573026
@inproceedings{prado-romero2023developing,
author = {Prado-Romero, Mario Alfonso and Prenkaj, Bardh and Stilo, Giovanni},
title = {Developing and Evaluating Graph Counterfactual Explanation with GRETEL},
year = {2023},
isbn = {9781450394079},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
doi = {10.1145/3539597.3573026},
booktitle = {Proceedings of the Sixteenth ACM International Conference on Web Search and Data Mining},
pages = {1180–1183},
location = {Singapore, Singapore},
series = {WSDM '23}
}
马里奥·阿方索·普拉多-罗梅罗、巴德·普伦卡伊、乔瓦尼·斯蒂洛和福斯卡·詹诺蒂。 2023.图反事实解释调查:定义、方法、评估和研究挑战。 ACM 计算。幸存者。刚刚接受(2023 年 9 月)。 https://doi.org/10.1145/3618105
@article{prado-romero2023survey,
author = {Prado-Romero, Mario Alfonso and Prenkaj, Bardh and Stilo, Giovanni and Giannotti, Fosca},
title = {A Survey on Graph Counterfactual Explanations: Definitions, Methods, Evaluation, and Research Challenges},
year = {2023},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
issn = {0360-0300},
url = {https://doi.org/10.1145/3618105},
doi = {10.1145/3618105},
journal = {ACM Comput. Surv.},
month = {sep}
}
Tree-Cycles [3]:合成数据集,其中每个实例都是一个图。实例可以是一棵树,也可以是具有多个循环模式的树,通过一条边连接到主图
无限树:它遵循树循环的方法,但不是循环,而是无限形状。
ASD [4]:自闭症谱系障碍 (ASD),取自自闭症大脑想象数据交换 (ABIDE)。
ADHD [4]:注意力缺陷多动障碍 (ADHD),取自南加州大学多模式连接数据库 (USCD)。
BBBP [5]:血脑屏障渗透是一个分子数据集。预测分子是否可以透过血脑屏障。
HIV [5]:这是一个分子数据集,根据化合物抑制 HIV 的能力对其进行分类。
克尼恩
支持向量机
GCN
ASD Custom Oracle [4](ASD 数据集的特定规则)
Tree-Cycles 自定义 Oracle (保证 Tree-Cycles 数据集 100% 准确度)
DCE搜索:符合分布的解释搜索,主要用作基线,不对底层数据集做出任何假设,并在其中搜索反事实实例。
不经意双向搜索(OBS) [4]:这是一种使用两阶段方法的启发式解释方法。
数据驱动双向搜索(DDBS) [4]:它遵循与OBS相同的逻辑。主要区别在于,该方法使用每条边出现在特定类别的图中的概率(在原始数据集上计算)来驱动反事实搜索过程。
MACCS [5]:与 STONED 模型无关的反事实化合物 (MACCS) 专门设计用于处理分子。
MEG [6]:分子解释生成器是基于强化学习的分子图解释器。
CFF [7] 是一种基于学习的方法,在扰动掩模生成过程中使用反事实和事实推理。
CLEAR [8] 是一种基于学习的解释方法,提供图的生成反事实解释。
CountereRGAN [9] 是基于 GAN 的图像解释方法的移植
Prado-Romero, MA 和 Stilo, G.,2022 年 10 月。 Gretel:图反事实解释评估框架。第 31 届 ACM 国际信息与知识管理会议论文集(第 4389-4393 页)。
Prado-Romero, MA、Prenkaj, B. 和 Stilo, G.,2023 年 2 月。使用 GRETEL 开发和评估图反事实解释。第十六届 ACM 国际网络搜索和数据挖掘会议记录(第 1180-1183 页)。
应志涛、迪伦·布尔乔亚、尤嘉轩、马琳卡·齐特尼克和尤尔·莱斯科维奇。 2019.Gnnexplainer:生成图神经网络的解释。神经信息处理系统的进展 32 (2019)
卡洛·阿布拉特和弗朗西斯科·邦奇。 2021.可解释的大脑网络分类的反事实图。第 27 届 ACM SIGKDD 知识发现和数据挖掘会议论文集。 2495–2504
吉米·P·维拉瓦特 (Geemi P Wellawatte)、阿迪蒂·塞沙德里 (Aditi Seshadri) 和安德鲁·D·怀特 (Andrew D White)。 2022. 分子反事实解释的模型不可知生成。化学科学 13, 13 (2022), 3697–370
Numeroso, D. 和 Bacciu, D.,2021 年 7 月。 Meg:为深层图网络生成分子反事实解释。 2021 年国际神经网络联合会议 (IJCNN)(第 1-8 页)。 IEEE。
谭健、耿胜、付志、葛勇、徐胜、李勇、张勇,2022 年 4 月。基于反事实和事实推理来学习和评估图神经网络解释。 2022 年 ACM 网络会议论文集(第 1018-1027 页)。
Ma, J.、Guo, R.、Mishra, S.、Zhang, A. 和 Li, J.,2022。清晰:图上的生成反事实解释。神经信息处理系统的进展,35,第 25895-25907 页。
Nemirovsky, D.、Thiebaut, N.、Xu, Y. 和 Gupta, A.,2022 年 8 月。 CounteRGAN:使用残余 GAN 生成反事实以实现实时资源和可解释性。人工智能的不确定性(第 1488-1497 页)。 PMLR。