Los sistemas de aprendizaje automático (ML) son una parte fundamental de las herramientas modernas que impactan nuestra vida diaria en varios dominios de aplicaciones. Debido a su naturaleza de caja negra, estos sistemas difícilmente se adoptan en ámbitos de aplicación (por ejemplo, salud, finanzas) donde comprender el proceso de decisión es de suma importancia. Se desarrollaron métodos de explicación para explicar cómo el modelo ML ha tomado una decisión específica para un caso/instancia determinado. Las explicaciones contrafactuales gráficas (GCE) son una de las técnicas de explicación adoptadas en el dominio de aprendizaje gráfico. Los trabajos existentes sobre explicaciones contrafactuales gráficas divergen principalmente en la definición del problema, el dominio de la aplicación, los datos de prueba y las métricas de evaluación, y la mayoría de los trabajos existentes no se comparan exhaustivamente con otras técnicas de explicación contrafactual presentes en la literatura. Aquí lanzamos GRETEL [1,2], un marco unificado para desarrollar y probar métodos GCE en varios entornos. GRETEL [1,2] es un marco de código abierto para evaluar métodos de explicación contrafactual de gráficos. Se implementa utilizando el paradigma orientado a objetos y el patrón de diseño Factory Method. Nuestro principal objetivo es crear una plataforma genérica que permita a los investigadores acelerar el proceso de desarrollo y prueba de nuevos métodos de explicación contrafactual de gráficos. GRETEL es un marco de evaluación altamente extensible que promueve la ciencia abierta y la reproducibilidad de la evaluación al proporcionar un conjunto de mecanismos bien definidos para integrar y gestionar fácilmente: conjuntos de datos tanto reales como sintéticos, modelos de aprendizaje automático, técnicas de explicación de última generación. y medidas de evaluación.
GRETEL [1, 2] es un marco de código abierto para evaluar métodos de explicación contrafactual de gráficos. Se implementa utilizando el paradigma orientado a objetos y el patrón de diseño Factory Method. Nuestro principal objetivo es crear una plataforma genérica que permita a los investigadores acelerar el proceso de desarrollo y prueba de nuevos métodos de explicación contrafactual de gráficos.
Ver la wiki de GRETEL
Por favor cite nuestros artículos si utiliza GRETEL en sus proyectos:
Mario Alfonso Prado-Romero y Giovanni Stilo. 2022. GRETEL: Marco de evaluación de explicaciones contrafactuales gráficas. En actas de la 31ª Conferencia Internacional ACM sobre Gestión de la Información y el Conocimiento (CIKM '22). Association for Computing Machinery, Nueva York, NY, EE. UU. https://doi.org/10.1145/3511808.3557608
@inproceedings{prado-romero2022gretel,
title={GRETEL: Graph Counterfactual Explanation Evaluation Framework},
author={Prado-Romero, Mario Alfonso and Stilo, Giovanni},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
isbn = {9781450392365},
year={2022},
doi = {10.1145/3511808.3557608},
booktitle={Proceedings of the 31st ACM International Conference on Information and Knowledge Management},
location = {Atlanta, GA, USA},
series = {CIKM '22}
}
Mario Alfonso Prado-Romero, Bardh Prenkaj y Giovanni Stilo. 2023. Desarrollo y evaluación de una explicación contrafactual de gráficos con GRETEL. En actas de la decimosexta conferencia internacional ACM sobre búsqueda web y minería de datos (WSDM '23). Association for Computing Machinery, Nueva York, NY, EE. UU., 1180–1183. https://doi.org/10.1145/3539597.3573026
@inproceedings{prado-romero2023developing,
author = {Prado-Romero, Mario Alfonso and Prenkaj, Bardh and Stilo, Giovanni},
title = {Developing and Evaluating Graph Counterfactual Explanation with GRETEL},
year = {2023},
isbn = {9781450394079},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
doi = {10.1145/3539597.3573026},
booktitle = {Proceedings of the Sixteenth ACM International Conference on Web Search and Data Mining},
pages = {1180–1183},
location = {Singapore, Singapore},
series = {WSDM '23}
}
Mario Alfonso Prado-Romero, Bardh Prenkaj, Giovanni Stilo y Fosca Giannotti. 2023. Una encuesta sobre explicaciones contrafactuales de gráficos: definiciones, métodos, evaluación y desafíos de la investigación. Computación ACM. Sobrevivir. Recién aceptado (septiembre de 2023). https://doi.org/10.1145/3618105
@article{prado-romero2023survey,
author = {Prado-Romero, Mario Alfonso and Prenkaj, Bardh and Stilo, Giovanni and Giannotti, Fosca},
title = {A Survey on Graph Counterfactual Explanations: Definitions, Methods, Evaluation, and Research Challenges},
year = {2023},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
issn = {0360-0300},
url = {https://doi.org/10.1145/3618105},
doi = {10.1145/3618105},
journal = {ACM Comput. Surv.},
month = {sep}
}
Tree-Cycles [3]: Conjunto de datos sintéticos donde cada instancia es un gráfico. La instancia puede ser un árbol o un árbol con varios patrones de ciclo conectados al gráfico principal por un borde.
Árbol-Infinito : Sigue el enfoque de los Árbol-Ciclos, pero en lugar de ciclos, hay una forma de infinito.
TEA [4]: Trastorno del espectro autista (TEA) tomado del Autism Brain Imagine Data Exchange (ABIDE).
TDAH [4]: Trastorno por déficit de atención e hiperactividad (TDAH), se toma de la Base de datos de conectividad multimodal (USCD) de la USC.
BBBP [5]: La permeación de la barrera hematoencefálica es un conjunto de datos moleculares. Predecir si una molécula puede atravesar la barrera hematoencefálica.
VIH [5]: Es un conjunto de datos moleculares que clasifica compuestos según su capacidad para inhibir el VIH.
knn
SVM
GCN
ASD Custom Oracle [4] (Reglas específicas para el conjunto de datos ASD)
Oracle personalizado de Tree-Cycles (garantiza el 100% de precisión en el conjunto de datos de Tree-Cycles)
Búsqueda DCE : búsqueda de explicación que cumple con la distribución, utilizada principalmente como línea de base, no hace ninguna suposición sobre el conjunto de datos subyacente y busca una instancia contrafactual en él.
Búsqueda bidireccional ajena (OBS) [4]: es un método de explicación heurístico que utiliza un enfoque de 2 etapas.
Búsqueda bidireccional basada en datos (DDBS) [4]: Sigue la misma lógica que OBS. La principal diferencia es que este método utiliza la probabilidad (calculada en el conjunto de datos original) de que cada borde aparezca en un gráfico de una determinada clase para impulsar el proceso de búsqueda contrafactual.
MACCS [5]: Los compuestos contrafactuales agnósticos modelo con STONED (MACCS) están diseñados específicamente para trabajar con moléculas.
MEG [6]: Molecular Explanation Generator es un explicador basado en RL para gráficos moleculares.
CFF [7] Es un método basado en el aprendizaje que utiliza razonamiento fáctico y contrafactual en el proceso de generación de máscaras de perturbación.
CLEAR [8] es un método de explicación basado en el aprendizaje que proporciona explicaciones contrafactuales generativas en gráficos.
CounteRGAN [9] es una adaptación de un método de explicación de imágenes basado en GAN
Prado-Romero, MA y Stilo, G., 2022, octubre. Gretel: Marco de evaluación de explicaciones contrafactuales gráficas. En Actas de la 31ª Conferencia Internacional ACM sobre Gestión de la Información y el Conocimiento (págs. 4389-4393).
Prado-Romero, MA, Prenkaj, B. y Stilo, G., 2023, febrero. Desarrollo y evaluación de explicaciones contrafactuales de gráficos con GRETEL. En Actas de la Decimosexta Conferencia Internacional ACM sobre Búsqueda Web y Minería de Datos (págs. 1180-1183).
Zhitao Ying, Dylan Bourgeois, Jiaxuan You, Marinka Zitnik y Jure Leskovec. 2019. Gnnexplainer: Generación de explicaciones para redes neuronales gráficas. Avances en sistemas de procesamiento de información neuronal 32 (2019)
Carlo Abrate y Francesco Bonchi. 2021. Gráficos contrafactuales para una clasificación explicable de redes cerebrales. En actas de la 27ª Conferencia ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos. 2495–2504
Geemi P Wellawatte, Aditi Seshadri y Andrew D White. 2022. Modelo de generación agnóstica de explicaciones contrafácticas para moléculas. Ciencia química 13, 13 (2022), 3697–370
Numeroso, D. y Bacciu, D., 2021, julio. Meg: Generación de explicaciones contrafácticas moleculares para redes de gráficos profundos. En 2021, Conferencia Conjunta Internacional sobre Redes Neuronales (IJCNN) (págs. 1-8). IEEE.
Tan, J., Geng, S., Fu, Z., Ge, Y., Xu, S., Li, Y. y Zhang, Y., abril de 2022. Aprender y evaluar explicaciones de redes neuronales gráficas basadas en razonamientos fácticos y contrafactuales. En Actas de la Conferencia Web ACM 2022 (págs. 1018-1027).
Ma, J., Guo, R., Mishra, S., Zhang, A. y Li, J., 2022. Claro: explicaciones contrafactuales generativas en gráficos. Avances en sistemas de procesamiento de información neuronal, 35, páginas 25895-25907.
Nemirovsky, D., Thiebaut, N., Xu, Y. y Gupta, A., agosto de 2022. CounteRGAN: Generación de contrafactuales para recurso e interpretabilidad en tiempo real utilizando GAN residuales. En Incertidumbre en la inteligencia artificial (págs. 1488-1497). PMLR.