Les systèmes d'apprentissage automatique (ML) font partie intégrante des outils modernes qui ont un impact sur notre vie quotidienne dans plusieurs domaines d'application. En raison de leur nature de boîte noire, ces systèmes sont rarement adoptés dans des domaines d'application (par exemple, santé, finance) où la compréhension du processus de décision est d'une importance capitale. Des méthodes d'explication ont été développées pour expliquer comment le modèle ML a pris une décision spécifique pour un cas/instance donné. Les explications contrefactuelles graphiques (GCE) sont l'une des techniques d'explication adoptées dans le domaine de l'apprentissage graphique. Les travaux existants sur les explications contrefactuelles graphiques divergent principalement dans la définition du problème, le domaine d'application, les données de test et les mesures d'évaluation, et la plupart des travaux existants ne se comparent pas de manière exhaustive aux autres techniques d'explication contrefactuelles présentes dans la littérature. Ici, nous publions GRETEL [1,2], un cadre unifié pour développer et tester les méthodes GCE dans plusieurs contextes. GRETEL [1,2] est un framework open source pour l'évaluation des méthodes d'explication contrefactuelle de graphiques. Il est implémenté à l’aide du paradigme orienté objet et du modèle de conception Factory Method. Notre objectif principal est de créer une plate-forme générique qui permet aux chercheurs d'accélérer le processus de développement et de test de nouvelles méthodes d'explication contrefactuelle graphique. GRETEL est un cadre d'évaluation hautement extensible qui favorise la science ouverte et la reproductibilité de l'évaluation en fournissant un ensemble de mécanismes bien définis à intégrer et à gérer facilement : des ensembles de données réels et synthétiques, des modèles ML, des techniques d'explication de pointe. et les mesures d'évaluation.
GRETEL [1, 2] est un framework open source pour l'évaluation des méthodes d'explication contrefactuelle de graphiques. Il est implémenté en utilisant le paradigme orienté objet et le modèle de conception de la méthode Factory. Notre objectif principal est de créer une plate-forme générique qui permet aux chercheurs d'accélérer le processus de développement et de test de nouvelles méthodes d'explication contrefactuelle graphique.
Voir le wiki du GRETEL
Merci de citer nos articles si vous utilisez GRETEL dans vos projets :
Mario Alfonso Prado-Romero et Giovanni Stilo. 2022. GRETEL : Cadre d’évaluation des explications contrefactuelles graphiques. Dans les actes de la 31e Conférence internationale de l'ACM sur la gestion de l'information et des connaissances (CIKM '22). Association pour les machines informatiques, New York, NY, États-Unis. https://doi.org/10.1145/3511808.3557608
@inproceedings{prado-romero2022gretel,
title={GRETEL: Graph Counterfactual Explanation Evaluation Framework},
author={Prado-Romero, Mario Alfonso and Stilo, Giovanni},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
isbn = {9781450392365},
year={2022},
doi = {10.1145/3511808.3557608},
booktitle={Proceedings of the 31st ACM International Conference on Information and Knowledge Management},
location = {Atlanta, GA, USA},
series = {CIKM '22}
}
Mario Alfonso Prado-Romero, Bardh Prenkaj et Giovanni Stilo. 2023. Développer et évaluer une explication contrefactuelle graphique avec GRETEL. Dans les actes de la seizième conférence internationale de l'ACM sur la recherche sur le Web et l'exploration de données (WSDM '23). Association pour les machines informatiques, New York, NY, États-Unis, 1180-1183. https://doi.org/10.1145/3539597.3573026
@inproceedings{prado-romero2023developing,
author = {Prado-Romero, Mario Alfonso and Prenkaj, Bardh and Stilo, Giovanni},
title = {Developing and Evaluating Graph Counterfactual Explanation with GRETEL},
year = {2023},
isbn = {9781450394079},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
doi = {10.1145/3539597.3573026},
booktitle = {Proceedings of the Sixteenth ACM International Conference on Web Search and Data Mining},
pages = {1180–1183},
location = {Singapore, Singapore},
series = {WSDM '23}
}
Mario Alfonso Prado-Romero, Bardh Prenkaj, Giovanni Stilo et Fosca Giannotti. 2023. Une enquête sur les explications contrefactuelles des graphiques : définitions, méthodes, évaluation et défis de recherche. Calcul ACM. Survivre. Vient d'être accepté (septembre 2023). https://doi.org/10.1145/3618105
@article{prado-romero2023survey,
author = {Prado-Romero, Mario Alfonso and Prenkaj, Bardh and Stilo, Giovanni and Giannotti, Fosca},
title = {A Survey on Graph Counterfactual Explanations: Definitions, Methods, Evaluation, and Research Challenges},
year = {2023},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
issn = {0360-0300},
url = {https://doi.org/10.1145/3618105},
doi = {10.1145/3618105},
journal = {ACM Comput. Surv.},
month = {sep}
}
Tree-Cycles [3] : ensemble de données synthétiques où chaque instance est un graphique. L'instance peut être soit un arbre, soit un arbre avec plusieurs modèles de cycles connectés au graphe principal par une arête.
Arbre-Infini : Il suit l'approche des Arbres-Cycles, mais à la place des cycles, il y a une forme infinie.
TSA [4] : Trouble du spectre autistique (TSA) tiré de l'Autism Brain Imagine Data Exchange (ABIDE).
TDAH [4] : trouble d'hyperactivité avec déficit de l'attention (TDAH) est tiré de la base de données de connectivité multimodale de l'USC (USCD).
BBBP [5] : Blood-Crain Barrier Permeation est un ensemble de données moléculaires. Prédire si une molécule peut traverser la barrière hémato-encéphalique.
VIH [5] : Il s'agit d'un ensemble de données moléculaires qui classe les composés en fonction de leur capacité à inhiber le VIH.
KNN
SVM
Réseau Google Consulting
ASD Custom Oracle [4] (Règles spécifiques à l'ensemble de données ASD)
Tree-Cycles Custom Oracle (garantit une précision à 100 % sur l'ensemble de données Tree-Cycles)
Recherche DCE : la recherche d'explications conformes à la distribution, principalement utilisée comme référence, ne fait aucune hypothèse sur l'ensemble de données sous-jacent et recherche une instance contrefactuelle dans celui-ci.
Recherche bidirectionnelle inconsciente (OBS) [4] : Il s'agit d'une méthode d'explication heuristique qui utilise une approche en 2 étapes.
Recherche bidirectionnelle basée sur les données (DDBS) [4] : Elle suit la même logique qu'OBS. La principale différence est que cette méthode utilise la probabilité (calculée sur l'ensemble de données d'origine) de chaque arête d'apparaître dans un graphique d'une certaine classe pour piloter le processus de recherche contrefactuelle.
MACCS [5] : Model Agnostic Counterfactual Compounds with STONED (MACCS) est spécifiquement conçu pour fonctionner avec des molécules.
MEG [6] : Molecular Explanation Generator est un explicateur basé sur RL pour les graphiques moléculaires.
CFF [7] Est une méthode basée sur l'apprentissage qui utilise le raisonnement contrefactuel et factuel dans le processus de génération de masque de perturbation.
CLEAR [8] est une méthode d'explication basée sur l'apprentissage qui fournit des explications contrefactuelles génératives sur des graphiques.
CounterRGAN [9] est un portage d'une méthode d'explication basée sur le GAN pour les images
Prado-Romero, MA et Stilo, G., 2022, octobre. Gretel : Cadre d'évaluation des explications contrefactuelles graphiques. Dans Actes de la 31e Conférence internationale de l'ACM sur la gestion de l'information et des connaissances (pp. 4389-4393).
Prado-Romero, MA, Prenkaj, B. et Stilo, G., 2023, février. Développer et évaluer une explication contrefactuelle graphique avec GRETEL. Dans Actes de la seizième conférence internationale de l'ACM sur la recherche sur le Web et l'exploration de données (pp. 1180-1183).
Zhitao Ying, Dylan Bourgeois, Jiaxuan You, Marinka Zitnik et Jure Leskovec. 2019. Gnnexplainer : Générer des explications pour les réseaux de neurones graphiques. Avancées dans les systèmes de traitement de l’information neuronale 32 (2019)
Carlo Abrate et Francesco Bonchi. 2021. Graphiques contrefactuels pour une classification explicable des réseaux cérébraux. Dans les actes de la 27e conférence ACM SIGKDD sur la découverte des connaissances et l'exploration de données. 2495-2504
Geemi P Wellawatte, Aditi Seshadri et Andrew D White. 2022. Génération indépendante du modèle d’explications contrefactuelles pour les molécules. Sciences chimiques 13, 13 (2022), 3697-370
Numeroso, D. et Bacciu, D., 2021, juillet. Meg : Générer des explications contrefactuelles moléculaires pour les réseaux de graphes profonds. En 2021, Conférence internationale conjointe sur les réseaux de neurones (IJCNN) (pp. 1-8). IEEE.
Tan, J., Geng, S., Fu, Z., Ge, Y., Xu, S., Li, Y. et Zhang, Y., 2022, avril. Apprendre et évaluer des explications de réseaux neuronaux graphiques basées sur un raisonnement contrefactuel et factuel. Dans Actes de la conférence Web ACM 2022 (pp. 1018-1027).
Ma, J., Guo, R., Mishra, S., Zhang, A. et Li, J., 2022. Clair : explications contrefactuelles génératives sur des graphiques. Avancées dans les systèmes de traitement de l'information neuronale, 35, pp.25895-25907.
Nemirovsky, D., Thiebaut, N., Xu, Y. et Gupta, A., 2022, août. CounterRGAN : génération de contrefactuels pour un recours et une interprétabilité en temps réel à l'aide de GAN résiduels. Dans Incertitude dans l'intelligence artificielle (pp. 1488-1497). PMLR.