Ceci est le code source du papier WSDM'23 "Good-D: sur la détection des graphiques non supervisés".
Ce code nécessite ce qui suit:
Exécutez simplement le script correspondant à l'expérience et à l'ensemble de données que vous souhaitez. Par exemple:
bash script/oodd_BZR+COX2.sh
bash script/ad_PROTEINS_full.sh
La statistique de chaque paire d'ensembles de données dans notre référence est fournie comme suit.
Jeu de données ID | Ensemble de données OOD | |||||||
Non. | Nom | # Graphique (Train / test) | # Nœud (avg.) | # Bord (avg.) | Nom | # Graphique (Test) | # Nœud (avg.) | # Bord (avg.) |
1 | Bzr | 364/41 | 35.8 | 38.4 | COX2 | 41 | 41.2 | 43.5 |
2 | PTC-MR | 309/35 | 14.3 | 14.7 | Mutag | 35 | 17.9 | 19.8 |
3 | sida | 1 800/200 | 15.7 | 16.2 | Dhfr | 200 | 42.4 | 44.5 |
4 | Enzymes | 540/60 | 32.6 | 62.1 | PROTÉINE | 60 | 39.1 | 72.8 |
5 | IMDB-B | 1,350/150 | 19.8 | 96.5 | Imdb-m | 150 | 13.0 | 65.9 |
6 | TOX21 | 7 047/784 | 18.6 | 19.3 | Sider | 784 | 33.6 | 35.4 |
7 | Freesolv | 577/65 | 8.7 | 8.4 | Toxquer | 65 | 18.8 | 19.3 |
8 | Bbbp | 1 835/204 | 24.1 | 26.0 | Se pavaner | 204 | 34.1 | 36.9 |
9 | Clintoxe | 1 329/148 | 26.2 | 27.9 | Lipo | 148 | 27.0 | 29.5 |
10 | Esol | 1 015/113 | 13.3 | 13.7 | Muv | 113 | 24.2 | 26.3 |
La statistique de chaque ensemble de données dans les expériences de détection d'anomalies est fournie comme suit.
Ensemble de données | # Graphique (Train / test) | # Nœud (avg.) | # Bord (avg.) |
Protéines | 360/223 | 39.1 | 72.8 |
Enzymes | 400/120 | 32.6 | 62.1 |
sida | 1280/400 | 15.7 | 16.2 |
Dhfr | 368/152 | 42.4 | 44.5 |
Bzr | 69/81 | 35.8 | 38.4 |
COX2 | 81/94 | 41.2 | 43.5 |
Dd | 390/236 | 284.3 | 715.7 |
Nci1 | 1646/822 | 29.8 | 32.3 |
IMDB-B | 400/200 | 19.8 | 96.5 |
Reddit-b | 800/400 | 429.6 | 497.8 |
Collaboration | 1920/1000 | 74.5 | 2457.8 |
HSE | 423/267 | 16.9 | 17.2 |
MMP | 6170/238 | 17.6 | 18.0 |
p53 | 8088/269 | 17.9 | 18.3 |
PPAR-GAMMA | 219/267 | 17.4 | 17.7 |
Par souci d'efficacité, nous avons réglé les dimensions de codage structurel
Nous effectuons les expériences sur un serveur Linux avec un CPU Intel Xeon Gold 6226R et deux GPU Tesla V100S. Nous mettons en œuvre notre méthode avec Pytorch 1.11.0 et Pytorch Geometric 2.0.4.
Si vous comparez, construisez ou utilisez des aspects de ce travail, veuillez citer ce qui suit:
@inproceedings{liu2023goodd,
title={GOOD-D: On Unsupervised Graph Out-Of-Distribution Detection},
author={Liu, Yixin and Ding, Kaize and Liu, Huan and Pan, Shirui},
booktitle={Proceedings of the Sixteenth ACM International Conference on Web Search and Data Mining},
year={2023}
}