Este es el código fuente del documento WSDM'23 "Good-D: en detección de gráficos no supervisado fuera de distribución".
Este código requiere lo siguiente:
Simplemente ejecute el script correspondiente al experimento y el conjunto de datos que desee. Por ejemplo:
bash script/oodd_BZR+COX2.sh
bash script/ad_PROTEINS_full.sh
La estadística de cada par de conjuntos de datos en nuestro punto de referencia se proporciona de la siguiente manera.
Conjunto de datos de identificación | Conjunto de datos OOD | |||||||
No. | Nombre | # Gráfico (Tren/prueba) | # Nodo (AVG.) | # Borde (AVG.) | Nombre | # Gráfico (Prueba) | # Nodo (AVG.) | # Borde (AVG.) |
1 | Bzr | 364/41 | 35.8 | 38.4 | COX2 | 41 | 41.2 | 43.5 |
2 | PTC-MR | 309/35 | 14.3 | 14.7 | Muesca | 35 | 17.9 | 19.8 |
3 | SIDA | 1.800/200 | 15.7 | 16.2 | DHFR | 200 | 42.4 | 44.5 |
4 | Enzimas | 540/60 | 32.6 | 62.1 | PROTEÍNA | 60 | 39.1 | 72.8 |
5 | IMDB-B | 1.350/150 | 19.8 | 96.5 | IMDB-M | 150 | 13.0 | 65.9 |
6 | TOX21 | 7,047/784 | 18.6 | 19.3 | Sidere | 784 | 33.6 | 35.4 |
7 | Freesolv | 577/65 | 8.7 | 8.4 | Tacastado | 65 | 18.8 | 19.3 |
8 | Bbbp | 1,835/204 | 24.1 | 26.0 | Bace | 204 | 34.1 | 36.9 |
9 | Clintox | 1.329/148 | 26.2 | 27.9 | Lipo | 148 | 27.0 | 29.5 |
10 | Esol | 1.015/113 | 13.3 | 13.7 | Muv | 113 | 24.2 | 26.3 |
La estadística de cada conjunto de datos en los experimentos de detección de anomalías se proporciona de la siguiente manera.
Conjunto de datos | # Gráfico (Tren/prueba) | # Nodo (AVG.) | # Borde (AVG.) |
Proteínas llenas | 360/223 | 39.1 | 72.8 |
Enzimas | 400/120 | 32.6 | 62.1 |
SIDA | 1280/400 | 15.7 | 16.2 |
DHFR | 368/152 | 42.4 | 44.5 |
Bzr | 69/81 | 35.8 | 38.4 |
COX2 | 81/94 | 41.2 | 43.5 |
Dd | 390/236 | 284.3 | 715.7 |
NCI1 | 1646/822 | 29.8 | 32.3 |
IMDB-B | 400/200 | 19.8 | 96.5 |
Reddit-b | 800/400 | 429.6 | 497.8 |
Colaboración | 1920/1000 | 74.5 | 2457.8 |
HSE | 423/267 | 16.9 | 17.2 |
MMP | 6170/238 | 17.6 | 18.0 |
p53 | 8088/269 | 17.9 | 18.3 |
Gamma | 219/267 | 17.4 | 17.7 |
En aras de la eficiencia, establecemos las dimensiones de codificación estructural
Realizamos los experimentos en un servidor de Linux con una CPU Intel Xeon Gold 6226R y dos GPU TESLA V100S. Implementamos nuestro método con Pytorch 1.11.0 y Pytorch geométrico 2.0.4.
Si compara, se desarrolla o usa aspectos de este trabajo, cite lo siguiente:
@inproceedings{liu2023goodd,
title={GOOD-D: On Unsupervised Graph Out-Of-Distribution Detection},
author={Liu, Yixin and Ding, Kaize and Liu, Huan and Pan, Shirui},
booktitle={Proceedings of the Sixteenth ACM International Conference on Web Search and Data Mining},
year={2023}
}