Este é o código-fonte do artigo WSDM'23 "Good-D: no gráfico não supervisionado detecção fora da distribuição".
Este código requer o seguinte:
Basta executar o script correspondente ao experimento e ao conjunto de dados que você deseja. Por exemplo:
bash script/oodd_BZR+COX2.sh
bash script/ad_PROTEINS_full.sh
A estatística de cada par de dados em nossa referência é fornecida da seguinte forma.
ID DATASET | Conjunto de dados OOD | |||||||
Não. | Nome | # Gráfico (Trem/teste) | # Nó (Avg.) | # Borda (Avg.) | Nome | # Gráfico (Teste) | # Nó (Avg.) | # Borda (Avg.) |
1 | BZR | 364/41 | 35.8 | 38.4 | COX2 | 41 | 41.2 | 43.5 |
2 | PTC-MR | 309/35 | 14.3 | 14.7 | Mutag | 35 | 17.9 | 19.8 |
3 | AIDS | 1.800/200 | 15.7 | 16.2 | Dhfr | 200 | 42.4 | 44.5 |
4 | Enzimas | 540/60 | 32.6 | 62.1 | PROTEÍNA | 60 | 39.1 | 72.8 |
5 | IMDB-B | 1.350/150 | 19.8 | 96.5 | IMDB-M | 150 | 13.0 | 65.9 |
6 | Tox21 | 7.047/784 | 18.6 | 19.3 | Sider | 784 | 33.6 | 35.4 |
7 | Freesolv | 577/65 | 8.7 | 8.4 | Toxcast | 65 | 18.8 | 19.3 |
8 | BBBP | 1.835/204 | 24.1 | 26.0 | BACE | 204 | 34.1 | 36.9 |
9 | Clintox | 1.329/148 | 26.2 | 27.9 | Lipo | 148 | 27.0 | 29.5 |
10 | ESOL | 1.015/113 | 13.3 | 13.7 | Muv | 113 | 24.2 | 26.3 |
A estatística de cada conjunto de dados nos experimentos de detecção de anomalia é fornecida da seguinte forma.
Conjunto de dados | # Gráfico (Trem/teste) | # Nó (Avg.) | # Borda (Avg.) |
Proteínas-cheio | 360/223 | 39.1 | 72.8 |
Enzimas | 400/120 | 32.6 | 62.1 |
AIDS | 1280/400 | 15.7 | 16.2 |
Dhfr | 368/152 | 42.4 | 44.5 |
BZR | 69/81 | 35.8 | 38.4 |
COX2 | 81/94 | 41.2 | 43.5 |
Dd | 390/236 | 284.3 | 715.7 |
Nci1 | 1646/822 | 29.8 | 32.3 |
IMDB-B | 400/200 | 19.8 | 96.5 |
Reddit-B | 800/400 | 429.6 | 497.8 |
Collab | 1920/1000 | 74.5 | 2457.8 |
HSE | 423/267 | 16.9 | 17.2 |
Mmp | 6170/238 | 17.6 | 18.0 |
p53 | 8088/269 | 17.9 | 18.3 |
PPAR-Gamma | 219/267 | 17.4 | 17.7 |
Por uma questão de eficiência, definimos as dimensões de codificação estrutural
Realizamos os experimentos em um servidor Linux com uma CPU Intel Xeon Gold 6226R e duas GPUs Tesla V100S. Implementamos nosso método com Pytorch 1.11.0 e Pytorch Geométrico 2.0.4.
Se você comparar, construir ou usar aspectos deste trabalho, cite o seguinte:
@inproceedings{liu2023goodd,
title={GOOD-D: On Unsupervised Graph Out-Of-Distribution Detection},
author={Liu, Yixin and Ding, Kaize and Liu, Huan and Pan, Shirui},
booktitle={Proceedings of the Sixteenth ACM International Conference on Web Search and Data Mining},
year={2023}
}