Pytorch -Implementierung von Planet, einem geometrischen Deep -Lern -Instrument zur Vorhersage der Bevölkerungsreaktion auf Arzneimittel. Planet bietet ein neues klinisches Wissensgraphen, das die Beziehungen zwischen Krankheitsbiologie, Arzneimittelchemie und Bevölkerungsmerkmalen erfasst. Mit diesem Wissensgraphen kann Planet eine Population und Medikamente einnehmen, um angewendet zu werden (z. B. eine klinische Studie) als Input und die Wirksamkeit und Sicherheit der Arzneimittel für die Bevölkerung vorhersagen. Eine detaillierte Beschreibung des Algorithmus finden Sie in unserem Manuskript "Vorhersage der Bevölkerungsreaktion auf Arzneimittel über klinische Wissensgrafiken".
Führen Sie die folgenden Befehle aus, um eine Conda -Umgebung zu erstellen:
conda create -n planet python=3.8
source activate planet
pip install torch==1.10.1+cu113 -f https://download.pytorch.org/whl/cu113/torch_stable.html
pip install transformers==4.4.2 datasets==2.7.1 tensorboard==2.11.0 pandas wandb scikit-learn seqeval matplotlib pyyaml seaborn anndata scanpy
pip install setuptools==58.2.0 numpy==1.22.2
pip install torch-scatter==2.0.9 torch-sparse==0.6.12 -f https://pytorch-geometric.com/whl/torch-1.10.1+cu113.html
pip install torch-geometric==2.0.0
pip install ogb==1.3.0 --no-deps
Nach dieser Installation sollte die Version tokenizers
-Bibliothek 0,10.3 betragen. Wenn Sie auf einen Fehler über die tokenizers
-Version stoßen, gehen Sie zu <conda_path>/envs/<env_name>/lib/python3.8/site-packages/transformers/dependency_versions_check.py
und ersetzen Sie die if pkg == "tokenizers": ...
Block mit if pkg == "tokenizers": continue
.
Die gesamte Installationszeit sollte innerhalb von 10 Minuten betragen.
Hardwareanforderungen: 100 GB RAM und GPU mit 40 GB Speicher
Hier können Sie alle Daten (Wissensgrafik, klinische Versuchsdatensatz, Modelle usw.) herunterladen (Daten.zip) . Entpacken Sie dies, das ein ./data
-Verzeichnis erzeugt.
Wir bieten ein Demo -Notizbuch zum Laden des Planeten -Wissensdiagramms und der klinischen Studiendaten und zum Ausführen der Planetenmodelle:
notebooks/demo.ipynb
Die erwartete Laufzeit sollte ~ 10 Minuten betragen.
Gehen Sie zum Verzeichnis ./gcn_models
. Wir schulen Modelle, um die Wirksamkeit, Sicherheit und mögliche unerwünschte Ereignisse einer klinischen Studie vorherzusagen.
Um ein Modell für die Wirksamkeitsvorhersage zu trainieren, führen Sie Befehle in
../scripts/train_efficacy.sh
Um ein Modell für die Sicherheitsvorhersage zu trainieren, führen Sie Befehle in
../scripts/train_safety.sh
Um ein Modell für die Vorhersage von Ereignissen zu trainieren, führen Sie Befehle aus
../scripts/train_ae.sh
Überblick: Durch das Ausführen unserer Modelle für neue klinische Studien werden zwei Schritte vorgesehen:
parsing_package/parse_trial.py
), damit die Versuchsdaten vorverarbeitet und mit dem Planetenwissengrafik verknüpft sindnotebooks/predict_for_new_clinial_trial.ipynb
)Befolgen Sie dazu die folgenden Schritte, um dies zu tun:
./parsing_package
. Installieren Sie die Abhängigkeiten durch Folgen ./parsing_package/README
parse_trial.py
./parsing_package
./notebooks
Verzeichnis und rennen Sie predict_for_new_clinial_trial.ipynb
, um AE, Sicherheit und Wirksamkeitsvorhersagen für die neue klinische Studie zu erhalten. Wenn Sie unseren Code und unsere Nachforschungen nützlich finden, sollten Sie sich angeben:
@article { planet2023 ,
author = { Maria Brbi{'c} and Michihiro Yasunaga and Prabhat Agarwal and Jure Leskovec } ,
title = { Predicting population response to drugs via clinical knowledge graph } ,
year = { 2023 } ,
}