Planet的Pytorch實施是一種預測人群對藥物反應的幾何深度學習工具。星球提供了一個新的臨床知識圖,該圖捕獲了疾病生物學,藥物化學和人群特徵之間的關係。使用此知識圖,行星可以將種群和藥物用於應用(例如臨床試驗)作為輸入,並預測藥物對人群的療效和安全性。有關算法的詳細說明,請參閱我們的手稿“通過臨床知識圖預測人口對藥物的反應”。
運行以下命令創建一個conda環境:
conda create -n planet python=3.8
source activate planet
pip install torch==1.10.1+cu113 -f https://download.pytorch.org/whl/cu113/torch_stable.html
pip install transformers==4.4.2 datasets==2.7.1 tensorboard==2.11.0 pandas wandb scikit-learn seqeval matplotlib pyyaml seaborn anndata scanpy
pip install setuptools==58.2.0 numpy==1.22.2
pip install torch-scatter==2.0.9 torch-sparse==0.6.12 -f https://pytorch-geometric.com/whl/torch-1.10.1+cu113.html
pip install torch-geometric==2.0.0
pip install ogb==1.3.0 --no-deps
安裝後, tokenizers
庫版本應為0.10.3。如果您遇到有關tokenizers
版本的錯誤,請訪問<conda_path>/envs/<env_name>/lib/python3.8/site-packages/transformers/dependency_versions_check.py
並替換if pkg == "tokenizers": ...
if pkg == "tokenizers": continue
總安裝時間應在10分鐘內。
硬件要求:40GB內存的100GB RAM和GPU
您可以從此處(data.zip)下載所有數據(知識圖,臨床試驗數據集,模型等)。解壓縮這個,將創建一個./data
目錄。
我們提供了一個演示筆記本,用於加載行星知識圖和臨床試驗數據,並運行行星模型:
notebooks/demo.ipynb
預期的運行時間應約為10分鐘。
轉到./gcn_models
目錄。我們訓練模型以預測臨床試驗的功效,安全性和潛在的不良事件。
要訓練模型以進行療效預測,請在
../scripts/train_efficacy.sh
要訓練模型以進行安全預測,請在
../scripts/train_safety.sh
要訓練模型進行不利事件預測,請在
../scripts/train_ae.sh
概述:運行我們的模型以預測新的臨床試驗,涉及兩個步驟:
parsing_package/parse_trial.py
),以便對試驗數據進行預處理並鏈接到行星知識圖notebooks/predict_for_new_clinial_trial.ipynb
)具體來說,要執行此操作,請按照以下步驟操作:
./parsing_package
目錄中。通過以下./parsing_package/README
安裝依賴項./parsing_package
目錄並運行parse_trial.py
處理新的臨床試驗(例如,NCT02370680)./notebooks
目錄,然後運行predict_for_new_clinial_trial.ipynb
,以獲取新臨床試驗的AE,安全性和效力預測。 如果您發現我們的代碼和研究有用,請考慮引用:
@article { planet2023 ,
author = { Maria Brbi{'c} and Michihiro Yasunaga and Prabhat Agarwal and Jure Leskovec } ,
title = { Predicting population response to drugs via clinical knowledge graph } ,
year = { 2023 } ,
}