Planet的Pytorch实施是一种预测人群对药物反应的几何深度学习工具。星球提供了一个新的临床知识图,该图捕获了疾病生物学,药物化学和人群特征之间的关系。使用此知识图,行星可以将种群和药物用于应用(例如临床试验)作为输入,并预测药物对人群的疗效和安全性。有关算法的详细说明,请参阅我们的手稿“通过临床知识图预测人口对药物的反应”。
运行以下命令创建一个conda环境:
conda create -n planet python=3.8
source activate planet
pip install torch==1.10.1+cu113 -f https://download.pytorch.org/whl/cu113/torch_stable.html
pip install transformers==4.4.2 datasets==2.7.1 tensorboard==2.11.0 pandas wandb scikit-learn seqeval matplotlib pyyaml seaborn anndata scanpy
pip install setuptools==58.2.0 numpy==1.22.2
pip install torch-scatter==2.0.9 torch-sparse==0.6.12 -f https://pytorch-geometric.com/whl/torch-1.10.1+cu113.html
pip install torch-geometric==2.0.0
pip install ogb==1.3.0 --no-deps
安装后, tokenizers
库版本应为0.10.3。如果您遇到有关tokenizers
版本的错误,请访问<conda_path>/envs/<env_name>/lib/python3.8/site-packages/transformers/dependency_versions_check.py
并替换if pkg == "tokenizers": ...
if pkg == "tokenizers": continue
总安装时间应在10分钟内。
硬件要求:40GB内存的100GB RAM和GPU
您可以从此处(data.zip)下载所有数据(知识图,临床试验数据集,模型等)。解压缩这个,将创建一个./data
目录。
我们提供了一个演示笔记本,用于加载行星知识图和临床试验数据,并运行行星模型:
notebooks/demo.ipynb
预期的运行时间应约为10分钟。
转到./gcn_models
目录。我们训练模型以预测临床试验的功效,安全性和潜在的不良事件。
要训练模型以进行疗效预测,请在
../scripts/train_efficacy.sh
要训练模型以进行安全预测,请在
../scripts/train_safety.sh
要训练模型进行不利事件预测,请在
../scripts/train_ae.sh
概述:运行我们的模型以预测新的临床试验,涉及两个步骤:
parsing_package/parse_trial.py
),以便对试验数据进行预处理并链接到行星知识图notebooks/predict_for_new_clinial_trial.ipynb
)具体来说,要执行此操作,请按照以下步骤操作:
./parsing_package
目录中。通过以下./parsing_package/README
安装依赖项./parsing_package
目录并运行parse_trial.py
处理新的临床试验(例如,NCT02370680)./notebooks
目录,然后运行predict_for_new_clinial_trial.ipynb
,以获取新临床试验的AE,安全性和效力预测。 如果您发现我们的代码和研究有用,请考虑引用:
@article { planet2023 ,
author = { Maria Brbi{'c} and Michihiro Yasunaga and Prabhat Agarwal and Jure Leskovec } ,
title = { Predicting population response to drugs via clinical knowledge graph } ,
year = { 2023 } ,
}