Implementación de Pytorch de Planet, una herramienta de aprendizaje profundo geométrico para predecir la respuesta de la población a los medicamentos. Planet proporciona un nuevo gráfico de conocimiento clínico que captura las relaciones entre la biología de las enfermedades, la química de los medicamentos y las características de la población. Usando este gráfico de conocimiento, el planeta puede tomar una población y medicamentos para aplicar (p. Ej., Un ensayo clínico) como un aporte y predecir la eficacia y la seguridad de los medicamentos para la población. Para obtener una descripción detallada del algoritmo, consulte nuestro manuscrito "Predecir la respuesta de la población a los medicamentos a través del gráfico de conocimiento clínico".
Ejecute los siguientes comandos para crear un entorno de conda:
conda create -n planet python=3.8
source activate planet
pip install torch==1.10.1+cu113 -f https://download.pytorch.org/whl/cu113/torch_stable.html
pip install transformers==4.4.2 datasets==2.7.1 tensorboard==2.11.0 pandas wandb scikit-learn seqeval matplotlib pyyaml seaborn anndata scanpy
pip install setuptools==58.2.0 numpy==1.22.2
pip install torch-scatter==2.0.9 torch-sparse==0.6.12 -f https://pytorch-geometric.com/whl/torch-1.10.1+cu113.html
pip install torch-geometric==2.0.0
pip install ogb==1.3.0 --no-deps
Después de esta instalación, la versión de la biblioteca tokenizers
debe ser 0.10.3. En caso de que encuentre un error sobre la versión tokenizers
, vaya a <conda_path>/envs/<env_name>/lib/python3.8/site-packages/transformers/dependency_versions_check.py
y reemplace el if pkg == "tokenizers": ...
Bloquear con if pkg == "tokenizers": continue
.
El tiempo de instalación total debe estar en 10 minutos.
Requisito de hardware: 100 GB de RAM y GPU de memoria de 40 GB
Puede descargar todos los datos (gráfico de conocimiento, conjunto de datos de ensayos clínicos, modelos, etc.) desde aquí (data.zip) . Descomprima esto, que creará un directorio ./data
.
Proporcionamos un cuaderno de demostración para cargar el gráfico de conocimiento del planeta y los datos de ensayos clínicos, y ejecutar los modelos de planeta:
notebooks/demo.ipynb
El tiempo de ejecución esperado debe ser ~ 10 minutos.
Vaya al directorio ./gcn_models
. Entrenamos modelos para predecir la eficacia, la seguridad y los posibles eventos adversos de un ensayo clínico.
Para entrenar un modelo para la predicción de eficacia , ejecute comandos en
../scripts/train_efficacy.sh
Para entrenar un modelo para la predicción de seguridad , ejecute comandos en
../scripts/train_safety.sh
Para entrenar un modelo para la predicción de eventos adversos , ejecute comandos en
../scripts/train_ae.sh
Descripción general: ejecutar nuestros modelos para predecir para nuevos ensayos clínicos implica dos pasos:
parsing_package/parse_trial.py
) para que los datos de prueba estén preprocesados y vinculados al gráfico de conocimiento del planetanotebooks/predict_for_new_clinial_trial.ipynb
)Específicamente, para hacer esto, siga los pasos a continuación:
./parsing_package
. Instale las dependencias siguiendo ./parsing_package/README
./parsing_package
y ejecute parse_trial.py
para procesar un nuevo ensayo clínico (por ejemplo, NCT02370680)./notebooks
y ejecute predict_for_new_clinial_trial.ipynb
para obtener predicciones de AE, seguridad y eficacia para el nuevo ensayo clínico. Si encuentra útiles nuestro código e investigación, considere citar:
@article { planet2023 ,
author = { Maria Brbi{'c} and Michihiro Yasunaga and Prabhat Agarwal and Jure Leskovec } ,
title = { Predicting population response to drugs via clinical knowledge graph } ,
year = { 2023 } ,
}