A implementação de Pytorch do Planet, uma ferramenta geométrica de aprendizado profundo para prever a resposta populacional aos medicamentos. O planeta fornece um novo gráfico de conhecimento clínico que captura as relações entre biologia de doenças, química de drogas e características da população. Usando esse gráfico de conhecimento, o planeta pode levar uma população e medicamentos a serem aplicados (por exemplo, um ensaio clínico) como uma entrada e prever a eficácia e a segurança dos medicamentos para a população. Para uma descrição detalhada do algoritmo, consulte nosso manuscrito "prevendo a resposta populacional aos medicamentos por meio do gráfico de conhecimento clínico".
Execute os seguintes comandos para criar um ambiente de conda:
conda create -n planet python=3.8
source activate planet
pip install torch==1.10.1+cu113 -f https://download.pytorch.org/whl/cu113/torch_stable.html
pip install transformers==4.4.2 datasets==2.7.1 tensorboard==2.11.0 pandas wandb scikit-learn seqeval matplotlib pyyaml seaborn anndata scanpy
pip install setuptools==58.2.0 numpy==1.22.2
pip install torch-scatter==2.0.9 torch-sparse==0.6.12 -f https://pytorch-geometric.com/whl/torch-1.10.1+cu113.html
pip install torch-geometric==2.0.0
pip install ogb==1.3.0 --no-deps
Após esta instalação, a versão da Biblioteca tokenizers
deve ser 0,10.3. Caso você encontre um erro sobre a versão tokenizers
, acesse <conda_path>/envs/<env_name>/lib/python3.8/site-packages/transformers/dependency_versions_check.py
e substitua o if pkg == "tokenizers": ...
bloqueie com if pkg == "tokenizers": continue
.
O tempo total de instalação deve estar dentro de 10 minutos.
Requisito de hardware: 100 GB de RAM e GPU de 40 GB de memória
Você pode baixar todos os dados (gráfico de conhecimento, conjunto de dados de ensaios clínicos, modelos etc.) daqui (data.zip) . Descompactar isso, que criará um diretório ./data
.
Fornecemos um caderno de demonstração para carregar o gráfico de conhecimento do planeta e os dados de ensaios clínicos e executar os modelos do planeta:
notebooks/demo.ipynb
O tempo de execução esperado deve ser ~ 10 minutos.
Vá para ./gcn_models
Directory. Treinamos modelos para prever a eficácia, segurança e possíveis eventos adversos de um ensaio clínico.
Para treinar um modelo para previsão de eficácia , execute comandos em
../scripts/train_efficacy.sh
Para treinar um modelo para previsão de segurança , execute comandos em
../scripts/train_safety.sh
Para treinar um modelo para previsão de eventos adversos , execute comandos em
../scripts/train_ae.sh
Visão geral: Executando nossos modelos para prever para novos ensaios clínicos envolve duas etapas:
parsing_package/parse_trial.py
) para que os dados do teste sejam pré -processados e vinculados ao gráfico de conhecimento do planetanotebooks/predict_for_new_clinial_trial.ipynb
)Especificamente, para fazer isso, siga as etapas abaixo:
./parsing_package
. Instale as dependências seguindo ./parsing_package/README
./parsing_package
Directory e execute parse_trial.py
para processar um novo ensaio clínico (por exemplo, NCT02370680)./notebooks
e Run predict_for_new_clinial_trial.ipynb
para obter previsões de AE, segurança e eficácia para o novo ensaio clínico. Se você achar útil nosso código e pesquisa, considere citar:
@article { planet2023 ,
author = { Maria Brbi{'c} and Michihiro Yasunaga and Prabhat Agarwal and Jure Leskovec } ,
title = { Predicting population response to drugs via clinical knowledge graph } ,
year = { 2023 } ,
}