Внедрение Pytorch Planet, геометрический инструмент глубокого обучения для прогнозирования реакции популяции на лекарства. Планета предоставляет новый график клинических знаний, который отражает отношения между биологией заболевания, химией лекарств и характеристиками населения. Используя этот график знаний, планета может принять популяцию и лекарства (например, клиническое исследование) в качестве вклада и предсказывать эффективность и безопасность лекарств для населения. Для получения подробного описания алгоритма, пожалуйста, см. В нашей рукописи «Прогнозируя реакцию популяции на лекарства с помощью графика клинических знаний».
Запустите следующие команды для создания среды Conda:
conda create -n planet python=3.8
source activate planet
pip install torch==1.10.1+cu113 -f https://download.pytorch.org/whl/cu113/torch_stable.html
pip install transformers==4.4.2 datasets==2.7.1 tensorboard==2.11.0 pandas wandb scikit-learn seqeval matplotlib pyyaml seaborn anndata scanpy
pip install setuptools==58.2.0 numpy==1.22.2
pip install torch-scatter==2.0.9 torch-sparse==0.6.12 -f https://pytorch-geometric.com/whl/torch-1.10.1+cu113.html
pip install torch-geometric==2.0.0
pip install ogb==1.3.0 --no-deps
После этой установки версия библиотеки tokenizers
должна быть 0,10,3. Если вы столкнетесь с ошибкой в версии tokenizers
, перейдите в <conda_path>/envs/<env_name>/lib/python3.8/site-packages/transformers/dependency_versions_check.py
и замените if pkg == "tokenizers": ...
блокируйте с if pkg == "tokenizers": continue
.
Общее время установки должно быть в течение 10 минут.
Требование к аппаратному обеспечению: ОЗУ 100 ГБ и графический процессор памяти 40 ГБ
Вы можете скачать все данные (график знаний, набор данных клинических испытаний, модели и т. Д.) Отсюда (data.zip) . Разируйте это, который создаст каталог ./data
.
Мы предоставляем демо -ноутбук для загрузки графа знаний планеты и клинических испытаний, а также запуска планеты:
notebooks/demo.ipynb
Ожидаемое время выполнения должно составлять ~ 10 минут.
Перейдите в каталог ./gcn_models
. Мы тренируем модели для прогнозирования эффективности, безопасности и потенциальных побочных эффектов клинического испытания.
Чтобы обучить модель для прогнозирования эффективности , запустите команды в
../scripts/train_efficacy.sh
Чтобы обучить модель для прогнозирования безопасности , запустите команды в
../scripts/train_safety.sh
Чтобы обучить модель для прогнозирования побочных событий , запустите команды в
../scripts/train_ae.sh
Обзор: Запуск наших моделей для прогнозирования новых клинических испытаний включает в себя два шага:
parsing_package/parse_trial.py
), чтобы данные испытания были предварительно обработаны и связаны с графом знаний планетыnotebooks/predict_for_new_clinial_trial.ipynb
)В частности, для этого выполните следующие шаги:
./parsing_package
. Установите зависимости, следуя ./parsing_package/README
./parsing_package
и запустите parse_trial.py
, чтобы обработать новое клиническое испытание (например, NCT02370680)./notebooks
и запустите predict_for_new_clinial_trial.ipynb
, чтобы получить прогнозы AE, безопасность и эффективность для нового клинического испытания. Если вы найдете наш код и исследование полезным, пожалуйста, рассмотрите возможность ссылаться на:
@article { planet2023 ,
author = { Maria Brbi{'c} and Michihiro Yasunaga and Prabhat Agarwal and Jure Leskovec } ,
title = { Predicting population response to drugs via clinical knowledge graph } ,
year = { 2023 } ,
}