Дихотомия сладких и горьких вкусов является существенной эволюционной особенностью человеческой плавной системы с врожденным притяжением к сладкому вкусу и отвращению к горечи. Лучшее понимание молекулярных коррелятов горько-сладкого градиента вкуса имеет решающее значение для идентификации как натуральных, так и синтетических соединений желаемого вкуса на этой оси. В то время как предыдущие исследования продвинули наше понимание молекулярной основы горько-сладкого вкуса и внесли модели для их идентификации, существует достаточно возможностей для усиления этих моделей путем тщательного составления горько-сладких молекул и использования широкого спектра молекулярных дескрипторов. На пути к этим целям, основываясь на структурированном компиляции данных, наше исследование предоставляет интегративную структуру с современными моделями машинного обучения для горько-сладкого прогнозирования вкуса (горько-сладкий). Мы сравниваем различные наборы молекулярных дескрипторов для их прогнозирующей производительности и дополнительно определяем важные функции, а также блоки функций. Утилита моделей Bittersweet демонстрируется прогнозированием вкуса на больших специализированных химических наборах, таких как Flavordb, Foodb, Supersweet, Super Natural II, DSStox и лекарственное средство. Чтобы облегчить будущие исследования в этом направлении, мы делаем все наборы данных и горько-сладкие модели общедоступными, а также представляем сквозное программное обеспечение для горько-сладкого прогнозирования вкуса на основе свободно доступных химических дескрипторов.
Центр вычислительной биологии, Институт информационных технологий Индрапрастха (IIIT-DELHI), Нью-Дели, Индия * Автор-корреспондент ([email protected], [email protected])
Чтобы настроить рабочую среду для выполнения некоторых или всех разделов этого проекта, вы должны:
Клонировать проект bittersweet
-
$ git clone https://github.com/cosylabiiit/bittersweet.git
$ cd bittersweet
Мы используем conda
в качестве инструмента для создания изолированных виртуальных сред, и, поскольку некоторые из наших пакетов требуют создания двоичных файлов из их источника, необходимо создать ваш ENV из предоставленного файла requirement.yml
.
$ conda env create -f environment.yml
$ conda activate env
Деактивировать эту среду после использования -
$ conda deactivate
* Убедитесь, что все сценарии запускаются в соответствии с средой Python 2.7.
.
.
├── data # Model Training & Test Data (Tabular Format)
│ ├── bitter-test.tsv
│ ├── bitter-train.tsv
│ ├── sweet-test.tsv
│ ├── sweet-train.tsv
├── bittersweet # All Source Files
│ ├── models # Trained Models
│ │ ├── bitter_chemopy_boruta_features.p
│ │ ├── bitter_chemopy_rf_boruta.p
│ │ ├── sweet_chemopy_boruta_features.p
│ │ ├── sweet_chemopy_rf_boruta.p
│ ├── __init__.py
│ ├── model.py
│ ├── properties.py
│ ├── read_file.py
├── manuscript-experiments # Testing modules (including those for random-control experiments)
│ ├── bittersweet # Directory containing scripts
│ ├── data # Directory containing data
│ ├── models # Directory containing models
├── examples
├── predict.py # methods to test our models
.
.
Авторы благодарят Институт информационных технологий Индрапрастха (IIIT-DELHI) за предоставление вычислительных средств и поддержки.
GB и RT разработали исследование. RT Курировал данные. SW, RT выполнил выбор функций и эксперименты по оценке важности, и обучил модели. RT генерировал горько-сладкие прогнозы для специализированных наборов химических веществ. Все авторы проанализировали результаты и написали рукопись.