甜和苦味的二分法是人类味觉系统的显着进化特征,它具有天生的吸引力,可吸引甜味和厌恶苦味。更好地理解苦甜味梯度的分子相关性对于鉴定自然和合成化合物在该轴上具有可取的味道至关重要。尽管以前的研究已经提高了我们对苦甜味的分子基础的理解,并为它们的识别提供了贡献的模型,但通过细致的苦味分子的细致汇编以及对广泛的分子描述符的利用,有足够的范围来增强这些模型。实现这些目标,基于结构化数据汇编,我们的研究提供了一个综合框架,该框架具有最先进的机器学习模型,用于苦甜的口味预测(苦乐参半)。我们比较了不同的分子描述符的预测性能,并进一步识别重要特征和特征块。苦乐参半模型的效用是通过大型专业化学套件(例如FlavordB,FoodB,Supersweet,Super Natural II,DSSTOX和DRUDBANK)的味道预测来证明的。为了促进这一方向的未来研究,我们公开提供所有数据集和苦乐参半的模型,并为基于自由使用的化学描述符提供端到端的软件,以用于苦甜的口味预测。
Indraprastha信息技术学院(IIIT-DELHI)的计算生物学中心,印度新德里*通讯作者([email protected],[email protected])
要设置一个工作环境以执行该项目的某些或所有部分,您必须:
克隆项目bittersweet
-
$ git clone https://github.com/cosylabiiit/bittersweet.git
$ cd bittersweet
我们使用conda
作为创建孤立的虚拟环境的工具,并且由于我们的某些软件包需要从其来源构建二进制文件,因此有必要从需要的requirement.yml
文件中创建env。
$ conda env create -f environment.yml
$ conda activate env
在使用后停用了这种环境 -
$ conda deactivate
*确保在Python 2.7环境下运行所有脚本。
.
.
├── data # Model Training & Test Data (Tabular Format)
│ ├── bitter-test.tsv
│ ├── bitter-train.tsv
│ ├── sweet-test.tsv
│ ├── sweet-train.tsv
├── bittersweet # All Source Files
│ ├── models # Trained Models
│ │ ├── bitter_chemopy_boruta_features.p
│ │ ├── bitter_chemopy_rf_boruta.p
│ │ ├── sweet_chemopy_boruta_features.p
│ │ ├── sweet_chemopy_rf_boruta.p
│ ├── __init__.py
│ ├── model.py
│ ├── properties.py
│ ├── read_file.py
├── manuscript-experiments # Testing modules (including those for random-control experiments)
│ ├── bittersweet # Directory containing scripts
│ ├── data # Directory containing data
│ ├── models # Directory containing models
├── examples
├── predict.py # methods to test our models
.
.
作者感谢Indraprastha信息技术研究所(IIIT-DELHI)提供的计算设施和支持。
GB和RT设计了这项研究。 RT策划了数据。 SW,RT执行了特征选择和重要性排名实验,并训练了模型。 RT为专用化学物质集生成了苦甜的预测。所有作者都分析了结果并编写了手稿。