甜和苦味的二分法是人類味覺系統的顯著進化特徵,它具有天生的吸引力,可吸引甜味和厭惡苦味。更好地理解苦甜味梯度的分子相關性對於鑑定自然和合成化合物在該軸上具有可取的味道至關重要。儘管以前的研究已經提高了我們對苦甜味的分子基礎的理解,並為它們的識別提供了貢獻的模型,但通過細緻的苦味分子的細緻彙編以及對廣泛的分子描述符的利用,有足夠的範圍來增強這些模型。實現這些目標,基於結構化數據彙編,我們的研究提供了一個綜合框架,該框架具有最先進的機器學習模型,用於苦甜的口味預測(苦樂參半)。我們比較了不同的分子描述符的預測性能,並進一步識別重要特徵和特徵塊。苦樂參半模型的效用是通過大型專業化學套件(例如FlavordB,FoodB,Supersweet,Super Natural II,DSSTOX和DRUDBANK)的味道預測來證明的。為了促進這一方向的未來研究,我們公開提供所有數據集和苦樂參半的模型,並為基於自由使用的化學描述符提供端到端的軟件,以用於苦甜的口味預測。
Indraprastha信息技術學院(IIIT-DELHI)的計算生物學中心,印度新德里*通訊作者([email protected],[email protected])
要設置一個工作環境以執行該項目的某些或所有部分,您必須:
克隆項目bittersweet
-
$ git clone https://github.com/cosylabiiit/bittersweet.git
$ cd bittersweet
我們使用conda
作為創建孤立的虛擬環境的工具,並且由於我們的某些軟件包需要從其來源構建二進製文件,因此有必要從需要的requirement.yml
文件中創建env。
$ conda env create -f environment.yml
$ conda activate env
在使用後停用了這種環境 -
$ conda deactivate
*確保在Python 2.7環境下運行所有腳本。
.
.
├── data # Model Training & Test Data (Tabular Format)
│ ├── bitter-test.tsv
│ ├── bitter-train.tsv
│ ├── sweet-test.tsv
│ ├── sweet-train.tsv
├── bittersweet # All Source Files
│ ├── models # Trained Models
│ │ ├── bitter_chemopy_boruta_features.p
│ │ ├── bitter_chemopy_rf_boruta.p
│ │ ├── sweet_chemopy_boruta_features.p
│ │ ├── sweet_chemopy_rf_boruta.p
│ ├── __init__.py
│ ├── model.py
│ ├── properties.py
│ ├── read_file.py
├── manuscript-experiments # Testing modules (including those for random-control experiments)
│ ├── bittersweet # Directory containing scripts
│ ├── data # Directory containing data
│ ├── models # Directory containing models
├── examples
├── predict.py # methods to test our models
.
.
作者感謝Indraprastha信息技術研究所(IIIT-DELHI)提供的計算設施和支持。
GB和RT設計了這項研究。 RT策劃了數據。 SW,RT執行了特徵選擇和重要性排名實驗,並訓練了模型。 RT為專用化學物質集生成了苦甜的預測。所有作者都分析了結果並編寫了手稿。