La dichotomie des goûts sucrés et amers est une caractéristique évolutive saillante du système gustatif humain avec une attirance innée pour le goût sucré et l'aversion à l'amertume. Une meilleure compréhension des corrélats moléculaires du gradient de goût doux-amer est crucial pour l'identification des composés naturels et synthétiques du goût souhaitable sur cet axe. Bien que les études antérieures aient fait progresser notre compréhension de la base moléculaire du goût doux-amer et des modèles contribués à leur identification, il existe une grande portée pour améliorer ces modèles par compilation méticuleuse de molécules sucrées amères et utilisation d'un large spectre de descripteurs moléculaires. Vers ces objectifs, sur la base de la compilation de données structurées, notre étude fournit un cadre intégratif avec des modèles d'apprentissage automatique à la pointe de la technologie pour la prédiction de goût sucré (douce-amère). Nous comparons différents ensembles de descripteurs moléculaires pour leurs performances prédictives et identifions davantage les caractéristiques importantes ainsi que les blocs de fonctionnalités. L'utilité des modèles doux-amer est démontrée par la prédiction du goût sur de grands ensembles chimiques spécialisés tels que Flavordb, FoodB, Supersweet, Super Natural II, DSSTOX et DrugBank. Pour faciliter les recherches futures dans cette direction, nous rendons tous les ensembles de données et modèles doux-amer accessibles au public, et présentons également un logiciel de bout en bout pour une prédiction de goût sucrée basée sur des descripteurs chimiques disponibles.
Centre de biologie informatique, Indraprastha Institute of Information Technology (IIIT- Delhi), New Delhi, Inde * Auteur correspondant ([email protected], [email protected])
Pour configurer un environnement de travail pour exécuter certaines ou toutes les sections de ce projet, vous devez:
Cloner le projet bittersweet
-
$ git clone https://github.com/cosylabiiit/bittersweet.git
$ cd bittersweet
Nous utilisons conda
comme un outil pour créer des environnements virtuels isolés et comme certains de nos packages nécessitent de construire des binaires à partir de leur source, il est nécessaire de créer votre Env à partir du fichier requirement.yml
fourni.
$ conda env create -f environment.yml
$ conda activate env
Pour désactiver cet environnement après l'utilisation -
$ conda deactivate
* Assurez-vous que tous les scripts sont exécutés dans un environnement Python 2.7.
.
.
├── data # Model Training & Test Data (Tabular Format)
│ ├── bitter-test.tsv
│ ├── bitter-train.tsv
│ ├── sweet-test.tsv
│ ├── sweet-train.tsv
├── bittersweet # All Source Files
│ ├── models # Trained Models
│ │ ├── bitter_chemopy_boruta_features.p
│ │ ├── bitter_chemopy_rf_boruta.p
│ │ ├── sweet_chemopy_boruta_features.p
│ │ ├── sweet_chemopy_rf_boruta.p
│ ├── __init__.py
│ ├── model.py
│ ├── properties.py
│ ├── read_file.py
├── manuscript-experiments # Testing modules (including those for random-control experiments)
│ ├── bittersweet # Directory containing scripts
│ ├── data # Directory containing data
│ ├── models # Directory containing models
├── examples
├── predict.py # methods to test our models
.
.
Les auteurs remercient Indraprastha Institute of Information Technology (IIIT-Delhi) d'avoir fourni des installations de calcul et du soutien.
GB et RT ont conçu l'étude. RT a organisé les données. SW, RT a effectué des expériences de sélection de fonctionnalités et d'importance et a formé les modèles. RT a généré les prévisions amères-sucrées pour les ensembles chimiques spécialisés. Tous les auteurs ont analysé les résultats et écrit le manuscrit.