Die Dichotomie des süßen und bitteren Geschmacks ist ein herausragendes evolutionäres Merkmal des menschlichen Gustatory -Systems mit einer angeborenen Anziehungskraft auf süßen Geschmack und Abneigung gegen Bitterkeit. Ein besseres Verständnis der molekularen Korrelate des bittersüßen Geschmacksgradienten ist entscheidend für die Identifizierung natürlicher und synthetischer Verbindungen des wünschenswerten Geschmacks auf dieser Achse. Während frühere Studien unser Verständnis der molekularen Basis des bitteren Geschmacks und der dazu beigetragenen Modelle für ihre Identifizierung vorangetrieben haben, besteht ausreichend Spielraum, um diese Modelle durch sorgfältige Zusammenstellung von bitteren süßen Molekülen und die Verwendung eines breiten Spektrums molekularer Deskriptoren zu verbessern. In Bezug auf diese Ziele, basierend auf strukturierten Datenkompilierung, bietet unsere Studie einen integrativen Rahmen mit hochmodernen Modellen für maschinelles Lernen für die bittersüße Geschmacksvorhersage (bittersüß). Wir vergleichen verschiedene Sätze von molekularen Deskriptoren für ihre prädiktive Leistung und identifizieren wichtige Merkmale sowie Feature -Blöcke weiter. Der Nutzen bittersüßer Modelle wird durch die Geschmacksvorhersage bei großen spezialisierten chemischen Sätzen wie Flavordb, Foodb, Supersweet, Super Natural II, DSstox und Drugbank demonstriert. Um zukünftige Forschungen in diese Richtung zu erleichtern, stellen wir alle Datensätze und bittersüßen Modelle öffentlich zur Verfügung und präsentieren auch eine End-to-End-Software für die bittersüße Geschmacksvorhersage basierend auf frei verfügbaren chemischen Deskriptoren.
Zentrum für Computerbiologie, Indraprastha Institute of Information Technology (IIIT-Delhi), Neu-Delhi, Indien * Korrespondierender Autor ([email protected], [email protected])
Um eine Arbeitsumgebung einzurichten, um einige oder alle Abschnitte dieses Projekts auszuführen, müssen Sie:
Klonen Sie das Projekt bittersweet
-
$ git clone https://github.com/cosylabiiit/bittersweet.git
$ cd bittersweet
Wir verwenden conda
als Werkzeug, um isolierte virtuelle Umgebungen zu erstellen. Da einige unserer Pakete Binärdateien aus ihrer Quelle erfordern, müssen Sie Ihre Umwelt aus der angegebenen Datei requirement.yml
erstellen.
$ conda env create -f environment.yml
$ conda activate env
Um diese Umgebung nach der Verwendung zu deaktivieren -
$ conda deactivate
* Stellen Sie sicher, dass alle Skripte unter einer Umgebung von Python 2.7 ausgeführt werden.
.
.
├── data # Model Training & Test Data (Tabular Format)
│ ├── bitter-test.tsv
│ ├── bitter-train.tsv
│ ├── sweet-test.tsv
│ ├── sweet-train.tsv
├── bittersweet # All Source Files
│ ├── models # Trained Models
│ │ ├── bitter_chemopy_boruta_features.p
│ │ ├── bitter_chemopy_rf_boruta.p
│ │ ├── sweet_chemopy_boruta_features.p
│ │ ├── sweet_chemopy_rf_boruta.p
│ ├── __init__.py
│ ├── model.py
│ ├── properties.py
│ ├── read_file.py
├── manuscript-experiments # Testing modules (including those for random-control experiments)
│ ├── bittersweet # Directory containing scripts
│ ├── data # Directory containing data
│ ├── models # Directory containing models
├── examples
├── predict.py # methods to test our models
.
.
Die Autoren danken Indraprastha Institute of Information Technology (IIIT-Delhi) für die Bereitstellung von Recheneinrichtungen und -unterstützung.
GB und RT haben die Studie entwickelt. RT kuratierte die Daten. SW, RT führte Feature -Auswahl und Wichtigkeitsranking -Experimente durch und trainierte die Modelle. RT erzeugte die bittersüßen Vorhersagen für spezialisierte Chemikaliensätze. Alle Autoren analysierten die Ergebnisse und schrieben das Manuskript.