La dicotomía de los sabores dulces y amargos es una característica evolutiva sobresaltante del sistema de rejillas humanas con una atracción innata al sabor dulce y la aversión a la amargura. Una mejor comprensión de los correlatos moleculares del gradiente de sabor agridulce es crucial para la identificación de compuestos naturales y sintéticos de gusto deseable en este eje. Si bien los estudios anteriores han avanzado nuestra comprensión de la base molecular del sabor agridulce y los modelos contribuyados para su identificación, existe un amplio alcance para mejorar estos modelos mediante una compilación meticulosa de moléculas amargas y dulces y la utilización de un amplio espectro de descriptores moleculares. Hacia estos objetivos, basado en la compilación de datos estructurados, nuestro estudio proporciona un marco integrador con modelos de aprendizaje automático de última generación para la predicción del gusto agridulce (agridulce). Comparamos diferentes conjuntos de descriptores moleculares para su rendimiento predictivo e identificamos aún más características importantes, así como bloques de características. La utilidad de los modelos agridulce se demuestra mediante la predicción del gusto en grandes conjuntos de productos químicos especializados como FlavordB, FoodB, SuperSweet, Super Natural II, DSSTOX y DrugBank. Para facilitar la investigación futura en esta dirección, hacemos todos los conjuntos de datos y modelos agridulce disponibles públicamente, y también presentamos un software de extremo a extremo para la predicción del gusto agridulce basado en descriptores químicos disponibles libremente.
Centro de Biología Computacional, Instituto de Tecnología de la Información Indraprastha (IIIT- Delhi), Nueva Delhi, India * Autor correspondiente ([email protected], [email protected])
Para configurar un entorno de trabajo para ejecutar algunas o todas las secciones de este proyecto, debe:
Clon the Project bittersweet
-
$ git clone https://github.com/cosylabiiit/bittersweet.git
$ cd bittersweet
Utilizamos conda
como una herramienta para crear entornos virtuales aislados y, dado que algunos de nuestros paquetes requieren la construcción de binarios de su fuente, es necesario crear su ENV en el archivo requirement.yml
proporcionado.
$ conda env create -f environment.yml
$ conda activate env
Para desactivar este entorno después del uso -
$ conda deactivate
* Asegúrese de que todos los scripts se ejecuten bajo un entorno Python 2.7.
.
.
├── data # Model Training & Test Data (Tabular Format)
│ ├── bitter-test.tsv
│ ├── bitter-train.tsv
│ ├── sweet-test.tsv
│ ├── sweet-train.tsv
├── bittersweet # All Source Files
│ ├── models # Trained Models
│ │ ├── bitter_chemopy_boruta_features.p
│ │ ├── bitter_chemopy_rf_boruta.p
│ │ ├── sweet_chemopy_boruta_features.p
│ │ ├── sweet_chemopy_rf_boruta.p
│ ├── __init__.py
│ ├── model.py
│ ├── properties.py
│ ├── read_file.py
├── manuscript-experiments # Testing modules (including those for random-control experiments)
│ ├── bittersweet # Directory containing scripts
│ ├── data # Directory containing data
│ ├── models # Directory containing models
├── examples
├── predict.py # methods to test our models
.
.
Los autores agradecen al Instituto de Tecnología de la Información de Indraprastha (IIIT-Delhi) por proporcionar instalaciones y soporte computacionales.
GB y RT diseñaron el estudio. RT seleccionaron los datos. SW, RT realizó una selección de características e experimentos de clasificación de importancia, y entrenó a los modelos. RT generó las predicciones agridulce para conjuntos de productos químicos especializados. Todos los autores analizaron los resultados y escribieron el manuscrito.