Dikotomi selera manis dan pahit adalah fitur evolusi yang menonjol dari sistem gustatory manusia dengan daya tarik bawaan terhadap rasa manis dan keengganan terhadap kepahitan. Pemahaman yang lebih baik tentang korelasi molekul gradien rasa pahit-manis sangat penting untuk identifikasi senyawa alami maupun sintetis dari rasa yang diinginkan pada sumbu ini. Sementara penelitian sebelumnya telah meningkatkan pemahaman kita tentang dasar molekuler dari rasa pahit-manis dan model yang berkontribusi untuk identifikasi mereka, ada cukup ruang lingkup untuk meningkatkan model ini dengan kompilasi cermat molekul-molekul manis dan pemanfaatan spektrum luas deskriptor molekuler. Menuju tujuan-tujuan ini, berdasarkan kompilasi data terstruktur, penelitian kami memberikan kerangka kerja integratif dengan model pembelajaran mesin canggih untuk prediksi rasa pahit-manis (Bittersweet). Kami membandingkan berbagai set deskriptor molekuler untuk kinerja prediktifnya dan lebih lanjut mengidentifikasi fitur -fitur penting serta blok fitur. Kegunaan model pahit ditunjukkan oleh prediksi rasa pada set kimia khusus besar seperti FlavordB, FoodB, Supersweet, Super Natural II, DSStox, dan DrugBank. Untuk memfasilitasi penelitian di masa depan ke arah ini, kami membuat semua dataset dan model pahit yang tersedia untuk umum, dan juga menyajikan perangkat lunak ujung ke ujung untuk prediksi rasa pahit-manis berdasarkan deskriptor kimia yang tersedia secara bebas.
Pusat Biologi Komputasi, Institut Teknologi Informasi Indraprastha (IIIT- Delhi), New Delhi, India * Penulis yang sesuai ([email protected], [email protected])
Untuk mengatur lingkungan kerja untuk melaksanakan beberapa atau semua bagian dari proyek ini, Anda harus:
Kloning Proyek bittersweet
-
$ git clone https://github.com/cosylabiiit/bittersweet.git
$ cd bittersweet
Kami menggunakan conda
sebagai alat untuk membuat lingkungan virtual yang terisolasi dan karena beberapa paket kami memerlukan binari membangun dari sumbernya, perlu membuat env Anda dari requirement.yml
file yang disediakan.
$ conda env create -f environment.yml
$ conda activate env
Untuk menonaktifkan lingkungan ini setelah penggunaan -
$ conda deactivate
* Pastikan semua skrip dijalankan di bawah lingkungan Python 2.7.
.
.
├── data # Model Training & Test Data (Tabular Format)
│ ├── bitter-test.tsv
│ ├── bitter-train.tsv
│ ├── sweet-test.tsv
│ ├── sweet-train.tsv
├── bittersweet # All Source Files
│ ├── models # Trained Models
│ │ ├── bitter_chemopy_boruta_features.p
│ │ ├── bitter_chemopy_rf_boruta.p
│ │ ├── sweet_chemopy_boruta_features.p
│ │ ├── sweet_chemopy_rf_boruta.p
│ ├── __init__.py
│ ├── model.py
│ ├── properties.py
│ ├── read_file.py
├── manuscript-experiments # Testing modules (including those for random-control experiments)
│ ├── bittersweet # Directory containing scripts
│ ├── data # Directory containing data
│ ├── models # Directory containing models
├── examples
├── predict.py # methods to test our models
.
.
Para penulis berterima kasih kepada Institut Teknologi Informasi Indraprastha (IIIT-Delhi) karena menyediakan fasilitas dan dukungan komputasi.
GB dan RT merancang penelitian. RT mengkuratori data. SW, RT melakukan pemilihan fitur dan eksperimen peringkat penting, dan melatih model. RT menghasilkan prediksi pahit-manis untuk set bahan kimia khusus. Semua penulis menganalisis hasilnya dan menulis naskah.