2024/08/11 Kami dengan gembira mengumumkan fitur baru, Minimisasi Energi Ligan, kini tersedia dalam rilis terbaru kami. Selain itu, jelajahi alat baru kami, drugsgpt_min_multi.py, yang dirancang khusus untuk minimalisasi energi yang efisien pada banyak ligan.
30/07/2024 Semua validasi laboratorium basah telah diselesaikan, mengonfirmasi bahwa DrugGPT memiliki kemampuan pengoptimalan ligan.
16/05/2024 Eksperimen laboratorium basah mengonfirmasi kemampuan Druggpt dalam merancang ligan dengan perancah baru dari awal dan menggunakan kembali ligan yang sudah ada. Optimalisasi ligan masih dalam evaluasi. Nantikan pembaruan lainnya!
16/05/2024 Versi telah ditingkatkan menjadi drugsgpt_v1.2, menampilkan kemampuan kontrol nomor atom baru. Karena masalah kompatibilitas, webui telah dihapus.
Versi 2024/04/03 ditingkatkan ke Druggpt_v1.1, meningkatkan stabilitas dan menambahkan webui. Versi masa depan akan menampilkan kontrol nomor atom dalam molekul. Pantau terus.
31/03/2024 Setelah mempertimbangkan dengan cermat, saya berencana membuat repositori baru bernama Druggpt_toolbox dan Druggpt_train untuk masing-masing menyimpan skrip alat pasca-pemrosesan dan skrip pelatihan. Repositori ini harus fokus terutama pada pembentukan molekul kandidat obat.
31/03/2024 Saya memutuskan untuk membuat cabang bernama drugsgpt_v1.0 untuk versi saat ini karena ini adalah rilis stabil. Selanjutnya, saya akan terus memperbarui kodenya.
2024/01/18 Proyek ini sekarang sedang dalam evaluasi eksperimental untuk memastikan nilai sebenarnya dalam penelitian obat. Silakan terus ikuti kami!
DrugGPT menyajikan strategi desain ligan berdasarkan model autoregresif, GPT, dengan fokus pada eksplorasi ruang angkasa kimia dan penemuan ligan untuk protein spesifik. Model bahasa pembelajaran mendalam telah menunjukkan potensi yang signifikan dalam berbagai domain termasuk desain protein dan analisis teks biomedis, sehingga memberikan dukungan kuat terhadap proposisi DrugGPT.
Dalam studi ini, kami menggunakan model DrugGPT untuk mempelajari sejumlah besar data pengikatan protein-ligan, yang bertujuan untuk menemukan molekul baru yang dapat berikatan dengan protein tertentu. Strategi ini tidak hanya secara signifikan meningkatkan efisiensi desain ligan tetapi juga menawarkan jalan yang cepat dan efektif untuk proses pengembangan obat, membawa kemungkinan-kemungkinan baru dalam bidang farmasi.
git clone https://github.com/LIYUESEN/druggpt.git
cd druggpt
Atau Anda cukup mengklik Kode> Unduh ZIP untuk mengunduh repo ini.
conda create -n druggpt python=3.7
conda activate druggpt
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
pip install datasets transformers scipy scikit-learn psutil
conda install conda-forge/label/cf202003::openbabel
Gunakan obat_generator.py
Parameter yang diperlukan:
-p
| --pro_seq
: Masukkan rangkaian protein asam amino.
-f
| --fasta
: Masukkan file FASTA.
Hanya satu dari -p dan -f yang harus ditentukan.
-l
| --ligand_prompt
: Masukkan prompt ligan.
-e
| --empty_input
: Mengaktifkan mode pembuatan langsung.
-n
| --number
: Setidaknya berapa banyak molekul yang akan dihasilkan.
-d
| --device
: Perangkat keras yang akan digunakan. Standarnya adalah 'cuda'.
-o
| --output
: Direktori keluaran untuk molekul yang dihasilkan. Standarnya adalah './ligand_output/'.
-b
| --batch_size
: Berapa banyak molekul yang akan dihasilkan per batch. Cobalah untuk mengurangi nilai ini jika Anda memiliki RAM rendah. Standarnya adalah 16.
-t
| --temperature
: Menyesuaikan keacakan pembuatan teks; nilai yang lebih tinggi menghasilkan keluaran yang lebih beragam. Nilai defaultnya adalah 1,0.
--top_k
: Jumlah token probabilitas tertinggi yang perlu dipertimbangkan untuk pengambilan sampel k teratas. Defaultnya adalah 9.
--top_p
: Ambang probabilitas kumulatif (0,0 - 1,0) untuk pengambilan sampel top-p (inti). Ini menentukan subset minimum token yang perlu dipertimbangkan untuk pengambilan sampel acak. Defaultnya adalah 0,9.
--min_atoms
: Jumlah minimum atom non-H yang diperbolehkan untuk dihasilkan. Defaultnya adalah Tidak Ada.
--max_atoms
: Jumlah maksimum atom non-H yang diperbolehkan untuk dihasilkan. Defaultnya adalah 35.
--no_limit
: Menonaktifkan batas maksimum atom default.
Jika
-l
| Opsi--ligand_prompt
digunakan, parameter--max_atoms
dan--min_atoms
akan diabaikan.
Jika ingin masukan file protein FASTA
python drug_generator.py -f bcl2.fasta -n 50
Jika ingin masukan urutan asam amino proteinnya
python drug_generator.py -p MAKQPSDVSSECDREGRQLQPAERPPQLRPGAPTSLQTEPQGNPEGNHGGEGDSCPHGSPQGPLAPPASPGPFATRSPLFIFMRRSSLLSRSSSGYFSFDTDRSPAPMSCDKSTQTPSPPCQAFNHYLSAMASMRQAEPADMRPEIWIAQELRRIGDEFNAYYARRVFLNNYQAAEDHPRMVILRLLRYIVRLVWRMH -n 50
Jika Anda ingin memberikan prompt untuk ligan
python drug_generator.py -f bcl2.fasta -l COc1ccc(cc1)C(=O) -n 50
Catatan: Jika Anda menjalankan di lingkungan Linux, Anda perlu mengapit prompt ligan dengan tanda kutip tunggal ('').
python drug_generator.py -f bcl2.fasta -l ' COc1ccc(cc1)C(=O) ' -n 50
DrugGPT: Strategi berbasis GPT untuk Merancang Ligan Potensial yang Menargetkan Protein Tertentu
Yuesen Li, Chengyi Gao, Xin Song, Xiangyu Wang, Yungang Xu, Suxia Han
bioRxiv 2023.06.29.543848; doi: https://doi.org/10.1101/2023.06.29.543848
Lisensi Publik Umum GNU v3.0