2024/08/11 يسعدنا أن نعلن عن ميزة جديدة، وهي تقليل طاقة Ligand، المتوفرة الآن في أحدث إصدار لدينا. بالإضافة إلى ذلك، استكشف أداتنا الجديدة، druggpt_min_multi.py، المصممة خصيصًا لتقليل الطاقة بكفاءة للروابط المتعددة.
2024/07/30 تم الانتهاء من جميع عمليات التحقق من الصحة في المختبر، مما يؤكد أن DrugGPT يمتلك قدرات تحسين الروابط.
2024/05/16 تؤكد التجارب المعملية الرطبة قدرة Druggpt على تصميم روابط مع سقالات جديدة من الصفر وإعادة استخدام الروابط الموجودة. لا يزال تحسين Ligand قيد التقييم. ترقبوا المزيد من التحديثات!
2024/05/16 تمت ترقية الإصدار إلى druggpt_v1.2، والذي يتميز بقدرات جديدة للتحكم في الرقم الذري. بسبب مشاكل التوافق، تمت إزالة webui.
تمت ترقية الإصدار 2024/04/03 إلى druggpt_v1.1، مما أدى إلى تعزيز الاستقرار وإضافة webui. سوف تتميز الإصدارات المستقبلية بالتحكم في عدد الذرة في الجزيئات. ابقوا متابعين.
2024/03/31 بعد دراسة متأنية، أخطط لإنشاء مستودعات جديدة باسم druggpt_toolbox و druggpt_train لتخزين البرامج النصية لأدوات ما بعد المعالجة والبرامج النصية للتدريب، على التوالي. يجب أن يركز هذا المستودع في المقام الأول على توليد الجزيئات المرشحة للأدوية.
2024/03/31 لقد قررت إنشاء فرع باسم druggpt_v1.0 للإصدار الحالي نظرًا لأنه إصدار مستقر. وبعد ذلك سأستمر في تحديث الكود.
2024/01/18 هذا المشروع الآن قيد التقييم التجريبي للتأكد من قيمته الفعلية في أبحاث الدواء. يرجى الاستمرار في متابعتنا!
يقدم DrugGPT إستراتيجية تصميم الروابط على أساس نموذج الانحدار الذاتي، GPT، مع التركيز على استكشاف الفضاء الكيميائي واكتشاف الروابط لبروتينات معينة. أظهرت نماذج لغة التعلم العميق إمكانات كبيرة في مجالات مختلفة بما في ذلك تصميم البروتين وتحليل النصوص الطبية الحيوية، مما يوفر دعمًا قويًا لاقتراح DrugGPT.
في هذه الدراسة، نستخدم نموذج DrugGPT لتعلم كمية كبيرة من البيانات المرتبطة بالبروتينات، بهدف اكتشاف جزيئات جديدة يمكنها الارتباط ببروتينات معينة. لا تعمل هذه الإستراتيجية على تحسين كفاءة تصميم المركب بشكل كبير فحسب، بل توفر أيضًا وسيلة سريعة وفعالة لعملية تطوير الأدوية، مما يوفر إمكانيات جديدة للمجال الصيدلاني
git clone https://github.com/LIYUESEN/druggpt.git
cd druggpt
أو يمكنك فقط النقر فوق Code>Download ZIP لتنزيل هذا الريبو.
conda create -n druggpt python=3.7
conda activate druggpt
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
pip install datasets transformers scipy scikit-learn psutil
conda install conda-forge/label/cf202003::openbabel
استخدم drug_generator.py
المعلمات المطلوبة:
-p
| --pro_seq
: أدخل تسلسل الأحماض الأمينية للبروتين.
-f
| --fasta
: أدخل ملف FASTA.
يجب تحديد واحد فقط من -p و -f.
-l
| --ligand_prompt
: أدخل موجه ligand.
-e
| --empty_input
: تمكين وضع الإنشاء المباشر.
-n
| --number
: على الأقل عدد الجزيئات التي سيتم توليدها.
-d
| --device
: جهاز للاستخدام. الافتراضي هو "كودا".
-o
| --output
: دليل الإخراج للجزيئات التي تم إنشاؤها. الافتراضي هو "./ligand_output/".
-b
| --batch_size
: كم عدد الجزيئات التي سيتم إنشاؤها لكل دفعة. حاول تقليل هذه القيمة إذا كان لديك ذاكرة وصول عشوائي منخفضة. الافتراضي هو 16.
-t
| --temperature
: يضبط عشوائية إنشاء النص؛ القيم الأعلى تنتج مخرجات أكثر تنوعا. القيمة الافتراضية هي 1.0.
--top_k
: عدد الرموز المميزة ذات الاحتمالية الأعلى التي يجب أخذها في الاعتبار لأخذ عينات top-k. الافتراضي هو 9.
--top_p
: عتبة الاحتمال التراكمي (0.0 - 1.0) لأخذ عينات أعلى p (النواة). وهو يحدد الحد الأدنى للمجموعة الفرعية من الرموز المميزة التي يجب مراعاتها عند أخذ العينات العشوائية. الافتراضي هو 0.9.
--min_atoms
: الحد الأدنى لعدد الذرات غير H المسموح بإنشائها. الإعدادات الافتراضية إلى لا شيء.
--max_atoms
: الحد الأقصى لعدد الذرات غير H المسموح بإنشائها. الافتراضي إلى 35.
--no_limit
: تعطيل الحد الأقصى الافتراضي للذرات.
إذا كان
-l
| يتم استخدام خيار--ligand_prompt
، وسيتم تجاهل المعلمات--max_atoms
و----min_atoms
.
إذا كنت ترغب في إدخال ملف البروتين FASTA
python drug_generator.py -f bcl2.fasta -n 50
إذا كنت تريد إدخال تسلسل الأحماض الأمينية للبروتين
python drug_generator.py -p MAKQPSDVSSECDREGRQLQPAERPPQLRPGAPTSLQTEPQGNPEGNHGGEGDSCPHGSPQGPLAPPASPGPFATRSPLFIFMRRSSLLSRSSSGYFSFDTDRSPAPMSCDKSTQTPSPPCQAFNHYLSAMASMRQAEPADMRPEIWIAQELRRIGDEFNAYYARRVFLNNYQAAEDHPRMVILRLLRYIVRLVWRMH -n 50
إذا كنت تريد تقديم مطالبة لليجند
python drug_generator.py -f bcl2.fasta -l COc1ccc(cc1)C(=O) -n 50
ملاحظة: إذا كنت تعمل في بيئة Linux، فستحتاج إلى إحاطة موجه الارتباط بعلامات اقتباس مفردة ('').
python drug_generator.py -f bcl2.fasta -l ' COc1ccc(cc1)C(=O) ' -n 50
DrugGPT: استراتيجية تعتمد على GPT لتصميم الروابط المحتملة التي تستهدف بروتينات معينة
يوسن لي، تشينجي جاو، شين سونج، شيانغيو وانغ، يونغانغ شو، سوكسيا هان
بيوركسيف 2023.06.29.543848; دوى: https://doi.org/10.1101/2023.06.29.543848
رخصة جنو العامة v3.0