خوارزمية SPACE2 هي طريقة تقوم بتجميع الأجسام المضادة بسرعة من خلال تشابه النماذج الهيكلية وتجميع الأجسام المضادة التي تربط نفس الحاتمة بدقة.
يتطلب SPACE2 نماذج هيكلية للأجسام المضادة كمدخل، ويمكن إنشاؤها باستخدام ImmuneBuilder. ثم يتم تجميع الأجسام المضادة في ثلاث خطوات رئيسية. في البداية، يتم تقسيم النماذج إلى مجموعات ذات أطوال CDR متطابقة. يتم بعد ذلك محاذاة النماذج في كل مجموعة هيكليًا على Cα للمخلفات في مناطق الإطار ويتم حساب مصفوفة المسافة الزوجية لـ Cα RMSDs لبقايا حلقة CDR. ثم يتم تجميع الأجسام المضادة بناءً على هذه المسافات.
للتحميل والتثبيت:
$ git clone https://github.com/fspoendlin/SPACE2.git
$ pip install SPACE2/
لتشغيل التجميع، ستحتاج إلى نماذج الأجسام المضادة المرقمة بـ IMGT ومع معرف السلسلة "H" للسلسلة الثقيلة و"L" للسلسلة الخفيفة. يمكن الحصول على النماذج ذات ترقيم IMGT ومعرفات السلسلة الصحيحة من التشغيل الافتراضي لبرنامج ImmuneBuilder. بمجرد أن يكون لديك دليل يحتوي على نماذج الأجسام المضادة، يمكنك تجميعها باستخدام SPACE2.
يظهر أدناه مثال لكيفية تجميع الأجسام المضادة باستخدام SPACE2 باستخدام التجميع التكتلي والمعلمات الافتراضية. هذه هي الطريقة الموصى بها لتجميع الأجسام المضادة.
import glob
import SPACE2
antibody_models = glob . glob ( "path/to/antibody/models/*.pdb" )
clustered_dataframe = SPACE2 . agglomerative_clustering ( antibody_models , cutoff = 1.25 , n_jobs = - 1 )
سيقوم الكود أعلاه بتقسيم الأجسام المضادة إلى مجموعات لها نفس طول CDRs. لكل مجموعة، يتم تركيب نماذج الأجسام المضادة هيكليًا على مناطق إطار السلسلة الثقيلة والخفيفة. ثم يتم حساب C-alpha RMSD عبر جميع CDRs الستة (يتم استخدام تعريفات CDR الشمالية بشكل افتراضي) ويتم استخدام خوارزمية التجميع التكتلية مع عتبة مسافة 1.25 Å لتجميع الأجسام المضادة. الإخراج عبارة عن إطار بيانات الباندا الذي يحتوي على المجموعة الهيكلية المخصصة لكل جسم مضاد.
تدعم حزمة SPACE2 مجموعة من الخيارات لتخصيص التجميع، على سبيل المثال:
انظر دفاتر الملاحظات على سبيل المثال الاستخدام.
يقوم SPACE2 بإخراج إطار بيانات الباندا الذي يحتوي على المجموعة الهيكلية المخصصة لكل جسم مضاد. يتم تنسيق الإخراج على النحو التالي مع أعمدة تشير إلى اسم الجسم المضاد (ID)، وطول جميع CDRs التي تم أخذها في الاعتبار أثناء التجميع بالترتيب H1-3 وL1-3 (cluster_by_length) وممثل المجموعة الهيكلية المعينة (cluster_by_rmsd).
بطاقة تعريف | الكتلة_حسب_الطول | cluster_by_rmsd | |
---|---|---|---|
0 | BD56-1450.pdb | 15_9_12_11_8_8 | BD56-1450.pdb |
1 | BD55-6240.pdb | 15_9_12_11_8_8 | BD56-1450.pdb |
2 | BD55-1117.pdb | 13_10_13_13_8_11 | BD55-1117.pdb |
... | ... | ... | ... |
يقوم SPACE2 بتجميع 10000 جسم مضاد في حوالي دقيقتين عند موازنته مع أكثر من 12 وحدة معالجة مركزية. يتم قياس الخوارزمية تقريبًا عند O(n 1.5 ) مع عدد الأجسام المضادة (n).
@article{Spoendlin2023,
title = {Improved computational epitope profiling using structural models identifies a broader diversity of antibodies that bind the same epitope},
author = {Fabian C. Spoendlin, Brennan Abanades, Matthew I. J. Raybould, Wing Ki Wong, Guy Georges, and Charlotte M. Deane},
journal = {Frontiers in Molecular Biosciences},
doi = {10.3389/fmolb.2023.1237621},
volume = {10},
year = {2023},
}