อัลกอริธึม SPACE2 เป็นวิธีการที่จัดกลุ่มแอนติบอดีอย่างรวดเร็วโดยความคล้ายคลึงกันของแบบจำลองโครงสร้าง และจัดกลุ่มแอนติบอดีที่ผูกกับอีพิโทปเดียวกันอย่างแม่นยำ
SPACE2 ต้องใช้แบบจำลองโครงสร้างของแอนติบอดีเป็นข้อมูลนำเข้า ซึ่งสามารถสร้างได้ด้วย ImmuneBuilder จากนั้นแอนติบอดีจะถูกรวมกลุ่มกันเป็นสามขั้นตอนหลัก ในขั้นแรก แบบจำลองจะแบ่งออกเป็นกลุ่มที่มีความยาว CDR ที่เท่ากัน จากนั้นแบบจำลองในแต่ละกลุ่มถูกจัดแนวเชิงโครงสร้างบน Cα ของเรซิดิวในบริเวณเฟรมเวิร์กและเมทริกซ์ระยะห่างแบบคู่ถูกคำนวณของ Cα RMSD ของเรซิดิวลูป CDR จากนั้นแอนติบอดีจะถูกรวมกลุ่มตามระยะห่างเหล่านี้
วิธีดาวน์โหลดและติดตั้ง:
$ git clone https://github.com/fspoendlin/SPACE2.git
$ pip install SPACE2/
ในการรันการทำคลัสเตอร์ คุณจะต้องมีแบบจำลองแอนติบอดีซึ่งมีหมายเลข IMGT และมีตัวระบุสาย 'H' สำหรับสายโซ่หนักและ 'L' สำหรับสายโซ่เบา โมเดลที่มีการกำหนดหมายเลข IMGT และตัวระบุลูกโซ่ที่ถูกต้องสามารถรับได้จากการรันเริ่มต้นของ ImmuneBuilder เมื่อคุณมีไดเร็กทอรีที่มีโมเดลแอนติบอดีแล้ว คุณสามารถจัดกลุ่มโมเดลเหล่านั้นได้โดยใช้ SPACE2
ตัวอย่างของวิธีการรวมกลุ่มแอนติบอดีด้วย SPACE2 โดยใช้การทำคลัสเตอร์แบบกลุ่มและพารามิเตอร์เริ่มต้นถูกแสดงไว้ด้านล่าง นี่เป็นวิธีที่แนะนำในการจัดกลุ่มแอนติบอดี
import glob
import SPACE2
antibody_models = glob . glob ( "path/to/antibody/models/*.pdb" )
clustered_dataframe = SPACE2 . agglomerative_clustering ( antibody_models , cutoff = 1.25 , n_jobs = - 1 )
รหัสข้างต้นจะแบ่งแอนติบอดีออกเป็นกลุ่มที่มี CDR ที่มีความยาวเท่ากัน สำหรับแบบจำลองแอนติบอดีแต่ละกลุ่มถูกวางทับเชิงโครงสร้างบนบริเวณเฟรมเวิร์คของสายหนักและสายเบา จากนั้น C-อัลฟา RMSD จะถูกคำนวณโดยตลอด CDR ทั้งหกตัว (คำจำกัดความของ CDR เหนือถูกใช้โดยค่าเริ่มต้น) และอัลกอริธึมการจัดกลุ่มแบบกลุ่มที่มีเกณฑ์ระยะทาง 1.25 Å ถูกใช้เพื่อจัดกลุ่มแอนติบอดี ผลลัพธ์คือดาต้าเฟรมแพนด้าที่มีคลัสเตอร์โครงสร้างที่กำหนดสำหรับแอนติบอดีแต่ละตัว
แพ็คเกจ SPACE2 รองรับตัวเลือกมากมายในการปรับแต่งการจัดกลุ่ม เช่น:
ดูสมุดบันทึกสำหรับตัวอย่างการใช้งาน
SPACE2 ส่งออก dataframe ของ pandas ที่มีคลัสเตอร์โครงสร้างที่กำหนดสำหรับแอนติบอดีแต่ละตัว ผลลัพธ์ถูกจัดรูปแบบตามด้านล่างโดยมีคอลัมน์ซึ่งบ่งชี้ชื่อแอนติบอดี (ID), ความยาวของ CDR ทั้งหมดที่พิจารณาในระหว่างการจัดกลุ่มตามลำดับ H1-3 และ L1-3 (ความยาวคลัสเตอร์_by_) และตัวแทนของคลัสเตอร์โครงสร้างที่กำหนด (คลัสเตอร์_by_rmsd)
บัตรประจำตัวประชาชน | คลัสเตอร์_by_length | คลัสเตอร์_by_rmsd | |
---|---|---|---|
0 | BD56-1450.pdb | 15_9_12_11_8_8 | BD56-1450.pdb |
1 | BD55-6240.pdb | 15_9_12_11_8_8 | BD56-1450.pdb |
2 | BD55-1117.pdb | 13_10_13_13_8_11 | BD55-1117.pdb |
- | - | - | - |
SPACE2 จัดกลุ่มแอนติบอดี 10,000 ตัวในเวลาประมาณ 2 นาที เมื่อวางขนานกันบน CPU 12 ตัว อัลกอริธึมจะปรับขนาดโดยประมาณที่ O(n 1.5 ) พร้อมด้วยจำนวนแอนติบอดี (n)
@article{Spoendlin2023,
title = {Improved computational epitope profiling using structural models identifies a broader diversity of antibodies that bind the same epitope},
author = {Fabian C. Spoendlin, Brennan Abanades, Matthew I. J. Raybould, Wing Ki Wong, Guy Georges, and Charlotte M. Deane},
journal = {Frontiers in Molecular Biosciences},
doi = {10.3389/fmolb.2023.1237621},
volume = {10},
year = {2023},
}