Algoritme SPACE2 adalah metode yang secara cepat mengelompokkan antibodi berdasarkan kesamaan model struktural dan secara akurat mengelompokkan antibodi yang mengikat epitop yang sama.
SPACE2 memerlukan model struktural antibodi sebagai masukan, ini dapat dihasilkan dengan ImmuneBuilder. Antibodi kemudian dikelompokkan dalam tiga langkah utama. Awalnya, model dibagi menjadi beberapa kelompok dengan panjang CDR yang identik. Model di setiap kelompok kemudian diselaraskan secara struktural pada Cα residu di wilayah kerangka kerja dan matriks jarak berpasangan dihitung dari Cα RMSDs residu loop CDR. Antibodi kemudian dikelompokkan berdasarkan jarak tersebut.
Untuk mengunduh dan menginstal:
$ git clone https://github.com/fspoendlin/SPACE2.git
$ pip install SPACE2/
Untuk menjalankan pengelompokan, Anda memerlukan model antibodi bernomor IMGT dan dengan pengidentifikasi rantai 'H' untuk rantai berat dan 'L' untuk rantai ringan. Model dengan penomoran IMGT dan pengidentifikasi rantai yang benar dapat diperoleh dari ImmuneBuilder yang dijalankan secara default. Setelah Anda memiliki direktori dengan model antibodi, Anda dapat mengelompokkannya menggunakan SPACE2.
Contoh cara mengelompokkan antibodi dengan SPACE2 menggunakan pengelompokan aglomeratif dan parameter default ditunjukkan di bawah. Ini adalah cara yang disarankan untuk mengelompokkan antibodi.
import glob
import SPACE2
antibody_models = glob . glob ( "path/to/antibody/models/*.pdb" )
clustered_dataframe = SPACE2 . agglomerative_clustering ( antibody_models , cutoff = 1.25 , n_jobs = - 1 )
Kode di atas akan membagi antibodi menjadi kelompok-kelompok dengan panjang CDR yang sama. Untuk setiap kelompok, model antibodi ditumpangkan secara struktural pada wilayah kerangka rantai berat dan ringan. Kemudian RMSD C-alpha dihitung di keenam CDR (definisi CDR Utara digunakan secara default) dan algoritma pengelompokan aglomeratif dengan ambang batas jarak 1,25 Å digunakan untuk mengelompokkan antibodi. Outputnya adalah kerangka data panda yang berisi cluster struktural yang ditetapkan untuk setiap antibodi.
Paket SPACE2 mendukung berbagai opsi untuk menyesuaikan pengelompokan, misalnya:
Lihat buku catatan untuk contoh penggunaan.
SPACE2 mengeluarkan kerangka data panda yang berisi kluster struktural yang ditetapkan untuk setiap antibodi. Outputnya diformat seperti di bawah ini dengan kolom yang menunjukkan nama antibodi (ID), panjang semua CDR yang dipertimbangkan selama pengelompokan dalam urutan H1-3 dan L1-3 (cluster_by_length) dan perwakilan dari cluster struktural yang ditugaskan (cluster_by_rmsd).
PENGENAL | cluster_by_length | cluster_by_rmsd | |
---|---|---|---|
0 | BD56-1450.pdb | 15_9_12_11_8_8 | BD56-1450.pdb |
1 | BD55-6240.pdb | 15_9_12_11_8_8 | BD56-1450.pdb |
2 | BD55-1117.pdb | 13_10_13_13_8_11 | BD55-1117.pdb |
... | ... | ... | ... |
SPACE2 mengelompokkan 10.000 antibodi dalam waktu sekitar 2 menit ketika diparalelkan melalui 12 CPU. Algoritma ini menskalakan secara kasar pada O(n 1.5 ) dengan jumlah antibodi (n).
@article{Spoendlin2023,
title = {Improved computational epitope profiling using structural models identifies a broader diversity of antibodies that bind the same epitope},
author = {Fabian C. Spoendlin, Brennan Abanades, Matthew I. J. Raybould, Wing Ki Wong, Guy Georges, and Charlotte M. Deane},
journal = {Frontiers in Molecular Biosciences},
doi = {10.3389/fmolb.2023.1237621},
volume = {10},
year = {2023},
}