Der SPACE2-Algorithmus ist eine Methode, die Antikörper anhand der Ähnlichkeit von Strukturmodellen schnell gruppiert und Antikörper, die dasselbe Epitop binden, genau gruppiert.
SPACE2 benötigt Strukturmodelle von Antikörpern als Eingabe, diese können mit ImmuneBuilder generiert werden. Die Antikörper werden dann in drei Hauptschritten geclustert. Zunächst werden die Modelle in Gruppen identischer CDR-Längen aufgeteilt. Modelle in jeder Gruppe werden dann strukturell am Cα von Resten in Gerüstregionen ausgerichtet und eine paarweise Distanzmatrix wird aus den Cα RMSDs von CDR-Schleifenresten berechnet. Basierend auf diesen Abständen werden die Antikörper dann geclustert.
Zum Herunterladen und Installieren:
$ git clone https://github.com/fspoendlin/SPACE2.git
$ pip install SPACE2/
Um das Clustering durchzuführen, benötigen Sie Antikörpermodelle mit IMGT-Nummer und der Kettenkennung „H“ für die schwere Kette und „L“ für die leichte Kette. Modelle mit IMGT-Nummerierung und korrekten Kettenkennungen können aus einem Standardlauf von ImmuneBuilder abgerufen werden. Sobald Sie ein Verzeichnis mit Antikörpermodellen haben, können Sie diese mit SPACE2 gruppieren.
Ein Beispiel für die Clusterung von Antikörpern mit SPACE2 unter Verwendung von agglomerativem Clustering und Standardparametern ist unten dargestellt. Dies ist die empfohlene Methode zur Clusterung von Antikörpern.
import glob
import SPACE2
antibody_models = glob . glob ( "path/to/antibody/models/*.pdb" )
clustered_dataframe = SPACE2 . agglomerative_clustering ( antibody_models , cutoff = 1.25 , n_jobs = - 1 )
Der obige Code unterteilt Antikörper in Gruppen mit CDRs gleicher Länge. Für jede Gruppe werden Antikörpermodelle strukturell über die Gerüstregionen der schweren und leichten Kette gelegt. Anschließend wird der C-alpha-RMSD für alle sechs CDRs berechnet (standardmäßig werden North-CDR-Definitionen verwendet) und ein agglomerativer Clustering-Algorithmus mit einem Abstandsschwellenwert von 1,25 Å zur Gruppierung der Antikörper verwendet. Die Ausgabe ist ein Pandas-Datenrahmen, der den zugewiesenen Strukturcluster für jeden Antikörper enthält.
Das SPACE2-Paket unterstützt eine Reihe von Optionen zum Anpassen des Clusterings, z. B.:
Beispiele für die Verwendung finden Sie unter Notebooks.
SPACE2 gibt einen Pandas-Datenrahmen aus, der den zugewiesenen Strukturcluster für jeden Antikörper enthält. Die Ausgabe ist wie folgt formatiert, mit Spalten, die den Antikörpernamen (ID), die Länge aller beim Clustering berücksichtigten CDRs in der Reihenfolge H1-3 und L1-3 (cluster_by_length) und einen Vertreter des zugewiesenen Strukturclusters (cluster_by_rmsd) angeben.
AUSWEIS | cluster_by_length | Cluster_by_rmsd | |
---|---|---|---|
0 | BD56-1450.pdb | 15_9_12_11_8_8 | BD56-1450.pdb |
1 | BD55-6240.pdb | 15_9_12_11_8_8 | BD56-1450.pdb |
2 | BD55-1117.pdb | 13_10_13_13_8_11 | BD55-1117.pdb |
... | ... | ... | ... |
SPACE2 clustert 10.000 Antikörper in etwa 2 Minuten, wenn es über 12 CPUs parallelisiert wird. Der Algorithmus skaliert ungefähr bei O(n 1,5 ) mit der Anzahl der Antikörper (n).
@article{Spoendlin2023,
title = {Improved computational epitope profiling using structural models identifies a broader diversity of antibodies that bind the same epitope},
author = {Fabian C. Spoendlin, Brennan Abanades, Matthew I. J. Raybould, Wing Ki Wong, Guy Georges, and Charlotte M. Deane},
journal = {Frontiers in Molecular Biosciences},
doi = {10.3389/fmolb.2023.1237621},
volume = {10},
year = {2023},
}