SPACE2 알고리즘은 구조 모델의 유사성을 이용해 항체를 빠르게 클러스터링하고, 동일한 에피토프에 결합하는 항체를 정확하게 그룹화하는 방법이다.
SPACE2에는 입력으로 항체의 구조 모델이 필요하며, 이는 ImmuneBuilder를 사용하여 생성할 수 있습니다. 그런 다음 항체는 세 가지 주요 단계로 클러스터링됩니다. 처음에는 모델이 동일한 CDR 길이의 그룹으로 분할됩니다. 그런 다음 각 그룹의 모델은 프레임워크 영역의 잔기 Cα에 구조적으로 정렬되고 쌍별 거리 행렬은 CDR 루프 잔기의 Cα RMSD로 계산됩니다. 그런 다음 항체는 이러한 거리를 기준으로 클러스터링됩니다.
다운로드하고 설치하려면:
$ git clone https://github.com/fspoendlin/SPACE2.git
$ pip install SPACE2/
클러스터링을 실행하려면 IMGT 번호가 매겨지고 중쇄의 경우 사슬 식별자 'H', 경쇄의 경우 'L'이 있는 항체 모델이 필요합니다. IMGT 번호가 지정되고 올바른 체인 식별자가 있는 모델은 ImmuneBuilder의 기본 실행에서 얻을 수 있습니다. 항체 모델이 포함된 디렉토리가 있으면 SPACE2를 사용하여 클러스터링할 수 있습니다.
응집 클러스터링 및 기본 매개변수를 사용하여 SPACE2로 항체를 클러스터링하는 방법의 예가 아래에 나와 있습니다. 이는 항체를 클러스터링하는 권장 방법입니다.
import glob
import SPACE2
antibody_models = glob . glob ( "path/to/antibody/models/*.pdb" )
clustered_dataframe = SPACE2 . agglomerative_clustering ( antibody_models , cutoff = 1.25 , n_jobs = - 1 )
위의 코드는 항체를 동일한 길이의 CDR 그룹으로 나눕니다. 각 그룹의 항체 모델은 중쇄 및 경쇄 프레임워크 영역에 구조적으로 중첩됩니다. 그런 다음 C-알파 RMSD는 6개의 모든 CDR(기본적으로 North CDR 정의가 사용됨)에 걸쳐 계산되고 거리 임계값이 1.25Å인 응집 클러스터링 알고리즘을 사용하여 항체를 그룹화합니다. 출력은 각 항체에 할당된 구조 클러스터를 포함하는 pandas 데이터 프레임입니다.
SPACE2 패키지는 클러스터링을 사용자 정의하기 위한 다양한 옵션을 지원합니다. 예:
사용 예는 노트북을 참조하세요.
SPACE2는 각 항체에 할당된 구조 클러스터를 포함하는 pandas 데이터프레임을 출력합니다. 출력은 항체 이름(ID), 클러스터링 중에 고려되는 모든 CDR의 길이(H1-3 및 L1-3 순서)(cluster_by_length) 및 할당된 구조 클러스터의 대표(cluster_by_rmsd)를 나타내는 열로 아래와 같이 형식화됩니다.
ID | Cluster_by_length | Cluster_by_rmsd | |
---|---|---|---|
0 | BD56-1450.pdb | 15_9_12_11_8_8 | BD56-1450.pdb |
1 | BD55-6240.pdb | 15_9_12_11_8_8 | BD56-1450.pdb |
2 | BD55-1117.pdb | 13_10_13_13_8_11 | BD55-1117.pdb |
... | ... | ... | ... |
SPACE2는 12개의 CPU를 통해 병렬화될 때 약 2분 안에 10,000개의 항체를 클러스터링합니다. 알고리즘은 항체 수(n)에 따라 대략 O(n 1.5 )로 확장됩니다.
@article{Spoendlin2023,
title = {Improved computational epitope profiling using structural models identifies a broader diversity of antibodies that bind the same epitope},
author = {Fabian C. Spoendlin, Brennan Abanades, Matthew I. J. Raybould, Wing Ki Wong, Guy Georges, and Charlotte M. Deane},
journal = {Frontiers in Molecular Biosciences},
doi = {10.3389/fmolb.2023.1237621},
volume = {10},
year = {2023},
}