Strelka2는 작은 코호트의 생식선 변이 및 종양/정상 샘플 쌍의 체세포 변이를 분석하기 위해 최적화 된 빠르고 정확한 작은 변형 발신자입니다. Germline 발신자는 효율적인 계층화 된 일배 체형 모델을 사용하여 정확도를 향상시키고 판독 된 단계를 제공하며, 각 변이 유전자좌에서 어셈블리와 더 빠른 정렬 기반 일배 체형 접근 방식을 적응 적으로 선택합니다. Germline 발신자는 또한 혼합 모델 인델 오류 추정 방법을 사용하여 입력 시퀀싱 데이터를 분석하여 indel 노이즈에 대한 견고성을 향상시킵니다. 체세포 통화 모델은 정상 샘플에서 가능한 종양 세포 오염을 설명함으로써 액체 및 후기 단계 종양 분석을위한 원래 Strelka 방법을 향상시킨다. 다양한 통화 품질 기능을 훈련 된 임의의 산림 모델을 사용한 최종 경험적 변형 재 스코어링 단계가 두 발신자에게 추가되어 정밀도를 더욱 향상 시켰습니다.
최근 PrecisionFDA 일관성 및 진실 문제에 대한 제출과 비교하여 기본 구성에서 실행되는 Strelka2의 평균 intel f-score는 최상의 도전 제출물보다 각각 3.1% 및 0.08% 더 높습니다. 28 코어 서버의 런타임은 40x WGS 생식선 분석의 경우 ~ 40 분, 110x/40x WGS 종양-정규 체세포 분석의 경우 ~ 3 시간입니다. Strelka2 방법에 대한 자세한 내용은 생식선 및 신체 호출 모두에 대한 벤치마킹에 대해 다음과 같습니다.
Kim, S., Scheffler, K. et al. (2018) Strelka2 : 생식선 및 신체 변형의 빠르고 정확한 호출. 자연 방법 , 15, 591-594. doi : 10.1038/s41592-018-0051-x
... 해당 오픈 액세스 사전 인쇄
Strelka는 BAM 또는 CRAM 파일의 입력 읽기 매핑을 허용하고 선택적으로 VCF의 후보 및/또는 강제 통화 대립 유전자를 수락합니다. VCF 4.1 형식의 모든 작은 변형 예측을보고합니다. Germline 변형보고는 GVCF 컨벤션을 사용하여 변형 및 참조 통화 신뢰를 모두 표현합니다. 최상의 체세포 인델 성능을 위해 Strelka는 Manta Structural Variant 및 Indel 발신자와 함께 실행되도록 설계되었으며, 이는 추가 인델 후보자에게 주어진 최대 인델 크기 (기본적으로 49)를 제공합니다. 디자인별로 Manta와 Strelka는 기본 설정과 함께 실행됩니다. 모든 Indel 크기 (SV 및 SNV에 추가)에 대한 완전한 커버리지를 제공합니다. 기능 및 제한 사항에 대한 전체 설명은 사용자 안내서를 참조하십시오.
Strelka 설치 및 사용을 시작하려면 빠른 시작 안내서를 참조하십시오.
설치 및 Quick Start Guide를 검토 한 후 Strelka를 실행하고 결과 해석 및 하드웨어 요구 사항/계산 비용을 추정하는 방법에 대한 전체 지침은 Strelka 사용자 안내서를 참조하십시오.
Strelka 소스 코드는 GPLV3 라이센스에 따라 제공됩니다. Strelka에는 다른 오픈 소스 라이센스에 따라 제공되는 여러 타사 패키지가 포함되어 있습니다. 자세한 내용은 Copyright.txt를 참조하십시오.
Strelka 코드 개발 및 디버깅 세부 사항은 Strelka 개발자 안내서를 참조하십시오. 여기에는 Strelka의 개발 프로토콜, 특수 빌드 지침, 통화 조사를위한 권장 워크 플로 및 내부 문서 세부 사항에 대한 세부 정보가 포함됩니다.