strelka2是一種快速準確的小型呼叫者,用於優化用於分析小隊列的種系變化和腫瘤/正常樣品對的體細胞變異。種系呼叫者採用有效的分層單倍型模型來提高準確性並提供讀取的相位,並在每個變體基因座對組件和基於更快的基於對齊的單倍型方法進行自適應選擇。種系呼叫者還使用混合模式的Indel誤差估計方法來分析輸入測序數據,以提高對indel噪聲的魯棒性。通過考慮正常樣品中可能的腫瘤細胞污染,可以改善用於液體和晚期腫瘤分析的原始Strelka方法。使用培訓各種呼叫質量功能的隨機森林模型的最終經驗變體重新得分步驟已添加到兩個呼叫者中,以進一步提高精度。
與最近的PrecisionFDA一致性和真相挑戰的提交相比,默認配置運行的Strelka2的平均INDEL F-評分分別高3.1%和0.08%,高於最佳挑戰提交。 28核服務器上的運行時間為40分鐘40分鐘,用於40倍的種系分析,為110x/40x WGS腫瘤非正式的體細胞分析〜3小時。有關種系和軀體調用的Strelka2方法和基準測試的更多詳細信息:
Kim,S.,Scheffler,K。等。 (2018)strelka2:生殖線和軀體變體的快速準確呼喚。自然方法,15,591-594。 doi:10.1038/s41592-018-0051-X
...以及相應的開放式預印
STRELKA接受輸入讀取BAM或CRAM文件的映射,以及可選的候选和/或VCF的強制呼叫等位基因。它報告了VCF 4.1格式中的所有小型變體預測。種系變體報告使用GVCF慣例代表變體和參考呼叫信心。為了獲得最佳的Somatic Indel性能,Strelka的設計可與Manta結構變體和Indel Caller一起運行,Indel Caller可提供最高的Indel候選者,最高為給定的最大Indel尺寸(默認為49)。根據設計,Manta和Strelka與默認設置一起運行,可在所有Indel尺寸(SVS和SNV)上提供完整的覆蓋範圍。有關功能和限制的完整說明,請參見《用戶指南》。
要開始安裝和使用Strelka,請諮詢快速啟動指南。
完成安裝並審查快速啟動指南後,請參閱《 Strelka用戶指南》,以獲取有關如何運行Strelka,解釋結果和估算硬件要求/計算成本的完整說明,此外還有高級方法概述。
Strelka源代碼是在GPLV3許可證下提供的。 Strelka包括其他開源許可下提供的幾個第三方軟件包,請參閱popyright.txt,以獲取更多詳細信息。
有關Strelka代碼開發和調試詳細信息,請參見《 Strelka開發人員指南》。這包括有關Strelka開發協議,特殊構建說明,用於調查電話的建議工作流以及內部文檔詳細信息的詳細信息。