strelka2是一种快速准确的小型呼叫者,用于优化用于分析小队列的种系变化和肿瘤/正常样品对的体细胞变异。种系呼叫者采用有效的分层单倍型模型来提高准确性并提供读取的相位,并在每个变体基因座对组件和基于更快的基于对齐的单倍型方法进行自适应选择。种系呼叫者还使用混合模式的Indel误差估计方法来分析输入测序数据,以提高对indel噪声的鲁棒性。通过考虑正常样品中可能的肿瘤细胞污染,可以改善用于液体和晚期肿瘤分析的原始Strelka方法。使用培训各种呼叫质量功能的随机森林模型的最终经验变体重新得分步骤已添加到两个呼叫者中,以进一步提高精度。
与最近的PrecisionFDA一致性和真相挑战的提交相比,默认配置运行的Strelka2的平均INDEL F-评分分别高3.1%和0.08%,高于最佳挑战提交。 28核服务器上的运行时间为40分钟40分钟,用于40倍的种系分析,为110x/40x WGS肿瘤非正式的体细胞分析〜3小时。有关种系和躯体调用的Strelka2方法和基准测试的更多详细信息:
Kim,S.,Scheffler,K。等。 (2018)strelka2:生殖线和躯体变体的快速准确呼唤。自然方法,15,591-594。 doi:10.1038/s41592-018-0051-X
...以及相应的开放式预印
STRELKA接受输入读取BAM或CRAM文件的映射,以及可选的候选和/或VCF的强制呼叫等位基因。它报告了VCF 4.1格式中的所有小型变体预测。种系变体报告使用GVCF惯例代表变体和参考呼叫信心。为了获得最佳的Somatic Indel性能,Strelka的设计可与Manta结构变体和Indel Caller一起运行,Indel Caller可提供最高的Indel候选者,最高为给定的最大Indel尺寸(默认为49)。根据设计,Manta和Strelka与默认设置一起运行,可在所有Indel尺寸(SVS和SNV)上提供完整的覆盖范围。有关功能和限制的完整说明,请参见《用户指南》。
要开始安装和使用Strelka,请咨询快速启动指南。
完成安装并审查快速启动指南后,请参阅《 Strelka用户指南》,以获取有关如何运行Strelka,解释结果和估算硬件要求/计算成本的完整说明,此外还有高级方法概述。
Strelka源代码是在GPLV3许可证下提供的。 Strelka包括其他开源许可下提供的几个第三方软件包,请参阅popyright.txt,以获取更多详细信息。
有关Strelka代码开发和调试详细信息,请参见《 Strelka开发人员指南》。这包括有关Strelka开发协议,特殊构建说明,用于调查电话的建议工作流以及内部文档详细信息的详细信息。