STRELKA2 es una variante de variante pequeña rápida y precisa optimizada para el análisis de la variación de la línea germinal en pequeñas cohortes y variación somática en pares de muestras tumorales/normales. La persona que llama germen emplea un modelo de haplotipo escalonado eficiente para mejorar la precisión y proporcionar fase respaldada, seleccionando adaptativamente entre el ensamblaje y un enfoque de haplotipos basado en la alineación más rápido en cada locus variante. La persona que llamó en la línea germinal también analiza los datos de secuenciación de entrada utilizando un método de estimación de errores de la mezcla del modelo de modelo para mejorar la robustez al ruido indel. El modelo de llamadas somáticas mejora el método original de Strelka para el análisis de tumores líquidos y en etapa tardía al tener en cuenta la posible contaminación de células tumorales en la muestra normal. Se ha agregado un paso final de reducción de la variante empírica utilizando modelos de bosques aleatorios entrenados en varias características de calidad de llamadas a ambas personas que llaman para mejorar aún más la precisión.
En comparación con las presentaciones a la reciente consistencia de PrecisionFDA y desafíos de la verdad, la puntuación F INDEL promedio para STRELKA2 que se ejecuta en su configuración predeterminada es 3.1% y 0.08% más alta, respectivamente, que las mejores presentaciones de desafío. El tiempo de ejecución en un servidor de 28 núcleos es de ~ 40 minutos para el análisis de línea germinal de 40x WGS y ~ 3 horas para un análisis somático tumoral-normal de tumores de 110x/40x WGS. Se describen más detalles sobre los métodos de Strelka2 y la evaluación comparativa para la línea germinal y las llamadas somáticas en:
Kim, S., Scheffler, K. et al. (2018) Strelka2: llamadas rápidas y precisas de la línea germinal y las variantes somáticas. Métodos de la naturaleza , 15, 591-594. doi: 10.1038/s41592-018-0051-x
... y la preimpresión de acceso abierto correspondiente
Strelka acepta asignaciones de lectura de entrada de los archivos BAM o CRAM, y opcionalmente alemanes candidatos y/o de llamas forzadas de VCF. Reporta todas las predicciones de variantes pequeñas en formato VCF 4.1. Los informes de variantes de línea germinal utiliza las convenciones GVCF para representar la confianza de las llamadas de variantes y de referencia. Para el mejor rendimiento de Indel somático, Strelka está diseñado para ejecutarse con la variante estructural de Manta y la persona que llama Indel, que proporciona candidatos indel adicionales hasta un tamaño de INDEL máximo dado (49 por defecto). Por diseño, Manta y Strelka se ejecutan junto con la configuración predeterminada proporcionan una cobertura completa sobre todos los tamaños de INDEL (adicionales a SVS y SNV). Consulte la guía del usuario para obtener una descripción completa de las capacidades y limitaciones.
Para comenzar a instalar y usar Strelka, consulte la Guía de inicio rápido.
Después de completar la instalación y revisar la guía de inicio rápido, consulte la guía del usuario de Strelka para obtener instrucciones completas sobre cómo ejecutar Strelka, interpretar los resultados y estimar los requisitos de hardware/costo de cálculo, además de una descripción general de los métodos de alto nivel.
El código fuente de Strelka se proporciona bajo la licencia GPLV3. Strelka incluye varios paquetes de terceros proporcionados bajo otras licencias de código abierto, consulte Copyright.txt para obtener detalles adicionales.
Para los detalles de desarrollo y depuración del código Strelka, consulte la Guía de desarrolladores de Strelka. Esto incluye detalles sobre los protocolos de desarrollo de Strelka, las instrucciones especiales de compilación, los flujos de trabajo recomendados para investigar llamadas y detalles de documentación interna.