O STRELKA2 é um chamador de pequenas variantes rápido e preciso otimizado para análise da variação da linha germinativa em pequenas coortes e variação somática em pares de amostras de tumor/normal. O chamador da linha germinativa emprega um modelo de haplótipo em camadas eficiente para melhorar a precisão e fornecer fases apoiadas por leitura, selecionando adaptivamente entre montagem e uma abordagem de haplotipagem baseada em alinhamento mais rápida em cada locus variante. O chamador da linha germinativa também analisa os dados de sequenciamento de entrada usando um método de estimativa de erro de moda indel-modelo para melhorar a robustez do ruído do Indel. O modelo de chamada somática melhora o método Strelka original para análise de tumores líquido e em estágio tardio, representando a possível contaminação das células tumorais na amostra normal. Uma etapa de re-escoramento da variante empírica final usando modelos de florestas aleatórias treinadas em vários recursos de qualidade de chamada foi adicionada a ambos os chamadores para melhorar ainda mais a precisão.
Comparado com as submissões à recente consistência do PrecisionFDA e aos desafios da verdade, o escore F indel médio para Strelka2 em execução em sua configuração padrão é de 3,1% e 0,08% maior, respectivamente, do que os melhores envios de desafios. O tempo de execução em um servidor de 28 núcleos é de ~ 40 minutos para análise de linha germinativa de 40x WGS e ~ 3 horas para uma análise somática de 110x/40x WGs-normal. Mais detalhes sobre os métodos de strelka2 e o benchmarking para a linha germinativa e a chamada somática são descritos em:
Kim, S., Scheffler, K. et al. (2018) Strelka2: chamado rápido e preciso da linha germinativa e variantes somáticas. Nature Methods , 15, 591-594. doi: 10.1038/s41592-018-0051-x
... e a pré-impressão correspondente de acesso aberto
Strelka aceita mapeamentos de leitura de entrada de arquivos BAM ou CRAM e, opcionalmente, candidatos e/ou alelos forçados da VCF. Ele relata todas as pequenas previsões de variantes no formato VCF 4.1. O relatório da variante da linha germinativa usa as convenções do GVCF para representar a confiança da chamada de variante e referência. Para o melhor desempenho somático do Indel, o strelka foi projetado para ser executado com a variante estrutural de Manta e o chamador de ilhas, que fornece candidatos adicionais de indel até um determinado tamanho máximo do indel (49 por padrão). Por design, Manta e Strelka são executados em conjunto com as configurações padrão fornecem cobertura completa sobre todos os tamanhos de indel (em SVs e SNVs). Consulte o Guia do Usuário para obter uma descrição completa dos recursos e limitações.
Para começar a instalar e usar o strelka, consulte o guia de início rápido.
Depois de concluir a instalação e revisar o guia de início rápido, consulte o Guia do usuário do Strelka para obter instruções completas sobre como executar o strelka, interpretar os resultados e estimar os requisitos de hardware/custo de computação, além de uma visão geral dos métodos de alto nível.
O código -fonte do Strelka é fornecido sob a licença GPLV3. O Strelka inclui vários pacotes de terceiros fornecidos em outras licenças de código aberto, consulte Copyright.txt para obter detalhes adicionais.
Para obter detalhes de desenvolvimento de código e depuração da Strelka, consulte o Guia do desenvolvedor da Strelka. Isso inclui detalhes sobre os protocolos de desenvolvimento da Strelka, instruções de construção especiais, fluxos de trabalho recomendados para investigar chamadas e detalhes internos da documentação.