Strelka2 ist ein schneller und genauer kleiner Variante -Anrufer, der für die Analyse der Keimbahnvariation in kleinen Kohorten und somatischen Variationen in Tumor-/normalen Probenpaaren optimiert ist. Der Keimlinie-Anrufer verwendet ein effizientes Haplotyp-Modell, um die Genauigkeit zu verbessern und eine abgelete Phasing zu liefern, wodurch sich an jedem Variantenort adaptiv zwischen der Montage und einem schnelleren Ausrichtungsbasis-basierten Haplotyping-Ansatz auswählt. Der Keimbahnanrufer analysiert auch die Eingabesequenzierungsdaten unter Verwendung einer Mischungsmodell-Indel-Fehlerschätzungsmethode, um die Robustheit gegenüber Indelsrauschen zu verbessern. Das somatische Aufrufmodell verbessert die ursprüngliche Strelka-Methode für eine Tumoranalyse der Flüssig- und Spätstufe, indem es eine mögliche Kontamination von Tumorzellen in der normalen Probe berücksichtigt. Bei beiden Anrufern wurde eine endgültige empirische Variante mit dem neu ausgebildeten Fortschrittsmodellen mit zufälligen Waldmodellen hinzugefügt, um die Präzision weiter zu verbessern.
Im Vergleich zu Einsendungen zu den jüngsten PrecisionFDA-Konsistenz- und Wahrheitsproblemen liegt der durchschnittliche Indel F-Score für Strelka2, der in seiner Standardkonfiguration ausgeführt wird, 3,1% bzw. 0,08% höher als die besten Herausforderungen. Die Laufzeit auf einem 28-Core-Server beträgt ~ 40 Minuten für 40x WGS-Keimbahnanalyse und ~ 3 Stunden für eine 110x/40x WGS-Tumor-Normal-somatische Analyse. Weitere Details zu Strelka2 -Methoden und Benchmarking für Keimbahn und somatische Anrufe sind in:
Kim, S., Scheffler, K. et al. (2018) Strelka2: Schnelle und genaue Aufruf von Keimbahn- und somatischen Varianten. Naturmethoden , 15, 591-594. doi: 10.1038/s41592-018-0051-x
... und der entsprechende Open-Access-Vordruck
Strelka akzeptiert Eingabe-Lesezuordnungen aus BAM- oder Cram-Dateien sowie optional Kandidat und/oder erzwungene Allele von VCF. Es meldet alle kleinen Variantenvorhersagen im VCF 4.1 -Format. Die Keimbahnvariante berichtet verwendet die GVCF -Konventionen, um sowohl die Variante als auch die Referenzaufrufvertrauen darzustellen. Für die beste somatische Indel -Leistung ist Strelka so konzipiert, dass sie mit der Manta Structural Variante und dem Indel Caller betrieben werden soll, der zusätzliche Indel -Kandidaten bis zu einer bestimmten maximalen Indel -Größe (49 standardmäßig) bietet. Manta und Strelka werden zusammen mit Standardeinstellungen über alle Indel -Größen (insgesamt SVS und SNVs) zusammengefasst. Eine vollständige Beschreibung der Funktionen und Einschränkungen finden Sie im Benutzerhandbuch.
Um mit der Installation und Verwendung von Strelka zu beginnen, wenden Sie sich bitte an den Schnellstarthandbuch.
Nach Abschluss der Installation und Überprüfung des Schnellstarthandbuchs finden Sie im Strelka-Benutzerhandbuch für vollständige Anweisungen zum Ausführen von Strelka, Interpretation der Ergebnisse und schätzen Sie die Hardwareanforderungen/Rechenkosten zusätzlich zu einer Übersicht über Methoden auf hoher Ebene.
Der Strelka -Quellcode wird unter der GPLV3 -Lizenz bereitgestellt. Strelka enthält mehrere Pakete von Drittanbietern, die unter anderen Open -Source -Lizenzen bereitgestellt werden. Weitere Informationen finden Sie unter Copyright.txt.
Weitere Informationen zu Strelka -Code -Entwicklung und -Debuggen finden Sie im Strelka Developer Guide. Dies umfasst Details zu Strelkas Entwicklungsprotokollen, speziellen Build -Anweisungen, empfohlenen Workflows für die Untersuchung von Anrufen und interne Dokumentationsdetails.