Strelka2 adalah penelepon varian kecil yang cepat dan akurat yang dioptimalkan untuk analisis variasi germline dalam kelompok kecil dan variasi somatik pada pasangan sampel tumor/normal. Penelepon germline menggunakan model haplotype berjenjang yang efisien untuk meningkatkan akurasi dan memberikan pentahapan yang didukung baca, memilih secara adaptif antara perakitan dan pendekatan haplotyping berbasis penyelarasan yang lebih cepat di setiap lokus varian. Penelepon germline juga menganalisis data pengurutan input menggunakan metode estimasi kesalahan model campuran-model untuk meningkatkan ketahanan terhadap noise indel. Model panggilan somatik meningkat pada metode Strelka asli untuk analisis tumor cairan dan tahap akhir dengan memperhitungkan kemungkinan kontaminasi sel tumor dalam sampel normal. Langkah skor ulang varian empiris akhir menggunakan model hutan acak yang dilatih pada berbagai fitur kualitas panggilan telah ditambahkan ke kedua penelepon untuk lebih meningkatkan presisi.
Dibandingkan dengan pengajuan untuk konsistensi PrecisionFDA terbaru dan tantangan kebenaran, rata-rata Indel F-Score untuk Strelka2 berjalan dalam konfigurasi defaultnya adalah 3,1% dan 0,08% lebih tinggi, masing-masing, daripada pengiriman tantangan terbaik. Runtime pada server 28-core adalah ~ 40 menit untuk analisis germline 40x WGS dan ~ 3 jam untuk analisis somatik tumor-normal 110x/40x WGS. Rincian lebih lanjut tentang metode Strelka2 dan pembandingan untuk germline dan panggilan somatik dijelaskan dalam:
Kim, S., Scheffler, K. et al. (2018) Strelka2: Panggilan cepat dan akurat dari germline dan varian somatik. Metode Alam , 15, 591-594. doi: 10.1038/s41592-018-0051-x
... dan pra-cetak akses terbuka yang sesuai
Strelka menerima pemetaan baca input dari file BAM atau Cram, dan kandidat opsional dan/atau alel panggilan paksa dari VCF. Ini melaporkan semua prediksi varian kecil dalam format VCF 4.1. Pelaporan varian germline menggunakan konvensi GVCF untuk mewakili varian dan kepercayaan panggilan referensi. Untuk kinerja indel somatik terbaik, Strelka dirancang untuk dijalankan dengan varian struktural manta dan penelepon indel, yang menyediakan kandidat indel tambahan hingga ukuran indel maksimum yang diberikan (49 secara default). Dengan desain, manta dan strelka berjalan bersama dengan pengaturan default memberikan cakupan lengkap pada semua ukuran indel (tambahan untuk SV dan SNV). Lihat Panduan Pengguna untuk deskripsi lengkap kemampuan dan keterbatasan.
Untuk mulai menginstal dan menggunakan Strelka, silakan berkonsultasi dengan Panduan Mulai Cepat.
Setelah menyelesaikan instalasi dan meninjau Panduan Mulai Cepat, lihat Panduan Pengguna Strelka untuk instruksi lengkap tentang cara menjalankan Strelka, menafsirkan hasil dan memperkirakan persyaratan perangkat keras/biaya komputasi, di samping tinjauan metode tingkat tinggi.
Kode Sumber Strelka disediakan di bawah lisensi GPLV3. Strelka mencakup beberapa paket pihak ketiga yang disediakan di bawah lisensi open source lainnya, silakan lihat Copyright.txt untuk detail tambahan.
Untuk detail pengembangan kode Strelka dan debugging, lihat Panduan Pengembang Strelka. Ini termasuk detail tentang protokol pengembangan Strelka, instruksi pembuatan khusus, alur kerja yang disarankan untuk menyelidiki panggilan, dan detail dokumentasi internal.