Strelka2は、小さなコホートの生殖細胞変動と腫瘍/正常サンプルペアの体細胞変動の分析のために最適化された高速で正確な小さなバリアント発信者です。 Germline Callerは、効率的な階層型ハプロタイプモデルを採用して精度を向上させ、読み取り担保フェージングを提供し、アセンブリと各バリアント遺伝子座でのより速いアライメントベースのハプロタイプアプローチを選択します。生殖系呼び出し元は、混合モデルのインデルエラー推定方法を使用して入力シーケンスデータを分析し、インデルノイズへの堅牢性を改善します。体性呼び出しモデルは、通常のサンプルでの腫瘍細胞汚染の可能性を考慮して、液体および後期腫瘍分析のための元のStrelka法を改善します。さまざまなコール品質機能でトレーニングされたランダムフォレストモデルを使用した最終的な経験的バリアント再スコアステップが両方の発信者に追加され、精度がさらに向上しました。
最近のPrecisionFDAの一貫性と真実の課題への提出と比較して、デフォルト構成で実行されているStrelka2の平均インデルFスコアは、最良の課題の提出よりもそれぞれ3.1%および0.08%高くなっています。 28コアサーバーのランタイムは、40倍のWGS生殖系分析で約40分、110x/40x WGS腫瘍正規分析で〜3時間です。 strelka2メソッドの詳細と、生殖細胞系と体細胞の呼び出しの両方のベンチマークについては、次のように説明します。
キム、S。、シェフラー、 K。etal。 (2018)Strelka2:生殖系および体細胞変異体の迅速かつ正確な呼び出し。自然方法、15、591-594。 doi:10.1038/s41592-018-0051-x
...そして、対応するオープンアクセスのプリプリント
Strelkaは、BAMまたはCRAMファイルからの入力読み取りマッピング、およびオプションでVCFからの候補および/または強制コール対立遺伝子を受け入れます。 VCF 4.1形式のすべての小さなバリアント予測を報告します。 Germlineバリアントレポートは、GVCF規則を使用して、バリアントと参照コールの両方の信頼性を表します。最高の体細胞インデルのパフォーマンスのために、StrelkaはManta Structural VariantおよびIndel Callerで実行されるように設計されており、インデル候補を特定の最大インデルサイズ(デフォルトで49)まで追加する追加のインデル候補を提供します。設計上、MantaとStrelkaはデフォルト設定と一緒に実行され、すべてのIndelサイズ(SVSおよびSNVに追加)にわたって完全なカバレッジを提供します。機能と制限の完全な説明については、ユーザーガイドを参照してください。
Strelkaのインストールと使用を開始するには、クイックスタートガイドを参照してください。
インストールを完了してクイックスタートガイドを確認した後、Strelkaユーザーガイドを参照して、Strelkaを実行し、結果を解釈し、ハードウェアの要件/計算コストを推定する方法について、高レベルのメソッドの概要を参照してください。
Strelkaソースコードは、GPLV3ライセンスの下で提供されます。 Strelkaには、他のオープンソースライセンスの下で提供されるいくつかのサードパーティパッケージが含まれています。詳細については、copyright.txtをご覧ください。
Strelkaコードの開発とデバッグの詳細については、Strelka開発者ガイドを参照してください。これには、Strelkaの開発プロトコルの詳細、特別なビルド手順、コールを調査するための推奨ワークフロー、および内部ドキュメントの詳細が含まれます。