(c) 2017 ティモシー・ベッカー & ワンピン・リー
SVE は、構造変動 (SV) 検出用の Python スクリプト ベースの実行エンジンであり、あらゆるレベルのデータ入力、生の FASTQ、整列された BAM、またはバリアント コール フォーマット (VCF) に使用でき、出力として統合 VCF を生成します。設計上、SVE はデフォルトで、アライメント、再アライメント、および最先端の SV 呼び出しアルゴリズムのアンサンブルで構成されています。それらは、BreakDancer、BreakSeq、cnMOPS、CNVnator、DELLY、Hydra、LUMPY です。 FusorSV も組み込まれており、パフォーマンスを評価し、SV 呼び出しアルゴリズムのアンサンブルからコールセットをマージするためのデータ マイニング アプローチです。
ROOT環境を設定してください。
export ROOTSYS=/ROOT_Build_Path
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$ROOTSYS/lib
git clone --recursive https://github.com/TheJacksonLaboratory/SVE.git
cd SVE
make
Python2.7のヘッダファイルを確認し、Makefileの「CFLAGS_FUSOR_SV」を修正してください。ヘッダー ファイルは「/usr/include/python2.7」にあり、代わりに「CFLAGS_FUSOR_SV=-I /usr/include/python2.7」を使用する場合があります。
make FusorSV
または、setup.py で FusorSV をインストールすることもできます
cd SVE/scripts/FusorSV/
python setup.py build_ext --inplace
tar -zxvf data.tar.gz
代わりに、Dockerfile と Docker イメージが提供されます。マシンの設定によっては、Docker を使用するために sudo が必要になる場合があることに注意してください。
cd SVE
docker build .
リポジトリから Docker イメージをプルします。
docker pull wanpinglee/sve
SVE は /tools/SVE 上に構築されます。ヘルプを確認するには、
/tools/SVE/bin/sve
FASTQ の短い読み取りは、指定された FASTA に対してマッピングされ、ソートされた BAM が生成されます。
bin/sve align [options] -r <FASTA> <FASTQ1 [FASTQ2]>
読み取りが BAM 形式で指定されている場合、realign は FASTA に対して読み取りを再マップし、ソートされた BAM を生成します。 SpeedSeq を使用して再調整を実現します。
bin/sve realign -r <FASTA> <BAM>
SV 呼び出しに使用できる SV 呼び出しアルゴリズムは 7 つあります。 VCFが生成されます。
bin/sve call -r <FASTA> -g <hg19|hg38|others> -a <breakdancer|breakseq|cnvnator|hydra|delly|lumpy|cnmops> <BAM [BAM ...]>
呼び出し後、使用した呼び出し元の数に応じて、各サンプルに複数の VCF が含まれる場合があります。サンプルのVCFをフォルダーに集めてください。
vcf は SVE ID を使用して呼び出し元を示す必要があります。
SVE ID | 発信者 |
---|---|
4 | ブレイクダンサー (v1.4.5) |
9 | cn.MOPS (v1.20) |
10 | CNVnator (v0.3.3) |
11 | デリー (v2) |
14* | ゲノムSTRiP |
17 | ヒドラ |
18 | ゴツゴツした |
35 | ブレークシーク (v2.2) |
0 | 真実 (オプション) |
注*: ライセンスの問題により、GenomeSTRiP は SVE に組み込まれていません。ただし、FusorSV のデフォルト モデルは GenomeSTRiP VCF を処理できます。
入力 vcf ファイルの例は次のように編成できます。 vcfFiles は FusorSV の -i の引数であることに注意してください。
python scripts/FusorSV/FusorSV.py -f scripts/FusorSV/data/models/default.pickle -L DEFAULT -r <FASTA> -i <vcfFiles>/ -p <THREADS> -o <OUT_DIR>
S0.vcf によると、新しいモデルが生成され、VCF は新しいモデルによってマージされます。
python scripts/FusorSV/FusorSV.py -L DEFAULT -r <FASTA> -i <vcfFiles>/ -p <THREADS> -o <OUT_DIR>
このプロジェクトは GPL-3.0 ライセンスに基づいてライセンスされています。詳細についてはライセンスを参照してください。