(c) 2017 Timothy Becker & Wan-Ping Lee
SVE adalah mesin eksekusi berbasis skrip python untuk deteksi Variasi Struktural (SV) dan dapat digunakan untuk semua tingkat input data, FASTQ mentah, BAM yang selaras, atau format panggilan varian (VCF), dan menghasilkan VCF terpadu sebagai outputnya. Secara desain, SVE terdiri dari penyelarasan, penataan kembali, dan ansambel algoritme pemanggilan SV yang canggih secara default. Mereka adalah BreakDancer, BreakSeq, cnMOPS, CNVnator, DELLY, Hydra dan LUMPY. FusorSV juga tertanam yang merupakan pendekatan penambangan data untuk menilai kinerja dan menggabungkan kumpulan panggilan dari ansambel algoritma pemanggilan SV.
Silakan atur lingkungan ROOT.
export ROOTSYS=/ROOT_Build_Path
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$ROOTSYS/lib
git clone --recursive https://github.com/TheJacksonLaboratory/SVE.git
cd SVE
make
Silakan periksa file header python2.7 dan ubah "CFLAGS_FUSOR_SV" di Makefile. File header mungkin berada di "/usr/include/python2.7" dan menggunakan "CFLAGS_FUSOR_SV=-I /usr/include/python2.7" sebagai gantinya.
make FusorSV
Atau, Anda dapat menginstal FusorSV dengan setup.py
cd SVE/scripts/FusorSV/
python setup.py build_ext --inplace
tar -zxvf data.tar.gz
Alternatifnya, Dockerfile dan image Docker disediakan. Harap perhatikan bahwa sudo mungkin diperlukan untuk penggunaan buruh pelabuhan tergantung pada pengaturan mesin Anda.
cd SVE
docker build .
Tarik gambar buruh pelabuhan dari repositori.
docker pull wanpinglee/sve
SVE dibangun di /tools/SVE. Periksa bantuannya
/tools/SVE/bin/sve
Bacaan singkat di FASTQ akan dipetakan terhadap FASTA yang diberikan dan BAM yang diurutkan akan dihasilkan.
bin/sve align [options] -r <FASTA> <FASTQ1 [FASTQ2]>
Jika pembacaan diberikan dalam format BAM, penyelarasan ulang akan memetakan ulang pembacaan terhadap FASTA dan menghasilkan BAM yang diurutkan. Kami menggunakan SpeedSeq untuk mencapai penyelarasan kembali.
bin/sve realign -r <FASTA> <BAM>
Ada tujuh algoritma pemanggilan SV yang dapat digunakan untuk pemanggilan SV. VCF akan dihasilkan.
bin/sve call -r <FASTA> -g <hg19|hg38|others> -a <breakdancer|breakseq|cnvnator|hydra|delly|lumpy|cnmops> <BAM [BAM ...]>
Setelah panggilan, setiap sampel mungkin memiliki beberapa VCF tergantung pada berapa banyak penelepon yang digunakan. Silakan kumpulkan VCF sampel dalam sebuah folder.
Vcfs harus menggunakan ID SVE untuk menunjukkan penelepon.
ID SVE | Penelepon |
---|---|
4 | Penari Istirahat (v1.4.5) |
9 | cn.MOPS (v1.20) |
10 | CNVnator (v0.3.3) |
11 | DELLY (v2) |
14* | GenomSTRiP |
17 | Ular naga |
18 | KENTAL |
35 | BreakSeq (v2.2) |
0 | Kebenaran (opsional) |
Catatan*: Karena masalah lisensi, GenomeSTRiP tidak tertanam di SVE. Namun, model default FusorSV mampu menangani GenomeSTRiP VCF.
Contoh input file vcf dapat disusun sebagai berikut. Harap dicatat bahwa vcfFiles adalah argumen untuk -i untuk FusorSV.
python scripts/FusorSV/FusorSV.py -f scripts/FusorSV/data/models/default.pickle -L DEFAULT -r <FASTA> -i <vcfFiles>/ -p <THREADS> -o <OUT_DIR>
Menurut S0.vcf, model baru akan dihasilkan dan VCF akan digabungkan dengan model baru.
python scripts/FusorSV/FusorSV.py -L DEFAULT -r <FASTA> -i <vcfFiles>/ -p <THREADS> -o <OUT_DIR>
Proyek ini dilisensikan di bawah Lisensi GPL-3.0. Silakan lihat LISENSI untuk detailnya.