smoove
menyederhanakan dan mempercepat pemanggilan dan genotipe SV untuk pembacaan singkat. Hal ini juga meningkatkan spesifisitas dengan menghilangkan banyak sinyal penyelarasan palsu yang menunjukkan kebisingan tingkat rendah dan sering kali berkontribusi pada panggilan palsu.
Ada postingan blog yang menjelaskan smoove
lebih detail di sini
Keduanya mendukung kelompok kecil dalam satu perintah, dan panggilan tingkat populasi dengan total 4 langkah, 2 di antaranya paralel berdasarkan sampel.
Ada tabel tentang presisi dan perolehan smoove dan duphold (yang digunakan oleh smoove) di sini
Itu membutuhkan:
Dan secara opsional (tetapi semuanya sangat disarankan):
Menjalankan smoove
tanpa argumen apa pun akan menunjukkan mana yang ditemukan sehingga dapat ditambahkan ke PATH sesuai kebutuhan.
keinginan smoove
:
lumpy_filter
untuk mengekstrak pembacaan terpisah dan sumbang yang diperlukan oleh lumpylumpy_filter
untuk menghapus cakupan tinggi, wilayah palsu, dan chrom yang ditentukan pengguna seperti 'hs37d5'; itu juga akan menghapus pembacaan yang kami temukan kemungkinan merupakan sinyal palsu. setelah ini, ini akan menghapus pembacaan tunggal (yang pasangannya telah dihapus oleh salah satu filter sebelumnya) dari bams sumbang. Hal ini membuat lumpy
lebih cepat dan tidak terlalu memakan memori. Anda bisa mendapatkan smoove
dan semua dependensi melalui gambar buruh pelabuhan (besar):
docker pull brentp/smoove
docker run -it brentp/smoove smoove -h
Atau, Anda dapat mengunduh biner smoove
dari sini: https://github.com/brentp/smoove/releases Ketika dijalankan tanpa argumen apa pun, smoove
akan menunjukkan kepada Anda dependensi mana yang dapat ditemukan sehingga Anda dapat menyesuaikan $PATH dan menginstal demikian.
untuk kelompok kecil, dimungkinkan untuk mendapatkan VCF genotipe yang disebut bersama dalam satu perintah .
smoove call -x --name my-cohort --exclude $bed --fasta $reference_fasta -p $threads --genotype /path/to/*.bam
keluaran akan menuju ke ./my-cohort-smoove.genotyped.vcf.gz
--exclude $bed
sangat disarankan karena dapat digunakan untuk mengabaikan pembacaan yang tumpang tindih dengan wilayah bermasalah.
Kumpulan wilayah yang bagus untuk GRCh37 ada di sini.
Dan untuk hg38 di sini
Untuk pemanggilan di tingkat populasi (kelompok besar) langkah-langkahnya adalah:
smoove call --outdir results-smoove/ --exclude $bed --name $sample --fasta $reference_fasta -p 1 --genotype /path/to/$sample.bam
Untuk kelompok besar, lebih baik memparalelkan seluruh sampel daripada menggunakan $threads per sampel yang besar. smoove
hanya dapat memparalelkan hingga 2 atau 3 thread pada satu sampel dan paling efisien menggunakan 1 thread.
keluaran akan menuju ke `results-smoove/$sample-smoove.genotyped.vcf.gz``
# this will create ./merged.sites.vcf.gz
smoove merge --name merged -f $reference_fasta --outdir ./ results-smoove/*.genotyped.vcf.gz
smoove genotype -d -x -p 1 --name $sample-joint --outdir results-genotped/ --fasta $reference_fasta --vcf merged.sites.vcf.gz /path/to/$sample.$bam
smoove paste --name $cohort results-genotyped/*.vcf.gz
smoove annotate --gff Homo_sapiens.GRCh37.82.gff3.gz $cohort.smoove.square.vcf.gz | bgzip -c > $cohort.smoove.square.anno.vcf.gz
Ini menambahkan tag SHQ
(Smoove Het Quality) ke setiap format sampel) nilai 4 adalah panggilan berkualitas tinggi dan nilai 1 adalah kualitas rendah. -1 bukan-het. Ini juga menambahkan MSHQ
untuk Mean SHQ ke bidang INFO yang merupakan skor rata-rata SHQ di semua sampel heterozigot untuk varian tersebut.
Sebagai langkah pertama, pengguna dapat mencari varian dengan MSHQ > 3. Jika Anda menambahkan anotasi duphold, ada baiknya juga memeriksa penghapusan dengan DHFFC < 0.7
dan duplikasi dengan DHFFC > 1.25
.
Kepanikan dengan pesan seperti Segmentation fault (core dumped) | bcftools view -O z -c 1 -o
kemungkinan berarti Anda memiliki bcftools versi lama. lihat #10
smoove
akan menulis ke sistem TMPDIR. Untuk kelompok besar, pastikan untuk mengatur ini pada sesuatu yang memiliki banyak ruang. misalnya export TMPDIR=/path/to/big
smoove
memerlukan versi terbaru dari lumpy
dan lumpy_filter
jadi buatlah dari sumber atau dapatkan versi bioconda terbaru.
alat sv