TRGT adalah alat untuk genotipe yang ditargetkan dari pengulangan tandem dari data PACBIO HiFi. Selain genotipe ukuran dasar, komposisi urutan profil TRGT, mosaikisme, dan metilasi CpG dari masing -masing pengulangan yang dianalisis dan visualisasi bacaan yang tumpang tindih dengan pengulangan.
Harap dicatat bahwa TRGT masih dalam pengembangan aktif. Kami mengantisipasi beberapa perubahan pada format file input dan output dari TRGT.
Biner Linux TRGT tersedia di sini
File definisi berulang tersedia di repositori Zenodo ini dan definisi pengulangan patogen yang diketahui juga tersedia di sini.
Output TRGT VCF yang mengandung alel berulang dari masing -masing wilayah dalam katalog berulang. Untuk memfasilitasi analisis pengulangan di beberapa sampel, VCF dapat digabungkan menjadi VCF multi-sampel menggunakan sub-perintah merge
atau dikonversi menjadi database menggunakan alat TDB (sebelumnya disebut trgtdb). TDB menawarkan banyak keunggulan dibandingkan VCF multi-sampel, termasuk ekstraksi data yang lebih sederhana, dukungan untuk kueri, dan ukuran file yang dikurangi.
Tutorial
Tutorial Pengantar: Versi non-interaktif dan interaktif
Menafsirkan plot TRGT
Referensi
Antarmuka baris perintah
Ulangi file definisi
File VCF yang dihasilkan oleh TRGT
Jika Anda melihat ada fitur yang hilang, bug, atau memerlukan bantuan untuk menganalisis output TRGT, jangan ragu untuk menjangkau melalui email atau membuka masalah GitHub.
TRGT saat ini sedang dalam pengembangan aktif dan dimaksudkan untuk penggunaan penelitian saja dan tidak untuk digunakan dalam prosedur diagnostik. Sementara upaya telah dilakukan untuk memastikan bahwa TRGT memenuhi kualitas yang diperjuangkan Pacbio, kami tidak membuat jaminan mengenai perangkat lunak ini.
Karena TRGT tidak dicakup oleh Perjanjian Tingkat Layanan atau sejenisnya, jangan hubungi Ilmuwan Aplikasi Pacbio Field atau Layanan Pelanggan Pacbio untuk mendapatkan bantuan dengan rilis TRGT apa pun. Harap laporkan semua masalah melalui GitHub sebagai gantinya. Kami tidak membuat jaminan bahwa masalah tersebut akan ditangani, sampai batas tertentu atau dalam kerangka waktu apa pun.
Harap pertimbangkan mengutip makalah yang menggambarkan Trgt:
Dolzhenko E, Bahasa Inggris A, Dashnow H, De Sena Brandine G, Mokveld T, Rowell WJ, Karniski C, Kronenberg Z, Danzi MC, Cheung W, Bi C, Farrow E, Wenger A, Martínez-Cerdeño V, Bartley TD, Jinrow P, Nelson D, Zuchner S, Pastinen T, Quinlan AR, Sedlazeck FJ, Eberle MA. Karakterisasi dan visualisasi pengulangan tandem pada skala genom. 2024
0.3.4
Jarak label yang ditingkatkan di plot TRVZ
0.4.0
Menambahkan tutorial TRVZ
Parameter kariotipe sampel yang ditambahkan ( XX
atau XY
)
Berganti nama menjadi VCF Genotipe Field ALCI
menjadi ALLR
Membuat perubahan algoritma genotipe untuk meningkatkan akurasi
0.5.0
Genotyper sekarang menggunakan informasi tentang SNP yang berdekatan untuk mengulangi
File BAM sekarang berisi penugasan read-to-allele
Menambahkan dukungan untuk file berulang terkompresi GZIP
Penanganan kesalahan dan pesan kesalahan yang ditingkatkan
0.6.0
Tambahkan cerutu Alignment ke spanning.bam bacaan
Tingkatkan Baca Wilayah Ekstraksi
Cluster Genotyper melaporkan interval kepercayaan
Penanganan kesalahan yang ditingkatkan dari file input yang tidak valid (genome, katalog dan berbunyi)
0.7.0
Baca informasi pentahapan sekarang dapat digunakan selama genotipe berulang (melalui tag HP
)
Pengguna sekarang dapat mendefinisikan pengulangan kompleks dengan menentukan urutan motif di bidang motif dan pengaturan struc ke locus_name
Nilai MAPQ asli dalam input yang dibaca sekarang dilaporkan dalam output BAM
Nama sampel bamlet sekarang dapat disediakan menggunakan flag --sample-name
; Jika tidak disediakan, itu diekstraksi dari input BAM atau batang file (mengatasi masalah #18)
0.8.0
Perubahan Breaking : Rentang dan jumlah motif (bidang MS
dan MC
) dan penilaian kemurnian (bidang AP
) sekarang dilakukan dengan algoritma berbasis HMM untuk semua pengulangan; Harapkan beberapa perbedaan hasil relatif terhadap versi sebelumnya
Kemurnian alel alel panjang nol sekarang dilaporkan sebagai nilai yang hilang di VCFS
File output spanning.bam sekarang membawa nilai kualitas dan pemetaan untai dari input dibaca
Menambahkan --output-flank-len
yang mengontrol jumlah basis mengapit yang dilaporkan dalam file spanning.bam dan ditampilkan dalam plot TRVZ
Kecelakaan yang mungkin terjadi pada BAM di mana metilasi dipanggil dua kali telah diperbaiki
Optimisasi ke mode --genotyper=cluster
, termasuk genotip haploid dari kromosom X ketika --karyotype
diatur ke XY
0.9.0
Tambahkan dukungan untuk pengulangan polialus (dengan mengizinkan karakter N
dalam urutan motif)
Perbaiki bug yang menyebabkan TRVZ kesalahan pada pengulangan polialanin
1.0.0
Breaking Change : TRGT dan TRVZ sekarang digabungkan menjadi satu biner tunggal. Pengguna perlu menjalankan trgt genotype
dan trgt plot
untuk genotipe dan visualisasi, masing -masing.
Breaking Change : Basis padding sekarang secara otomatis ditambahkan ke semua urutan alel genotip dalam file VCF, memastikan kepatuhan yang lebih baik dengan standar VCF dan penanganan alel panjang nol.
Menambahkan Sub -perintah baru trgt validate
. Perintah ini memungkinkan validasi katalog berulang terhadap genom referensi yang diberikan dan melaporkan statistik untuk setiap entri yang salah.
Jejak memori yang lebih rendah: Manajemen memori yang lebih baik secara signifikan mengurangi penggunaan memori dengan katalog berulang yang besar.
Penanganan kesalahan yang diperbarui: Entri yang cacat sekarang dicatat sebagai kesalahan tanpa mengakhiri program.
Menambahkan opsi CLI SHORTHAND untuk menyederhanakan penggunaan perintah.
1.1.0
Menambahkan Sub -perintah baru trgt merge
. Perintah ini menggabungkan file VCF yang dihasilkan oleh trgt genotype
ke dalam file VCF bersama. Bekerja dengan VCF yang dihasilkan oleh semua versi TRGT (VCF sambungan yang dihasilkan akan selalu berada dalam format TRGT ≥V1.0.0 yang mencakup pangkalan padding).
Menambahkan subsampling daerah dengan cakupan ultra-tinggi ( >MAX_DEPTH * 3
, secara default 750); diimplementasikan melalui pengambilan sampel reservoir.
Memperbaiki bug genotyper cluster yang terjadi ketika hanya satu bacaan yang mencakup lokus.
Menambahkan logika baru untuk memfilter bacaan non-hifi: Hapus hingga 3% dari pembacaan kualitas lebih rendah yang tidak cocok dengan urutan pengulangan yang diharapkan.
1.1.1
Hotfix: Baca logika penyaringan tidak lagi menghapus bacaan tanpa tag RQ.
1.1.2
Persimpangan: Cegah genotip tanpa bacaan.
Menambahkan flag --disable-bam-output
ke trgt genotype
, memungkinkan pengguna untuk menonaktifkan pembuatan bamlet. Namun, harap dicatat bahwa bamlet masih diperlukan untuk tugas hilir seperti plot TRGT.
1.2.0
Masalah yang diselesaikan dengan menangani file tempat tidur yang dikompresi BGZIP.
Selalu mengeluarkan statistik langsung ke stdout dan stderr alih -alih mencatatnya.
Penggabungan VCF Multi-Sampel: Dukungan tambahan untuk penggabungan VCF TRGT dengan sejumlah sampel, memungkinkan pembaruan untuk set data skala populasi besar dengan sampel baru.
Pengindeksan Contig Synced: Dukungan yang diperkenalkan untuk VCFS dengan pemesanan contig yang tidak konsisten. Selain itu, bendera --contigs
baru memungkinkan menentukan daftar contig yang dipisahkan koma untuk digabungkan.
Genom referensi tidak lagi diperlukan saat menggabungkan TRGT VCF dari versi 1.0.0 atau lebih baru.
Menggabungkan sekarang melompat dan log lokus bermasalah secara default. Gunakan bendera --quit-on-errors
untuk mengakhiri kesalahan. Statistik dicatat pasca-merge, termasuk jumlah TRS yang gagal dan dilewati.
trgt merge
:
trgt validate
Perbaikan Bug:
1.3.0
Plotting Code telah direfaktor saat kami bersiap untuk mengubah visualisasi berulang
Jumlah maksimum bacaan per alel untuk plot sekarang dapat ditentukan dengan --max-allele-reads
Bugfix: Pengidentifikasi ulangi sekarang diizinkan berisi koma
1.4.0
Parameter yang sesuai untuk sekuensing yang ditargetkan sekarang dapat diatur dengan --preset targeted
Plot air terjun tidak lagi panik saat tidak ada bacaan di lokus
Perubahan algoritmik ke --genotyper cluster
memungkinkan lebih sedikit bacaan untuk ditugaskan ke alel; Ini dapat mengakibatkan perubahan kecil pada urutan konsensus dan tugas baca
Situs web ini dan konten dan semua layanan terkait situs, termasuk data apa pun, disediakan "sebagaimana adanya," dengan semua kesalahan, tanpa representasi atau jaminan dalam bentuk apa pun, baik tersurat maupun tersirat, termasuk, tetapi tidak terbatas pada, jaminan apa pun dari Dapat diperjualbelikan, kualitas yang memuaskan, non-pelanggaran atau kebugaran untuk tujuan tertentu. Anda memikul tanggung jawab dan risiko total untuk penggunaan situs ini, semua layanan terkait situs, dan situs web atau aplikasi pihak ketiga mana pun. Tidak ada informasi atau nasihat lisan atau tertulis yang akan membuat jaminan apa pun. Setiap referensi untuk produk atau layanan tertentu di situs web tidak merupakan atau menyiratkan rekomendasi atau dukungan oleh Pacific Biosciences.