Coba SeqKit di browser Anda (Tutorial dan Latihan disediakan oleh sandbox.bio)
Dokumen: http://bioinf.shenwei.me/seqkit ( Penggunaan , FAQ , Tutorial , dan Tolok Ukur )
Kode sumber: https://github.com/shenwei356/seqkit
Versi terbaru:
Silakan kutip: ,
Yang lain :
Mudah dipasang (unduh)
Menyediakan binari yang dapat dieksekusi yang terhubung secara statis untuk berbagai platform (Linux/Windows/macOS, amd64/arm64)
Ringan dan out-of-the-box, tanpa ketergantungan, tanpa kompilasi, tanpa konfigurasi
conda install -c bioconda seqkit
Mudah digunakan
Ultrafast (lihat detail teknis dan benchmark)
Mengurai format FASTA dan FASTQ dengan mulus
Mendukung ( gzip
/ xz
/ zstd
/ bzip2
terkompresi) STDIN/STDOUT dan file input/output, mudah diintegrasikan dalam pipa
Hasil yang dapat direproduksi (benih rand yang dapat dikonfigurasi dalam sample
dan shuffle
)
Mendukung ID urutan khusus melalui ekspresi reguler
Mendukung pelengkapan otomatis Bash/Zsh
Perintah serbaguna (penggunaan dan contoh)
Fungsi praktis didukung oleh 38 subperintah
Buka Halaman Unduhan untuk opsi unduhan dan log perubahan lainnya, atau instal melalui conda:
conda install -c bioconda seqkit
Kategori | Memerintah | Fungsi | Masukan | Sensitivitas untaian | Multi-utas |
---|---|---|---|---|---|
Operasi dasar | seq | Ubah urutan: ekstrak ID/seq, filter berdasarkan panjang/kualitas, hilangkan celah… | CEPAT/Q | ||
statistik | Statistik sederhana: #seqs, min/max_len, N50, Q20%, Q30%… | CEPAT/Q | ✓ | ||
selanjutnya | Dapatkan urutan selanjutnya berdasarkan wilayah/gtf/tempat tidur, termasuk urutan mengapit | CEPAT/Q | + atau/dan - | ||
geser | Ekstrak selanjutnya di jendela geser | CEPAT/Q | + saja | ||
faidx | Buat file indeks FASTA dan ekstrak selanjutnya (dengan lebih banyak fitur daripada samtools faidx) | CEPAT | + atau/dan - | ||
menerjemahkan | menerjemahkan DNA/RNA ke urutan protein | CEPAT/Q | + atau/dan - | ||
jam tangan | Pemantauan dan histogram online fitur urutan | CEPAT/Q | |||
Husy | Penggabungan dan streaming file fastx secara real-time | CEPAT/Q | ✓ | ||
Konversi format | fq2fa | Ubah format FASTQ ke FASTA | Q CEPAT | ||
fx2tab | Konversikan FASTA/Q ke format tabel | CEPAT/Q | |||
fa2fq | Ambil catatan FASTQ yang sesuai dengan file FASTA | CEPAT/Q | + saja | ||
tab2fx | Ubah format tabel menjadi format FASTA/Q | TSV | |||
mengubah | Konversi pengkodean kualitas FASTQ antara Sanger, Solexa dan Illumina | CEPAT/Q | |||
Mencari | memahami | Pencarian urutan berdasarkan ID/nama/urutan/motif urutan, ketidakcocokan diperbolehkan | CEPAT/Q | + dan - | sebagian, -m |
menemukan | Temukan urutan/motif, ketidakcocokan diperbolehkan | CEPAT/Q | + dan - | sebagian, -m | |
amplikon | Ekstrak amplikon (atau wilayah tertentu di sekitarnya), ketidakcocokan diperbolehkan | CEPAT/Q | + dan - | sebagian, -m | |
ikan | Carilah urutan pendek dalam urutan yang lebih besar | CEPAT/Q | + dan - | ||
Atur operasi | mencicipi | Urutan sampel berdasarkan nomor atau proporsi | CEPAT/Q | ||
rmdup | Hapus urutan duplikat berdasarkan ID/nama/urutan | CEPAT/Q | + dan - | ||
umum | Temukan urutan umum beberapa file berdasarkan id/nama/urutan | CEPAT/Q | + dan - | ||
duplikat | Urutan duplikat sebanyak N kali | CEPAT/Q | |||
membelah | Pisahkan urutan menjadi file berdasarkan id/seq wilayah/ukuran/bagian (terutama untuk FASTA) | FASTA lebih disukai | |||
perpecahan2 | Pisahkan urutan menjadi file berdasarkan ukuran/bagian (FASTA, PE/SE FASTQ) | CEPAT/Q | |||
kepala | Cetak catatan N FASTA/Q pertama | CEPAT/Q | |||
genom kepala | Cetak urutan genom pertama dengan awalan umum pada namanya | CEPAT/Q | |||
jangkauan | Cetak catatan FASTA/Q dalam suatu rentang (mulai:akhir) | CEPAT/Q | |||
pasangan | Memperbaiki pembacaan berpasangan dari dua file fastq | CEPAT/Q | |||
Sunting | mengganti | Ganti nama/urutan dengan ekspresi reguler | CEPAT/Q | + saja | |
ganti nama | Ganti nama ID duplikat | CEPAT/Q | |||
pertemuan | Gabungkan urutan dengan ID yang sama dari beberapa file | CEPAT/Q | + saja | ||
memulai kembali | Atur ulang posisi awal untuk genom sirkular | CEPAT/Q | + saja | ||
mengubah | Edit urutan (mutasi titik, penyisipan, penghapusan) | CEPAT/Q | + saja | ||
sana | Sanitasi file FASTQ satu baris yang rusak | Q CEPAT | |||
Pemesanan | menyortir | Urutkan urutan berdasarkan id/nama/urutan/panjang | FASTA lebih disukai | ||
acak | Urutan acak | FASTA lebih disukai | |||
Pemrosesan BAM | bam | Pemantauan dan histogram online fitur rekaman BAM | BAM | ||
Aneka ragam | jumlah | Hitung intisari pesan untuk semua urutan dalam file FASTA/Q | CEPAT/Q | ✓ | |
gabungan-slide | Gabungkan jendela geser yang dihasilkan dari geser seqkit | TSV |
Catatan:
Sensitivitas untaian:
+ only
: hanya memproses pada untai positif/maju.
+ and -
: mencari di kedua untaian.
+ or/and -
: bergantung pada tanda/opsi/argumen pengguna.
Multi-thread: Menggunakan 4 thread default cukup cepat untuk sebagian besar perintah, beberapa perintah bisa mendapatkan keuntungan dari thread tambahan.
Wei Shen*, Botond Sipos, dan Liuyang Zhao. 2024. SeqKit2: Pisau Swiss Army untuk Pemrosesan Urutan dan Penyelarasan. iMeta e191. doi:10.1002/imt2.191.
Wei Shen, Shuai Le, Yan Li*, dan Fuquan Hu*. SeqKit: toolkit lintas platform dan ultracepat untuk manipulasi file FASTA/Q. PLOS SATU . doi:10.1371/journal.pone.0163962.
Wei Shen
Botond Sipos: bam
, scat
, fish
, sana
, watch
.
yang lain
Kami berterima kasih kepada semua pengguna atas masukan dan saran mereka yang berharga. Kami berterima kasih kepada semua kontributor karena telah menyempurnakan kode dan dokumentasinya.
Kami menghargai Klaus Post atas paket fantastisnya (kompres dan pgzip) yang mempercepat pembacaan dan penulisan file gzip.
Buat masalah untuk melaporkan bug, mengusulkan fungsi baru, atau meminta bantuan.
Lisensi MIT