ลองใช้ SeqKit ในเบราว์เซอร์ของคุณ (บทช่วยสอนและแบบฝึกหัดจาก sandbox.bio)
เอกสาร: http://bioinf.shenwei.me/seqkit ( การใช้งาน , คำถามที่พบบ่อย , บทช่วยสอน และ เกณฑ์มาตรฐาน )
ซอร์สโค้ด: https://github.com/shenwei356/seqkit
เวอร์ชันล่าสุด:
กรุณาอ้างอิง: ,
คนอื่น :
ติดตั้งง่าย (ดาวน์โหลด)
จัดเตรียมไบนารีปฏิบัติการที่เชื่อมโยงแบบคงที่สำหรับหลายแพลตฟอร์ม (Linux/Windows/macOS, amd64/arm64)
น้ำหนักเบาและใช้งานได้ทันที ไม่ต้องพึ่งพา ไม่ต้องคอมไพล์ ไม่มีการกำหนดค่า
conda install -c bioconda seqkit
ใช้งานง่าย
เร็วมาก (ดูรายละเอียดทางเทคนิคและเกณฑ์มาตรฐาน)
แยกวิเคราะห์ทั้งรูปแบบ FASTA และ FASTQ ได้อย่างราบรื่น
รองรับ (บีบอัด gzip
/ xz
/ zstd
/ bzip2
) STDIN/STDOUT และไฟล์อินพุต/เอาท์พุต รวมเข้ากับไพพ์ได้อย่างง่ายดาย
ผลลัพธ์ที่ทำซ้ำได้ (เมล็ดแรนด์ที่กำหนดค่าได้ใน sample
และ shuffle
)
รองรับ ID ลำดับที่กำหนดเองผ่านนิพจน์ทั่วไป
รองรับการเติมข้อความอัตโนมัติ Bash/Zsh
คำสั่งอเนกประสงค์ (การใช้งานและตัวอย่าง)
ฟังก์ชั่นการใช้งานจริงที่รองรับโดยคำสั่งย่อย 38 คำสั่ง
ไปที่หน้าดาวน์โหลดเพื่อดูตัวเลือกการดาวน์โหลดและบันทึกการเปลี่ยนแปลงเพิ่มเติม หรือติดตั้งผ่าน conda:
conda install -c bioconda seqkit
หมวดหมู่ | สั่งการ | การทำงาน | ป้อนข้อมูล | ความไวของเกลียว | มัลติเธรด |
---|---|---|---|---|---|
การดำเนินงานขั้นพื้นฐาน | ลำดับ | ลำดับการแปลง: แยก ID/seq, กรองตามความยาว/คุณภาพ, ลบช่องว่าง... | ฟาสต้า/คิว | ||
สถิติ | สถิติอย่างง่าย: #seqs, min/max_len, N50, Q20%, Q30%… | ฟาสต้า/คิว | |||
ภาคต่อ | รับลำดับย่อยตามภูมิภาค/gtf/bed รวมถึงลำดับขนาบข้าง | ฟาสต้า/คิว | + หรือ/และ - | ||
เลื่อน | แยกลำดับย่อยในหน้าต่างบานเลื่อน | ฟาสต้า/คิว | + เท่านั้น | ||
ไฟด์x | สร้างไฟล์ดัชนี FASTA และแยกลำดับย่อย (พร้อมคุณสมบัติมากกว่า samtools faidx) | ฟาสต้า | + หรือ/และ - | ||
แปล | แปล DNA/RNA เป็นลำดับโปรตีน | ฟาสต้า/คิว | + หรือ/และ - | ||
ดู | การตรวจสอบและฮิสโตแกรมออนไลน์ของคุณสมบัติลำดับ | ฟาสต้า/คิว | |||
ซิ | การต่อข้อมูลแบบเรียลไทม์และการสตรีมไฟล์ fastx | ฟาสต้า/คิว | |||
การแปลงรูปแบบ | fq2fa | แปลง FASTQ เป็นรูปแบบ FASTA | ฟาสต์คิว | ||
fx2tab | แปลง FASTA/Q เป็นรูปแบบตาราง | ฟาสต้า/คิว | |||
fa2fq | ดึงข้อมูลบันทึก FASTQ ที่เกี่ยวข้องด้วยไฟล์ FASTA | ฟาสต้า/คิว | + เท่านั้น | ||
tab2fx | แปลงรูปแบบตารางเป็นรูปแบบ FASTA/Q | ทีเอสวี | |||
แปลง | แปลงการเข้ารหัสคุณภาพ FASTQ ระหว่าง Sanger, Solexa และ Illumina | ฟาสต้า/คิว | |||
กำลังค้นหา | เกรป | ค้นหาลำดับตามรหัส/ชื่อ/ลำดับ/แม่ลายของลำดับ อนุญาตให้ไม่ตรงกันได้ | ฟาสต้า/คิว | + และ - | บางส่วน -ม |
ค้นหา | ค้นหาลำดับย่อย/แม่ลาย อนุญาตให้ไม่ตรงกันได้ | ฟาสต้า/คิว | + และ - | บางส่วน -ม | |
เครื่องขยายเสียง | แยกเครื่องขยายเสียง (หรือบริเวณเฉพาะรอบๆ) อนุญาตให้ไม่ตรงกันได้ | ฟาสต้า/คิว | + และ - | บางส่วน -ม | |
ปลา | มองหาลำดับสั้นๆ ในลำดับที่ใหญ่กว่า | ฟาสต้า/คิว | + และ - | ||
ตั้งค่าการทำงาน | ตัวอย่าง | ลำดับตัวอย่างตามจำนวนหรือสัดส่วน | ฟาสต้า/คิว | ||
rmdup | ลบลำดับที่ซ้ำกันด้วย ID/ชื่อ/ลำดับ | ฟาสต้า/คิว | + และ - | ||
ทั่วไป | ค้นหาลำดับทั่วไปของไฟล์หลายไฟล์ด้วยรหัส/ชื่อ/ลำดับ | ฟาสต้า/คิว | + และ - | ||
ทำซ้ำ | ลำดับที่ซ้ำกัน N ครั้ง | ฟาสต้า/คิว | |||
แยก | แยกลำดับออกเป็นไฟล์ตามภูมิภาค id/seq/ขนาด/ส่วน (สำหรับ FASTA เป็นหลัก) | ฟาสต้าเสนอแนะ | |||
แยก2 | แบ่งลำดับเป็นไฟล์ตามขนาด/ส่วน (FASTA, PE/SE FASTQ) | ฟาสต้า/คิว | |||
ศีรษะ | พิมพ์บันทึก N FASTA/Q แผ่นแรก | ฟาสต้า/คิว | |||
เฮดจีโนม | พิมพ์ลำดับของจีโนมแรกที่มีคำนำหน้าเหมือนกันในชื่อ | ฟาสต้า/คิว | |||
พิสัย | พิมพ์บันทึก FASTA/Q ในช่วง (เริ่มต้น: สิ้นสุด) | ฟาสต้า/คิว | |||
คู่ | แก้ไขการอ่านแบบปลายคู่จากไฟล์ fastq สองไฟล์ | ฟาสต้า/คิว | |||
แก้ไข | แทนที่ | แทนที่ชื่อ/ลำดับด้วยนิพจน์ทั่วไป | ฟาสต้า/คิว | + เท่านั้น | |
เปลี่ยนชื่อ | เปลี่ยนชื่อ ID ที่ซ้ำกัน | ฟาสต้า/คิว | |||
เชื่อมต่อ | เชื่อมต่อลำดับด้วย ID เดียวกันจากหลายไฟล์ | ฟาสต้า/คิว | + เท่านั้น | ||
รีสตาร์ท | รีเซ็ตตำแหน่งเริ่มต้นสำหรับจีโนมแบบวงกลม | ฟาสต้า/คิว | + เท่านั้น | ||
กลายพันธุ์ | แก้ไขลำดับ (การกลายพันธุ์ของจุด การแทรก การลบ) | ฟาสต้า/คิว | + เท่านั้น | ||
ซานะ | ฆ่าเชื้อไฟล์ FASTQ บรรทัดเดียวที่เสียหาย | ฟาสต์คิว | |||
การสั่งซื้อ | เรียงลำดับ | เรียงลำดับตามรหัส/ชื่อ/ลำดับ/ความยาว | ฟาสต้าเสนอแนะ | ||
สุ่ม | ลำดับสุ่ม | ฟาสต้าเสนอแนะ | |||
การประมวลผล BAM | แบม | การตรวจสอบและฮิสโตแกรมออนไลน์ของคุณสมบัติบันทึก BAM | แบม | ||
เบ็ดเตล็ด | ผลรวม | คำนวณการแยกย่อยข้อความสำหรับลำดับทั้งหมดในไฟล์ FASTA/Q | ฟาสต้า/คิว | ||
รวมสไลด์ | รวมหน้าต่างบานเลื่อนที่สร้างจากการเลื่อน seqkit | ทีเอสวี |
หมายเหตุ:
ความไวของเกลียว:
+ only
: การประมวลผลเฉพาะบนเส้นบวก/ไปข้างหน้าเท่านั้น
+ and -
: ค้นหาทั้งสองเส้น
+ or/and -
: ขึ้นอยู่กับการตั้งค่าสถานะ/ตัวเลือก/ข้อโต้แย้งของผู้ใช้
หลายเธรด: การใช้ค่าเริ่มต้น 4 เธรดนั้นเร็วเพียงพอสำหรับคำสั่งส่วนใหญ่ บางคำสั่งอาจได้รับประโยชน์จากเธรดเพิ่มเติม
Wei Shen*, Botond Sipos และ Liuyang Zhao 2024 SeqKit2: Swiss Army Knife สำหรับการประมวลผลลำดับและการจัดตำแหน่ง iMeta e191. ดอย:10.1002/imt2.191.
Wei Shen, Shuai Le, Yan Li* และ Fuquan Hu* SeqKit: ชุดเครื่องมือข้ามแพลตฟอร์มและรวดเร็วมากสำหรับการจัดการไฟล์ FASTA/Q กรุณาหนึ่ง ดอย:10.1371/journal.pone.0163962.
เว่ยเซิน
Botond Sipos: bam
, scat
, fish
, sana
, watch
.
คนอื่น
เราขอขอบคุณผู้ใช้ทุกคนสำหรับข้อเสนอแนะและข้อเสนอแนะอันมีค่าของพวกเขา เราขอขอบคุณผู้มีส่วนร่วมทุกท่านในการปรับปรุงโค้ดและเอกสารประกอบ
เราขอขอบคุณ Klaus Post สำหรับแพ็คเกจที่ยอดเยี่ยมของเขา ( compress และ pgzip ) ซึ่งช่วยเร่งการอ่านและเขียนไฟล์ gzip
สร้างปัญหาเพื่อรายงานข้อบกพร่อง เสนอฟังก์ชันใหม่ หรือขอความช่วยเหลือ
ใบอนุญาตเอ็มไอที