جرب SeqKit في متصفحك (البرامج التعليمية والتمارين المقدمة من sandbox.bio)
المستندات: http://bioinf.shenwei.me/seqkit ( الاستخدام والأسئلة الشائعة والبرامج التعليمية والمقاييس المعيارية )
كود المصدر: https://github.com/shenwei356/seqkit
أحدث نسخة:
يرجى الاقتباس:،
آحرون :
سهل التثبيت (تحميل)
توفير ثنائيات قابلة للتنفيذ مرتبطة بشكل ثابت لمنصات متعددة (Linux/Windows/macOS، amd64/arm64)
خفيف الوزن وجاهز للاستخدام، بدون تبعيات، بدون تجميع، بدون تكوين
conda install -c bioconda seqkit
سهل الاستخدام
فائق السرعة (راجع التفاصيل الفنية والمعيارية)
تحليل تنسيقات FASTA وFASTQ بسلاسة
دعم ( gzip
/ xz
/ zstd
/ bzip2
مضغوط) STDIN/STDOUT وملف الإدخال/الإخراج، مدمج بسهولة في الأنبوب
نتائج قابلة للتكرار (بذور راند قابلة للتكوين في sample
shuffle
)
دعم معرف التسلسل المخصص عبر التعبير العادي
دعم الإكمال التلقائي لـ Bash/Zsh
أوامر متعددة الاستخدامات (الاستخدامات والأمثلة)
وظائف عملية مدعومة بـ 38 أمرًا فرعيًا
انتقل إلى صفحة التنزيل لمزيد من خيارات التنزيل وسجلات التغيير، أو قم بالتثبيت عبر conda:
conda install -c bioconda seqkit
فئة | يأمر | وظيفة | مدخل | حساسية حبلا | خيوط متعددة |
---|---|---|---|---|---|
العملية الأساسية | تسلسل | تحويل التسلسلات: استخراج المعرف/التسلسل، والتصفية حسب الطول/الجودة، وإزالة الفجوات... | فاستا/س | ||
احصائيات | إحصائيات بسيطة: #seqs، min/max_len، N50، Q20%، Q30%… | فاستا/س | ✓ | ||
فرعي | الحصول على التسلسلات حسب المنطقة/gtf/السرير، بما في ذلك التسلسلات المرافقة | فاستا/س | + أو/و - | ||
انزلاق | استخراج التبعات في النوافذ المنزلقة | فاستا/س | + فقط | ||
faidx | قم بإنشاء ملف فهرس FASTA واستخرج التسلسلات الفرعية (مع ميزات أكثر من samtools faidx) | فاستا | + أو/و - | ||
يترجم | ترجمة DNA/RNA إلى تسلسل البروتين | فاستا/س | + أو/و - | ||
يشاهد | الرصد والرسوم البيانية عبر الإنترنت لميزات التسلسل | فاستا/س | |||
طرد | تسلسل في الوقت الحقيقي وتدفق ملفات fastx | فاستا/س | ✓ | ||
تحويل التنسيق | fq2fa | تحويل FASTQ إلى تنسيق FASTA | فاستق | ||
com.fx2tab | تحويل FASTA/Q إلى تنسيق جدولي | فاستا/س | |||
fa2fq | استرداد سجلات FASTQ المقابلة بواسطة ملف FASTA | فاستا/س | + فقط | ||
tab2fx | تحويل التنسيق الجدولي إلى تنسيق FASTA/Q | TSV | |||
يتحول | تحويل ترميز الجودة FASTQ بين Sanger وSolexa وIllumina | فاستا/س | |||
البحث | grep | تسلسلات البحث حسب المعرف/الاسم/التسلسل/زخارف التسلسل، مسموح بعدم التطابق | فاستا/س | + و - | جزئيا، -م |
تحديد موقع | حدد موقع التبعيات/الزخارف، يُسمح بعدم التطابق | فاستا/س | + و - | جزئيا، -م | |
amplicon | استخراج الأمبليكون (أو منطقة معينة حوله)، مسموح بعدم التطابق | فاستا/س | + و - | جزئيا، -م | |
سمكة | ابحث عن تسلسلات قصيرة في تسلسلات أكبر | فاستا/س | + و - | ||
ضبط العملية | عينة | تسلسل العينة حسب العدد أو النسبة | فاستا/س | ||
com.rmdup | إزالة التسلسلات المكررة حسب المعرف/الاسم/التسلسل | فاستا/س | + و - | ||
شائع | ابحث عن تسلسلات مشتركة لملفات متعددة حسب المعرف/الاسم/التسلسل | فاستا/س | + و - | ||
ينسخ | تسلسلات مكررة N مرات | فاستا/س | |||
ينقسم | تقسيم التسلسلات إلى ملفات حسب منطقة المعرف/التسلسل/الحجم/الأجزاء (أساسًا لـ FASTA) | فضل فاستا | |||
سبليت2 | تقسيم التسلسلات إلى ملفات حسب الحجم/الأجزاء (FASTA، PE/SE FASTQ) | فاستا/س | |||
رأس | اطبع سجلات N FASTA/Q الأولى | فاستا/س | |||
جينوم الرأس | طباعة تسلسل الجينوم الأول مع البادئات المشتركة في الاسم | فاستا/س | |||
يتراوح | طباعة سجلات FASTA/Q في نطاق (البداية: النهاية) | فاستا/س | |||
زوج | تصحيح القراءة المزدوجة من ملفين fastq | فاستا/س | |||
يحرر | يستبدل | استبدل الاسم/التسلسل بالتعبير العادي | فاستا/س | + فقط | |
إعادة تسمية | إعادة تسمية المعرفات المكررة | فاستا/س | |||
com.concat | قم بتسلسل التسلسلات بنفس المعرف من ملفات متعددة | فاستا/س | + فقط | ||
إعادة تشغيل | إعادة ضبط موضع البداية للجينوم الدائري | فاستا/س | + فقط | ||
تحور | تحرير التسلسل (طفرة النقطة، الإدراج، الحذف) | فاستا/س | + فقط | ||
صنعاء | تعقيم ملفات FASTQ ذات السطر الواحد المكسورة | فاستق | |||
الطلب | نوع | فرز التسلسلات حسب المعرف/الاسم/التسلسل/الطول | فضل فاستا | ||
خلط | تسلسل خلط ورق اللعب | فضل فاستا | |||
معالجة بام | بام | المراقبة والرسوم البيانية عبر الإنترنت لميزات سجل BAM | بام | ||
متنوع | مجموع | حساب ملخص الرسالة لجميع التسلسلات في ملفات FASTA/Q | فاستا/س | ✓ | |
دمج الشرائح | دمج النوافذ المنزلقة الناتجة عن انزلاق seqkit | TSV |
ملحوظات:
حساسية حبلا:
+ only
: المعالجة فقط على الشريط الموجب/الأمامي.
+ and -
: البحث في كلا الفرعين.
+ or/and -
: يعتمد على إشارات/خيارات/وسائط المستخدمين.
خيوط متعددة: يعد استخدام الخيوط الأربعة الافتراضية سريعًا بما يكفي لمعظم الأوامر، ويمكن لبعض الأوامر الاستفادة من الخيوط الإضافية.
وي شين*، وبوتوند سيبوس، وليويانغ تشاو. 2024. SeqKit2: سكين الجيش السويسري لمعالجة التسلسل والمحاذاة. اي ميتا e191. دوى:10.1002/imt2.191.
وي شين، وشواي لو، ويان لي*، وفوكوان هو*. SeqKit: مجموعة أدوات متعددة المنصات وفائقة السرعة لمعالجة ملفات FASTA/Q. بلوس واحد . دوى:10.1371/journal.pone.0163962.
وي شين
بوتوند سيبوس : bam
، scat
، fish
، sana
، watch
.
آحرون
ونحن نشكر جميع المستخدمين على ملاحظاتهم واقتراحاتهم القيمة. نشكر جميع المساهمين على تحسين التعليمات البرمجية والوثائق.
نحن نقدر كلاوس بوست لحزمه الرائعة (الضغط وpgzip) التي تعمل على تسريع قراءة وكتابة ملفات gzip.
أنشئ مشكلة للإبلاغ عن الأخطاء أو اقتراح وظائف جديدة أو طلب المساعدة.
رخصة معهد ماساتشوستس للتكنولوجيا