nf-core/cageseq هو خط أنابيب لتحليل المعلوماتية الحيوية يستخدم لبيانات تسلسل CAGE-seq.
يأخذ خط الأنابيب ملفات fastq الخام المزيل تعدد الإرسال كمدخلات ويتضمن خطوات لتشذيب الوصلات والمصنوعات اليدوية (cutadapt)، وإزالة الرنا الريباسي (SortMeRNA، والمحاذاة مع الجينوم المرجعي (STAR أو ربطة العنق 1) وعد علامات CAGE وتجميعها (paraclu). بالإضافة إلى ذلك، العديد من يتم تضمين خطوات مراقبة الجودة (FastQC، RSeQC، MultiQC) للسماح بالتحقق السهل من النتائج بعد التشغيل.
تم إنشاء المسار باستخدام Nextflow، وهي أداة سير عمل لتشغيل المهام عبر بنيات أساسية متعددة للحوسبة بطريقة محمولة للغاية. لأنه يأتي مع حاويات عامل الإرساء مما يجعل عملية التثبيت تافهة والنتائج قابلة للتكرار بدرجة كبيرة.
قم بتثبيت nextflow
قم بتثبيت أي من Docker
أو Singularity
أو Podman
لإمكانية تكرار خط الأنابيب بالكامل (يُرجى استخدام Conda
فقط كحل أخير؛ راجع المستندات)
قم بتنزيل المسار واختباره على مجموعة بيانات صغيرة باستخدام أمر واحد:
nextflow run nf-core/cageseq -profile test, < docker/singularity/podman/conda/institute >
يرجى التحقق من nf-core/configs لمعرفة ما إذا كان هناك ملف تكوين مخصص لتشغيل خطوط أنابيب nf-core موجود بالفعل في معهدك. إذا كان الأمر كذلك، يمكنك ببساطة استخدام
-profile
في الأمر الخاص بك. سيؤدي هذا إلى تمكينdocker
أوsingularity
وتعيين إعدادات التنفيذ المناسبة لبيئة الحوسبة المحلية لديك.
ابدأ في تشغيل التحليل الخاص بك!
nextflow run nf-core/cageseq -profile < docker/singularity/podman/conda/institute > --input ' *_R1.fastq.gz ' --aligner < ' star ' / ' bowtie1 ' > --genome GRCh38
راجع مستندات الاستخدام للتعرف على جميع الخيارات المتاحة عند تشغيل المسار.
افتراضيًا، يقوم خط الأنابيب حاليًا بما يلي:
FastQC
)cutadapt
)SortMeRNA
)،FastQC
)STAR
أو bowtie1
)paraclu
)RSeQC
)MultiQC
) يأتي خط أنابيب nf-core/cageseq مزودًا بوثائق حول خط الأنابيب: الاستخدام والإخراج.
تمت كتابة nf-core/cageseq في الأصل بواسطة Kevin Menden (@KevinMenden) وTristan Kast (@TrisKast) وتم تحديثه بواسطة Matthias Hörtenhuber (@mashehu).
إذا كنت ترغب في المساهمة في هذا المسار، يرجى الاطلاع على إرشادات المساهمة.
لمزيد من المعلومات أو المساعدة، لا تتردد في الاتصال بقناة Slack #cageseq
(يمكنك الانضمام بهذه الدعوة).
إذا كنت تستخدم nf-core/cageseq لتحليلك، فيرجى الاستشهاد به باستخدام المستند الرقمي التالي: 10.5281/zenodo.4095105
يمكنك الاستشهاد بمنشور nf-core
كما يلي:
الإطار الأساسي لخطوط أنابيب المعلوماتية الحيوية التي ينظمها المجتمع.
فيليب إيويلز، ألكسندر بيلتزر، سفين فيلينجر، هارشيل باتيل، يوهانس ألنيبيرج، أندرياس ويلم، ماكسيم أوليس جارسيا، باولو دي توماسو وسفين نانسن.
نات للتكنولوجيا الحيوية. 13 فبراير 2020. دوى: 10.1038/s41587-020-0439-x. ReadCube: رابط الوصول الكامل
بالإضافة إلى ذلك، مراجع الأدوات والبيانات المستخدمة في هذا المسار هي كما يلي:
Di Tommaso P، Chatzou M، Floden EW، Barja PP، Palumbo E، Notredame C. يتيح Nextflow سير العمل الحسابي القابل للتكرار. نات للتكنولوجيا الحيوية. 2017 أبريل 11;35(4):316-319. دوى: 10.1038/nbt.3820. PubMed PMID: 28398311.
BEDTools
كوينلان AR، قاعة IM. BEDTools: مجموعة مرنة من الأدوات المساعدة لمقارنة الميزات الجينومية. المعلوماتية الحيوية. 2010 15 مارس؛26(6):841-2. دوى: 10.1093/المعلوماتية الحيوية/btq033. Epub 2010، 28 يناير. PubMed PMID: 20110278؛ PubMed Central PMCID: PMC2832824.
ربطة القوس
لانجميد ب، ترابنيل سي، بوب إم، سالزبيرج إس إل. محاذاة فائقة السرعة وفعالة في الذاكرة لتسلسلات الحمض النووي القصيرة مع الجينوم البشري. الجينوم بيول. 2009;10(3):R25. دوى: 10.1186/gb-2009-10-3-r25. Epub 2009 4 مارس. PMID: 19261174؛ بمكيد: PMC2690996.
com.cutadapt
Martin، M.، 2011. يقوم Cutadapt بإزالة تسلسلات المحول من قراءات التسلسل عالي الإنتاجية. إم نت. المجلة، 17(1)، الصفحات 10-12.
FastQC
MultiQC
Ewels P، Magnusson M، Lundin S، Käller M. MultiQC: تلخيص نتائج التحليل لأدوات وعينات متعددة في تقرير واحد. المعلوماتية الحيوية. 2016 أكتوبر 1;32(19):3047-8. دوى: 10.1093/المعلوماتية الحيوية/btw354. Epub 2016، 16 يونيو. PubMed PMID: 27312411؛ PubMed Central PMCID: PMC5039924.
باراكلو
Frith MC، Valen E، Krogh A، Hayashizaki Y، Carninci P، Sandelin A. رمز لبدء النسخ في جينومات الثدييات. دقة الجينوم. 2008 يناير;18(1):1-12. دوى: 10.1101/gr.6831208. Epub 2007 نوفمبر 21. PMID: 18032727؛ الرقم التعريفي لمعرف المنطقة: PMC2134772.
RSeQC
Wang L، Wang S، Li W. RSeQC: مراقبة جودة تجارب RNA-seq المعلوماتية الحيوية. 2012 15 أغسطس؛28(16):2184-5. دوى: 10.1093/المعلوماتية الحيوية/BTS356. Epub 2012، 27 يونيو. PubMed PMID: 22743226.
SAMtools
Li H، Handsaker B، Wysoker A، Fennell T، Ruan J، Homer N، Marth G، Abecasis G، Durbin R؛ 1000 مجموعة فرعية لمعالجة بيانات مشروع الجينوم. تنسيق محاذاة التسلسل/الخريطة وSAMtools. المعلوماتية الحيوية. 2009 15 أغسطس؛25(16):2078-9. دوى: 10.1093/المعلوماتية الحيوية/btp352. Epub 2009، 8 يونيو. PubMed PMID: 19505943؛ PubMed Central PMCID: PMC2723002.
سورتميرنا
Kopylova E، Noé L، Touzet H. SortMeRNA: تصفية سريعة ودقيقة للـ RNA الريباسي في بيانات metatranscriptomic المعلوماتية الحيوية. 2012 15 ديسمبر;28(24):3211-7. دوى: 10.1093/المعلوماتية الحيوية/BTS611. Epub 2012 15 أكتوبر. PubMed PMID: 23071270.
نجم
دوبين أ, كاليفورنيا ديفيس, و شليزنجر, ي درينكو, ج زاليسكي, جها S, ف باتوت, م تشيسون, جينجيراس TR. STAR: محاذاة RNA-seq العالمية فائقة السرعة للمعلوماتية الحيوية. 2013 يناير 1;29(1):15-21. دوى: 10.1093/المعلوماتية الحيوية/BTS635. Epub 2012 أكتوبر 25. PubMed PMID: 23104886؛ PubMed Central PMCID: PMC3530905.
أدوات جامعة كاليفورنيا
Kent WJ، Zweig AS، Barber G، Hinrichs AS، Karolchik D. BigWig and BigBed: تمكين تصفح مجموعات البيانات الموزعة الكبيرة. المعلوماتية الحيوية. 2010 سبتمبر 1;26(17):2204-7. دوى: 10.1093/المعلوماتية الحيوية/btq351. Epub 2010 17 يوليو. PubMed PMID: 20639541؛ PubMed Central PMCID: PMC2922891.
اناكوندا
توزيع برامج اناكوندا. برامج الكمبيوتر. الآيات. 2-2.4.0. اناكوندا، نوفمبر 2016. الويب.
بيوكوندا
غرونينغ بي، ديل آر، سجودين أ، تشابمان با، رو جي، تومكينز-تينش سي إتش، فاليريس آر، كوستر جيه؛ فريق بيوكوندا. Bioconda: توزيع برمجيات مستدامة وشاملة لعلوم الحياة. طرق نات. 2018 يوليو;15(7):475-476. دوى: 10.1038/s41592-018-0046-7. PubMed PMID: 29967506.
الحاويات الحيوية
دا فيغا ليبرفوست F، غرونينغ ب، أفليتوس سا، روست هل، أوسزكوريت ي، بارسنيس ح، فوديل إم، مورينو ف، جاتو إل، ويبر جي، باي إم، جيمينيز آر سي، ساتشسينبيرج تي، فيوفر جي، ألفاريز آر في، جريس جي، Nesvizhskii AI، Perez-Riverol Y. BioContainers: مفتوح المصدر وموجه من قبل المجتمع إطار لتوحيد البرمجيات. المعلوماتية الحيوية. 15 أغسطس 2017؛33(16):2580-2582. دوى: 10.1093/المعلوماتية الحيوية/btx192. ببمد بميد: 28379341؛ PubMed Central PMCID: PMC5870671.
عامل ميناء
التفرد
كورتزر جنرال موتورز، سوتشات الخامس، باور ميغاواط. التفرد: حاويات علمية لتنقل الحساب. بلوس واحد. 11 مايو 2017؛12(5):e0177459. دوى: 10.1371/journal.pone.0177459. المجموعة الإلكترونية 2017. PubMed PMID: 28494014؛ PubMed Central PMCID: PMC5426675.