Omnition عبارة عن خط أنابيب مصمم لمعالجة البيانات التي تم إنشاؤها باستخدام مجموعة ddSEQ™ أحادية الخلية 3' RNA-Seq من Bio-Rad أو ddSEQ™ SureCell ATAC-Seq Library Prep Kit وبروتوكول dsciATAC. يقوم بتنفيذ إزالة الترميز والمحاذاة ودمج الخرزات واستدعاء الخلايا وإحصاء الميزات. الإخراج هو تقرير HTML وملفات للتحليل البيولوجي النهائي.
تهدف هذه الصفحة إلى أن تكون بداية سريعة. للحصول على أدلة مستخدم Omnition الكاملة، يرجى الاطلاع على:
Omnition خلية واحدة 3' RNA-Seq
Omnition خلية واحدة ATAC-Seq
مقدمة إلى أومنيشن
تثبيت
متطلبات النظام
متطلبات الأجهزة
متطلبات البرمجيات
تحميل اومنيشن
التحقق من التثبيت
ابدء
تكوين YAML
تشغيل خط أنابيب ATAC
تشغيل خط أنابيب الحمض النووي الريبي
الجينوم البشري
جينوم الفأر
مراجع
تشغيل اومنيشن
النواتج
يستخدم برنامج تحليل Omnition إطار عمل Nextflow لربط العمليات الفردية، ويقوم بتشغيل العمليات في بيئات افتراضية تسمى الحاويات باستخدام برامج حاويات Docker أو Singularity. بمجرد تثبيت Omnition على نظام يلبي الحد الأدنى من المتطلبات، سيقوم تكامل Nextflow مع GitHub وDocker بإعداد سير العمل دون أي تكوين إضافي.
تم تصميم Omnition للتشغيل على خادم Linux محلي، أو مجموعة حوسبة عالية الأداء (HPC)، أو جهاز ظاهري سحابي، وقد تم اختباره على نظام التشغيل 64 بت CentOS 7 و8، وAmazon Linux 2، وUbuntu 18.04.6، 20.04 LTS وأنظمة التشغيل 21.04 و21.10 لينكس.
ملاحظة : على الرغم من أنها قد تكون فعالة، إلا أن Bio-Rad لا يدعم متغيرات Linux الإضافية أو الإصدارات الأخرى من أنظمة التشغيل المحددة.
اتصال بالإنترنت
ملاحظة : للتثبيت دون الوصول المباشر إلى الإنترنت، يرجى الاطلاع على دليل المستخدم.
متطلبات | تحليل تسلسل ATAC | التحليل التوافقي ATAC seq | تحليل تسلسل الحمض النووي الريبي | يوصى به لعينات> = 12x |
---|---|---|---|---|
وحدة المعالجة المركزية | 16 | 16 | 16 | 64 |
كبش | 64 جيجابايت | 128 جيجابايت | 64 جيجابايت | 512 جيجابايت |
IOPS* | 3000 | 3000 | 3000 | 16000 |
إنتاجية الإدخال/الإخراج* | 125 ميجابت في الثانية | 125 ميجابت في الثانية | 125 ميجابت في الثانية | 1000 ميجابت في الثانية |
نوع وحدة تخزين EBS* | gp3 | gp3 | gp3 | gp3 |
*مواصفات الحوسبة السحابية الخاصة بـ AWS
Nextflow (الإصدار 22.04.0 إلى الإصدار 23.10.1) أو Nextflow مع Conda
ملاحظة: حدد إصدار Nextflow في تثبيت Conda باستخدام الأمر التالي:
conda install –c bioconda nextflow=
هناك حاجة إلى واحد فقط من برامج الحاويات التالية: إما Docker (>=20.10.7) أو Singularity (>=3.6.4)
ملاحظة: إذا كنت تستخدم Docker، فيجب إضافة
USER
الخاص بك إلى مجموعة مستخدمي Docker root قبل تنفيذ المسار. في الأنظمة المشتركة، مثل مجموعات HPC، قد لا يكون هذا ممكنًا بسبب المخاطر الأمنية ويجب تنفيذ المسار باستخدام ملف تعريف Singularity (افتراضي) بدلاً من ذلك. يجب على المستخدم التحقق من مسؤول النظام الخاص به من توفر Docker أو Singularity قبل استخدام Omnition.
لتنزيل Omnition وتشغيله، استخدم nextflow لاسترداد أحدث إصدار من Omnition من GitHub.
nextflow pull BioRadOpenSource/omnition
يتضمن Omnition مجموعات بيانات توضيحية صغيرة للتحقق من أن البيئة قد تم إنشاؤها بشكل صحيح وأن جميع تبعيات البرامج في مكانها الصحيح. للتحقق من نجاح التثبيت لكل نوع تحليل، قم بتشغيل أمر Nextflow لنظام الحاوية المثبت على جهاز الكمبيوتر الخاص بك (Singularity أو Docker).
للتحقق من تثبيت كل سير عمل تحليل بشكل صحيح، قم بتشغيل الأوامر التالية باستخدام Docker أو Singularity.
ملاحظة: سيتم إنشاء ملفات العمل (وملفات الإخراج، ما لم يتم تحديد خلاف ذلك) في نفس الدليل الذي تم تشغيل خط الأنابيب منه في سطر الأوامر.
mkdir /home/ubuntu/demo_data cd /home/ubuntu/demo_data
ملاحظة: مسارات الملفات المحددة هي لأغراض المثال
عامل ميناء:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,docker --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,docker --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,docker --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,docker --catac.output /home/ubuntu/demo_data/catac
التفرد:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,standard --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,standard --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,standard --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,standard --catac.output /home/ubuntu/demo_data/catac
ملحوظة: يرجى ملاحظة استخدام
-
و--
في أوامر التنفيذ. الوسيطات التي تحتوي على-
في المقدمة هي وسيطات Nextflow وتلك التي تحتوي على--
هي معلمات محددة من قبل المستخدم. يمكنك أيضًا استخدام علامة Nextflow -r لتحديد علامة git (أي إصدار) أو فرع أو تجزئة لتنفيذ خط الأنابيب عند تلك النقطة في سجل git.
ملاحظة: عند بدء تشغيل التدفق التالي، سيتم إنشاء [adjective_names] عشوائيًا والتي تظهر في الوحدة الطرفية. هذه الأسماء مأخوذة من قائمة أعدتها Nextflow. هذه سمة متأصلة في Nextflow، وليست شيئًا تمت إضافته بواسطة Bio-Rad.
عند انتهاء التشغيل، من المفترض أن ترى رسالة تفيد بأنه قد اكتمل دون أي مهام فاشلة.
قبل تشغيل سير العمل، يتطلب Omnition تشغيل الملفات التالية:
ملفات الجينوم FASTA وGTF من ENSEMBL.
يجب تنسيق التسلسلات المرجعية للجينوم كملفات FASTA.
يجب تنسيق التعليقات التوضيحية كملفات GTF.
يجب أن تتطابق أسماء التسلسل في ملفات FASTA وGTF.
الدليل مع إدخال FASTQs
ملاحظة: يمكن ضغط الملفات المرجعية للإدخال كملفات gzip (.gz).
Omnition متوافق مع المراجع من ENSEMBL. يتم دعم مراجع ENSEMBL Human/GRCh38 وMouse/GRCm39 بواسطة Omnition. الأنواع الأخرى من ENSEMBL غير مدعومة والمراجع التي تنتجها مصادر أخرى (NCBI، GENCODE، وما إلى ذلك) غير متوافقة.
يمكن الحصول على مراجع الإنسان والماوس باستخدام الأوامر التالية.
mkdir ~/references/human cd ~/references/human
ملاحظة: مسارات الملفات المحددة هي لأغراض المثال
curl -o Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz curl -o Homo_sapiens.GRCh38.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/homo_sapiens/Homo_sapiens.GRCh38.106.gtf.gz
mkdir ~/references/mouse cd ~/references/mouse
curl -o Mus_musculus.GRCm39.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/mus_musculus/dna/Mus_musculus.GRCm39.dna.primary_assembly.fa.gz curl -o Mus_musculus.GRCm39.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/mus_musculus/Mus_musculus.GRCm39.106.gtf.gz
يتطلب خط الأنابيب ملفًا بتنسيق YAML مزودًا بمسارات الإدخال/الإخراج ومعلمات خاصة بالمقايسة عند عدم تشغيل بيانات الاختبار. يمكن العثور على وصف تفصيلي لمحتويات الملف والمعلمات المتاحة وكيفية تنسيقها في دليل المستخدم. يمكن العثور على مثال لتكوينات YAML ضمن مجلد example-yamls في هذا الريبو.
مع التفرد:
nextflow run BioRadOpenSource/omnition -params-file
مع عامل الميناء:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
مع التفرد:
nextflow run BioRadOpenSource/omnition -params-file
مع عامل الميناء:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
بعد الانتهاء، يمكن العثور على التقارير في results/report/
الدليل الفرعي ويمكن العثور على الملفات المتوسطة في results/Sample_Files/
الدليل الفرعي. بالإضافة إلى ذلك، سيتم إنشاء دليل ذاكرة التخزين المؤقت Nextflow ( .nextflow/
) ودليل العمل ( work/
) في الدليل الذي تم تنفيذ Nextflow منه. وهذا يسمح باستئناف التحليلات المتقطعة/الفاشلة من نقطة فشلها. إذا كنت ترغب في مواصلة التشغيل، أضف -resume
إلى أوامر التنفيذ أدناه. يمكنك حذف ذاكرة التخزين المؤقت وأدلة العمل لتوفير المساحة بعد الانتهاء، على الرغم من أن هذا سيمنع ميزة -resume
.
العودة إلى الأعلى