MetaGraph هي أداة لإنشاء رسوم بيانية مشروحة للجينوم قابلة للتطوير ومحاذاة التسلسل إلى الرسم البياني.
تعتبر تمثيلات الفهرس الافتراضية في MetaGraph قابلة للتطوير بشكل كبير وتدعم إنشاء الرسوم البيانية بتريليونات العقد وملايين تسميات التعليقات التوضيحية. وفي الوقت نفسه، تتيح مسارات العمل المقدمة وتنفيذها الدقيق، جنبًا إلى جنب مع التحسينات منخفضة المستوى لهياكل البيانات الأساسية، أداءً استثنائيًا للاستعلام والمحاذاة.
الوثائق عبر الإنترنت متاحة على https://metagraph.ethz.ch/static/docs/index.html. المصادر غير المتصلة بالإنترنت هنا.
قم بتثبيت أحدث إصدار على Linux أو Mac OS X باستخدام Anaconda:
conda install -c bioconda -c conda-forge metagraph
إذا كان عامل الإرساء متاحًا على النظام، فابدأ به على الفور
docker pull ghcr.io/ratschlab/metagraph:master
docker run -v ${HOME}:/mnt ghcr.io/ratschlab/metagraph:master
build -v -k 10 -o /mnt/transcripts_1000 /mnt/transcripts_1000.fa
واستبدل ${HOME}
بدليل على النظام المضيف لتعيينه ضمن /mnt
في الحاوية.
لتشغيل الملف الثنائي المجمع لأبجدية Protein
، ما عليك سوى إضافة --entrypoint metagraph_Protein
:
docker run -v ${HOME}:/mnt --entrypoint metagraph_Protein ghcr.io/ratschlab/metagraph:master
build -v -k 10 -o /mnt/graph /mnt/protein.fa
كما ترى، يعد تشغيل MetaGraph من حاويات الإرساء أمرًا سهلاً للغاية. أيضًا، قد يكون الأمر التالي (أو ما شابه) مفيدًا لمعرفة الدليل المثبت في الحاوية أو أي نوع آخر من تصحيح أخطاء الأمر:
docker run -v ${HOME}:/mnt --entrypoint ls ghcr.io/ratschlab/metagraph:master /mnt
جميع الإصدارات المختلفة لصورة الحاوية مدرجة هنا.
للتجميع من المصدر (على سبيل المثال، للإنشاءات باستخدام أبجدية مخصصة أو تكوينات أخرى)، راجع الوثائق عبر الإنترنت.
./metagraph build
./metagraph annotate
./metagraph transform_anno
./metagraph query
DATA="../tests/data/transcripts_1000.fa"
./metagraph build -k 12 -o transcripts_1000 $DATA
./metagraph annotate -i transcripts_1000.dbg --anno-filename -o transcripts_1000 $DATA
./metagraph query -i transcripts_1000.dbg -a transcripts_1000.column.annodbg $DATA
./metagraph stats -a transcripts_1000.column.annodbg transcripts_1000.dbg
./metagraph
./metagraph build -v --parallel 30 -k 20 --mem-cap-gb 10
-o < GRAPH_DIR > /graph < DATA_DIR > / * .fasta.gz
2>&1 | tee < LOG_DIR > /log.txt
./metagraph build -v --parallel 30 -k 20 --mem-cap-gb 10 --disk-swap < GRAPH_DIR >
-o < GRAPH_DIR > /graph < DATA_DIR > / * .fasta.gz
2>&1 | tee < LOG_DIR > /log.txt
K=20
./KMC/kmc -ci5 -t4 -k $K -m5 -fm < FILE > .fasta.gz < FILE > .cutoff_5 ./KMC
./metagraph build -v -p 4 -k $K --mem-cap-gb 10 -o graph < FILE > .cutoff_5.kmc_pre
./metagraph annotate -v --anno-type row --fasta-anno
-i primates.dbg
-o primates
~ /fasta_zurich/refs_chimpanzee_primates.fa
./metagraph transform_anno -v --linkage --greedy
-o linkage.txt
--subsample R
-p NCORES
primates.column.annodbg
يتطلب N*R/8 + 6*N^2
بايت من ذاكرة الوصول العشوائي (RAM)، حيث N
هو عدد الأعمدة و R
هو عدد الصفوف التي تم أخذ عينات منها.
./metagraph transform_anno -v -p NCORES --anno-type brwt
--linkage-file linkage.txt
-o primates
--parallel-nodes V
-p NCORES
primates.column.annodbg
يتطلب M*V/8 + Size(BRWT)
بايت من ذاكرة الوصول العشوائي (RAM)، حيث M
هو عدد الصفوف في التعليق التوضيحي و V
هو عدد العقد المدمجة بشكل متزامن.
./metagraph query -v -i < GRAPH_DIR > /graph.dbg
-a < GRAPH_DIR > /annotation.column.annodbg
--min-kmers-fraction-label 0.8 --labels-delimiter " , "
query_seq.fa
./metagraph align -v -i < GRAPH_DIR > /graph.dbg query_seq.fa
./metagraph assemble -v < GRAPH_DIR > /graph.dbg
-o assembled.fa
--unitigs
./metagraph assemble -v < GRAPH_DIR > /graph.dbg
--unitigs
-a < GRAPH_DIR > /annotation.column.annodbg
--diff-assembly-rules diff_assembly_rules.json
-o diff_assembled.fa
راجع metagraph/tests/data/example.diff.json
و metagraph/tests/data/example_simple.diff.json
للحصول على نماذج الملفات.
إحصائيات الرسم البياني
./metagraph stats graph.dbg
إحصائيات للتعليق التوضيحي
./metagraph stats -a annotation.column.annodbg
إحصائيات لكليهما
./metagraph stats -a annotation.column.annodbg graph.dbg
يمكن استخدام Makefile
الموجود في الدليل المصدر ذي المستوى الأعلى لإنشاء metagraph
واختباره بسهولة أكبر. يتم دعم الحجج التالية:
env
: البيئة التي سيتم الترجمة/التشغيل فيها ( ""
: على المضيف، docker
: في حاوية عامل الإرساء)alphabet
: تجميع metagraph لأبجدية معينة (مثل DNA
أو Protein
، DNA
الافتراضي)additional_cmake_args
: وسيطات إضافية لتمريرها إلى cmake.أمثلة:
# compiles metagraph in a docker container for the `DNA` alphabet
make build-metagraph env=docker alphabet=DNA
يتم إنشاء إصدار إصدار جديد في ثلاث خطوات:
يتم توزيع Metagraph بموجب ترخيص GPLv3 (راجع الترخيص). يرجى العثور على مزيد من المعلومات في ملفات المؤلفين وحقوق الطبع والنشر.