MetaGraph adalah alat untuk konstruksi grafik genom beranotasi yang dapat diskalakan dan penyelarasan urutan ke grafik.
Representasi indeks default di MetaGraph sangat skalabel dan mendukung pembuatan grafik dengan triliunan node dan jutaan label anotasi. Pada saat yang sama, alur kerja yang disediakan dan penerapannya yang cermat, dikombinasikan dengan optimalisasi tingkat rendah pada struktur data inti, memungkinkan kinerja kueri dan penyelarasan yang luar biasa.
Dokumentasi online tersedia di https://metagraph.ethz.ch/static/docs/index.html. Sumber offline ada di sini.
Instal rilis terbaru di Linux atau Mac OS X dengan Anaconda:
conda install -c bioconda -c conda-forge metagraph
Jika buruh pelabuhan tersedia di sistem, segera mulai
docker pull ghcr.io/ratschlab/metagraph:master
docker run -v ${HOME}:/mnt ghcr.io/ratschlab/metagraph:master
build -v -k 10 -o /mnt/transcripts_1000 /mnt/transcripts_1000.fa
dan ganti ${HOME}
dengan direktori di sistem host untuk memetakannya di bawah /mnt
di dalam container.
Untuk menjalankan biner yang dikompilasi untuk alfabet Protein
, cukup tambahkan --entrypoint metagraph_Protein
:
docker run -v ${HOME}:/mnt --entrypoint metagraph_Protein ghcr.io/ratschlab/metagraph:master
build -v -k 10 -o /mnt/graph /mnt/protein.fa
Seperti yang Anda lihat, menjalankan MetaGraph dari kontainer buruh pelabuhan sangatlah mudah. Selain itu, perintah berikut (atau yang serupa) mungkin berguna untuk melihat direktori apa yang dipasang di container atau jenis debugging perintah lainnya:
docker run -v ${HOME}:/mnt --entrypoint ls ghcr.io/ratschlab/metagraph:master /mnt
Semua versi gambar kontainer yang berbeda tercantum di sini.
Untuk mengkompilasi dari sumber (misalnya, untuk build dengan alfabet khusus atau konfigurasi lainnya), lihat dokumentasi online.
./metagraph build
./metagraph annotate
./metagraph transform_anno
./metagraph query
DATA="../tests/data/transcripts_1000.fa"
./metagraph build -k 12 -o transcripts_1000 $DATA
./metagraph annotate -i transcripts_1000.dbg --anno-filename -o transcripts_1000 $DATA
./metagraph query -i transcripts_1000.dbg -a transcripts_1000.column.annodbg $DATA
./metagraph stats -a transcripts_1000.column.annodbg transcripts_1000.dbg
./metagraph
./metagraph build -v --parallel 30 -k 20 --mem-cap-gb 10
-o < GRAPH_DIR > /graph < DATA_DIR > / * .fasta.gz
2>&1 | tee < LOG_DIR > /log.txt
./metagraph build -v --parallel 30 -k 20 --mem-cap-gb 10 --disk-swap < GRAPH_DIR >
-o < GRAPH_DIR > /graph < DATA_DIR > / * .fasta.gz
2>&1 | tee < LOG_DIR > /log.txt
K=20
./KMC/kmc -ci5 -t4 -k $K -m5 -fm < FILE > .fasta.gz < FILE > .cutoff_5 ./KMC
./metagraph build -v -p 4 -k $K --mem-cap-gb 10 -o graph < FILE > .cutoff_5.kmc_pre
./metagraph annotate -v --anno-type row --fasta-anno
-i primates.dbg
-o primates
~ /fasta_zurich/refs_chimpanzee_primates.fa
./metagraph transform_anno -v --linkage --greedy
-o linkage.txt
--subsample R
-p NCORES
primates.column.annodbg
Memerlukan RAM N*R/8 + 6*N^2
byte, dengan N
adalah jumlah kolom dan R
adalah jumlah baris yang dijadikan sampel.
./metagraph transform_anno -v -p NCORES --anno-type brwt
--linkage-file linkage.txt
-o primates
--parallel-nodes V
-p NCORES
primates.column.annodbg
Membutuhkan M*V/8 + Size(BRWT)
byte RAM, dengan M
adalah jumlah baris dalam anotasi dan V
adalah jumlah node yang digabungkan secara bersamaan.
./metagraph query -v -i < GRAPH_DIR > /graph.dbg
-a < GRAPH_DIR > /annotation.column.annodbg
--min-kmers-fraction-label 0.8 --labels-delimiter " , "
query_seq.fa
./metagraph align -v -i < GRAPH_DIR > /graph.dbg query_seq.fa
./metagraph assemble -v < GRAPH_DIR > /graph.dbg
-o assembled.fa
--unitigs
./metagraph assemble -v < GRAPH_DIR > /graph.dbg
--unitigs
-a < GRAPH_DIR > /annotation.column.annodbg
--diff-assembly-rules diff_assembly_rules.json
-o diff_assembled.fa
Lihat metagraph/tests/data/example.diff.json
dan metagraph/tests/data/example_simple.diff.json
untuk contoh file.
Statistik untuk grafik
./metagraph stats graph.dbg
Statistik untuk anotasi
./metagraph stats -a annotation.column.annodbg
Statistik untuk keduanya
./metagraph stats -a annotation.column.annodbg graph.dbg
Makefile
di direktori sumber tingkat atas dapat digunakan untuk membangun dan menguji metagraph
dengan lebih nyaman. Argumen berikut ini didukung:
env
: lingkungan untuk mengkompilasi/menjalankan ( ""
: pada host, docker
: dalam wadah buruh pelabuhan)alphabet
: menyusun metagraf untuk alfabet tertentu (misalnya DNA
atau Protein
, DNA
default)additional_cmake_args
: argumen tambahan untuk diteruskan ke cmake.Contoh:
# compiles metagraph in a docker container for the `DNA` alphabet
make build-metagraph env=docker alphabet=DNA
Membuat rilis versi baru dilakukan dalam tiga langkah:
Metagraph didistribusikan di bawah Lisensi GPLv3 (lihat LISENSI). Silakan temukan informasi lebih lanjut di file PENULIS dan HAK CIPTA.