Die Taxonomiedatenbank ist eine kuratierte Klassifizierung und Nomenklatur für alle Organismen in den öffentlichen Sequenzdatenbanken. Dies entspricht derzeit etwa 10 % der beschriebenen Lebensarten auf dem Planeten. Die offizielle Adresse für die NCBI-Taxonomie-Datenbank lautet https://www.ncbi.nlm.nih.gov/taxonomy und die öffentliche Daten-Download-Adresse lautet https://ftp.ncbi.nih.gov/pub/taxonomy/. taxtree
wird verwendet, um eine phylogenetische Topologie taxonomischer Einheiten (Taxa) basierend auf der Taxonomie-Datenbank zu generieren, indem „names.dmp“ und „nodes.dmp“ verarbeitet und einfache Evolutionsbäume basierend auf der Hierarchie der Taxa gezeichnet werden. Die Implementierung der taxtree
-Funktion basiert auf tidyverse
und ggtree
. Derzeit ermöglicht taxtree
die Verwendung von 768.430 Taxa aus der Taxonomiedatenbank zur Erstellung der Topologie eines phylogenetischen Baums.
Ränge | höhere Taxa | Gattung | Spezies | niedrigere Taxa | gesamt |
---|---|---|---|---|---|
Archaeen | 610 | 264 | 878 | 0 | 1.752 |
Bakterien | 5.897 | 5.005 | 24.761 | 952 | 36.615 |
Eukaryoten | 67.028 | 98.600 | 515.880 | 36.640 | 718.148 |
Pilze | 6.009 | 7.437 | 55.840 | 1.571 | 70.857 |
Metazoa | 48.564 | 70.320 | 270.261 | 18.292 | 407.437 |
Viren | 2.064 | 2.587 | 7.180 | 65 | 11.896 |
Bakterien | 5.897 | 5.005 | 24.761 | 952 | 36.615 |
Alle Taxa | 75.630 | 106.458 | 548.685 | 37.657 | 768.430 |
Vor der Installation müssen Sie das taxtree
Abhängigkeitspaket ggtree
von BiocManager
herunterladen.
if (!require("BiocManager"))
install.packages("BiocManager")
library(BiocManager)
if (!require("ggtree"))
BiocManager::install("ggtree")
Installieren Sie devtools
, das zum Installieren von R-Paketen von GitHub verwendet wird.
if (!require("devtools"))
install.packages("devtools")
Sobald Sie die oben genannten Schritte abgeschlossen haben, starten Sie die Installation.
devtools::install_github("nongxinshengxin/taxtree")
taxtree
hat sechs Kernfunktionen .
make_Taxtree() Wenn Sie bestimmte Taxa-Namen haben (entweder Kingdom Phylum Class Order Family Genus Species oder einen anderen taxonomischen Knoten), können Sie diese Funktion verwenden, um deren taxonomische Topologie aus einer Liste von Taxa-Namen zu erstellen.
find_Lineage() Durch einen expliziten Taxonnamen werden alle taxonomischen Abstammungslinien unter dieser Taxnummer gefunden.
name2rank() Wenn Sie bestimmte Taxa-Namen haben (entweder Kingdom Phylum Class Order Family Genus Species oder einen anderen taxonomischen Knoten), können Sie diese Funktion verwenden, um den Taxonomie-Rangnamen (und das Taxid) basierend auf dem Namen der Taxa abzurufen.
name2rank_str() Wenn Sie bestimmte Taxa-Namen haben (entweder Kingdom Phylum Class Order Family Genus Species oder einen anderen taxonomischen Knoten), können Sie diese Funktion verwenden, um den Taxonomie-Rangnamen (und das Taxid) basierend auf dem Namen der Taxa abzurufen. Sie können in dieser Funktion eine einzelne Zeichenfolge oder einen Vektor mit mehreren Zeichenfolgen eingeben.
plot_taxTree() Zeichnen eines einfachen Taxonomiebaums basierend auf dem ggtree
-Paket.
write_taxTree() Diese Funktion schreibt in eine Datei einen Baum in Klammerformat unter Verwendung des Newick-Formats, basierend auf ape
-Paketen.
Annotation von Arten basierend auf OTUs, die die Konstruktion ihrer phylogenetischen Topologie basierend auf den Namen von Taxa ermöglicht, die aus der Annotation erhalten wurden, unter Verwendung der Funktion make_Taxtree();
Durchführung taxonomischer Studien. Neugierig auf die nahen Verwandten der Menschen unter der Ordnung Primaten? find_Lineage("Primates") ist ein einzeiliger Befehl, der Ihnen die Antwort gibt;
Border Phylum Order Family Genus Species, die Klassifizierung ist einfach zu kompliziert. name2rank(), name2rank_str(), geben Sie einfach den Namen der Taxa ein und schon wird Ihnen der taxonomische Rang angezeigt;
Super Verbindung. taxtree
basiert auf der Taxonomy-Datenbank und kann mit der TaxonKit-Software verknüpft werden; Außerdem generiert Taxtree S3-Phylo-Klassen, die üblicherweise zum Speichern phylogenetischer Bäume in R verwendet werden. Der Baum kann mit dem Paket ggtree
leicht in der Tiefe verschönert werden. Der Baum kann auch über write_taxTree() ausgegeben, mit dem Paket itol.toolkit kombiniert und mit iTOL verschönert werden.
Hadley Wickham. https://github.com/tidyverse/tidyverse
G Yu, DK Smith, H Zhu, Y Guan, TTY Lam (2017). ggtree: ein R-Paket zur Visualisierung und Annotation phylogenetischer Bäume mit ihren Kovariaten und anderen zugehörigen Daten. Methoden in Ökologie und Evolution, 8(1):28-36. https://doi.org/10.1111/2041-210X.12628
Die englische Dokumentation ist verfügbar unter - https://github.com/nongxinshengxin/taxtree
Die chinesische Dokumentation ist verfügbar in: 微信公众号农心生信工作室
Wenn Sie taxtree
verwenden, zitieren Sie uns bitte mit der Referenz: https://github.com/nongxinshengxin/taxtree
E-Mail: [email protected]
Offizielles Wechat-Konto: