La base de données taxonomique est une classification et une nomenclature organisées pour tous les organismes présents dans les bases de données de séquences publiques. Cela représente actuellement environ 10 % des espèces vivantes décrites sur la planète. L'adresse officielle de la base de données NCBI Taxonomy est https://www.ncbi.nlm.nih.gov/taxonomy et l'adresse publique de téléchargement des données est https://ftp.ncbi.nih.gov/pub/taxonomy/. taxtree
est utilisé pour générer une topologie phylogénétique d'unités taxonomiques (taxons) basée sur la base de données Taxonomy en traitant les noms.dmp et nodes.dmp et en dessinant des arbres évolutifs simples basés sur la hiérarchie des taxons. L'implémentation de la fonction taxtree
repose sur tidyverse
et ggtree
. Actuellement, taxtree
permet d'utiliser 768 430 taxons de la base de données taxonomique pour construire la topologie d'un arbre phylogénétique.
Rangs | taxons supérieurs | genre | espèces | taxons inférieurs | total |
---|---|---|---|---|---|
Archées | 610 | 264 | 878 | 0 | 1 752 |
Bactéries | 5 897 | 5 005 | 24 761 | 952 | 36 615 |
Eucaryote | 67 028 | 98 600 | 515 880 | 36 640 | 718 148 |
Champignons | 6 009 | 7 437 | 55 840 | 1 571 | 70 857 |
Métazoaires | 48 564 | 70 320 | 270 261 | 18 292 | 407 437 |
Virus | 2 064 | 2 587 | 7 180 | 65 | 11 896 |
Bactéries | 5 897 | 5 005 | 24 761 | 952 | 36 615 |
Tous les taxons | 75 630 | 106 458 | 548 685 | 37 657 | 768 430 |
Avant l'installation, vous devrez télécharger le package de dépendances taxtree
ggtree
de BiocManager
.
if (!require("BiocManager"))
install.packages("BiocManager")
library(BiocManager)
if (!require("ggtree"))
BiocManager::install("ggtree")
Installez devtools
, qui est utilisé pour installer les packages R à partir de GitHub.
if (!require("devtools"))
install.packages("devtools")
Une fois que vous avez terminé les étapes ci-dessus, démarrez l'installation.
devtools::install_github("nongxinshengxin/taxtree")
taxtree
a six fonctions principales .
make_Taxtree() Si vous avez des noms de taxons définis (soit Kingdom Phylum Class Order Family Genus Species, soit tout autre nœud taxonomique), vous pouvez utiliser cette fonction pour construire leur topologie taxonomique à partir d'une liste de noms de taxons.
find_Lineage() Par un nom de taxon explicite, toutes les lignées taxonomiques sous ce taxno sont trouvées.
name2rank() Si vous avez des noms de taxons définis (soit Kingdom Phylum Class Order Family Genus Species, soit tout autre nœud taxonomique), vous pouvez utiliser cette fonction pour obtenir le nom du rang taxonomique (et le taxid) en fonction du nom des taxons.
name2rank_str() Si vous avez des noms de taxons définis (soit le Kingdom Phylum Class Order Family Genus Species, soit tout autre nœud taxonomique), vous pouvez utiliser cette fonction pour obtenir le nom du rang taxonomique (et le taxid) en fonction du nom du taxon. Vous pouvez saisir une seule chaîne ou un vecteur contenant plusieurs chaînes dans cette fonction.
plot_taxTree() Dessiner un arbre taxonomique simple basé sur le package ggtree
.
write_taxTree() Cette fonction écrit dans un fichier un arbre au format parenthèse en utilisant le format Newick, basé sur les packages ape
.
Annotation d'espèces basée sur les OTU, permettant la construction de leur topologie phylogénétique basée sur les noms de taxons obtenus à partir de l'annotation, à l'aide de la fonction make_Taxtree() ;
Réalisation d'études taxonomiques. Curieux de connaître les proches parents des humains de l'ordre des Primates ? find_Lineage("Primates") est une commande sur une ligne qui vous donnera la réponse ;
Border Phylum Order Famille Genre Espèce, la classification est tout simplement trop compliquée. name2rank(), name2rank_str(), fournissez simplement le nom du taxon et il vous indiquera son rang taxonomique ;
Super liaison. taxtree
est basé sur la base de données Taxonomy et peut être lié au logiciel TaxonKit ; de plus, taxtree génère des classes phylo S3, qui sont couramment utilisées pour stocker des arbres phylogénétiques dans R. L'arbre peut être facilement embelli en profondeur à l'aide du package ggtree
. L'arbre peut également être généré via write_taxTree(), combiné avec le package itol.toolkit et agrémenté d'iTOL.
Hadley Wickham. https://github.com/tidyverse/tidyverse
G Yu, DK Smith, H Zhu, Y Guan, TTY Lam (2017). ggtree : un package R pour la visualisation et l'annotation d'arbres phylogénétiques avec leurs covariables et autres données associées. Méthodes en écologie et évolution, 8(1):28-36. https://doi.org/10.1111/2041-210X.12628
La documentation en anglais est disponible sur - https://github.com/nongxinshengxin/taxtree
La documentation chinoise est disponible en - 微信公众号农心生信工作室
S'il vous plaît, lorsque vous utilisez taxtree
, citez-nous en utilisant la référence : https://github.com/nongxinshengxin/taxtree
Courriel : [email protected]
Compte officiel Wechat: