La base de datos de taxonomía es una clasificación y nomenclatura seleccionada para todos los organismos en las bases de datos de secuencias públicas. Esto representa actualmente alrededor del 10% de las especies de vida descritas en el planeta. La dirección oficial de la base de datos de taxonomía del NCBI es https://www.ncbi.nlm.nih.gov/taxonomy y la dirección de descarga de datos públicos es https://ftp.ncbi.nih.gov/pub/taxonomy/. taxtree
se utiliza para generar una topología filogenética de unidades taxonómicas (taxones) basada en la base de datos de taxonomía procesando nombres.dmp y nodos.dmp y dibujando árboles evolutivos simples basados en la jerarquía de taxones. La implementación de la función taxtree
se basa en tidyverse
y ggtree
. Actualmente, taxtree
permite utilizar 768.430 taxones de la base de datos de taxonomía para construir la topología de un árbol filogenético.
Rangos | taxones superiores | género | especies | taxones inferiores | total |
---|---|---|---|---|---|
arqueas | 610 | 264 | 878 | 0 | 1.752 |
bacterias | 5.897 | 5.005 | 24.761 | 952 | 36.615 |
eucariota | 67.028 | 98.600 | 515.880 | 36.640 | 718,148 |
Hongos | 6.009 | 7.437 | 55.840 | 1.571 | 70.857 |
metazoos | 48.564 | 70.320 | 270,261 | 18,292 | 407,437 |
Virus | 2.064 | 2.587 | 7.180 | 65 | 11.896 |
bacterias | 5.897 | 5.005 | 24.761 | 952 | 36.615 |
Todos los taxones | 75.630 | 106.458 | 548,685 | 37.657 | 768.430 |
Antes de la instalación, deberá descargar el paquete de dependencia taxtree
ggtree
de BiocManager
.
if (!require("BiocManager"))
install.packages("BiocManager")
library(BiocManager)
if (!require("ggtree"))
BiocManager::install("ggtree")
Instale devtools
, que se utiliza para instalar paquetes R desde GitHub.
if (!require("devtools"))
install.packages("devtools")
Una vez que haya completado los pasos anteriores, comience la instalación.
devtools::install_github("nongxinshengxin/taxtree")
taxtree
tiene seis funciones principales .
make_Taxtree() Si tiene algunos nombres de taxones definidos (ya sea Reino Phylum Clase Orden Familia Género Especies o cualquier otro nodo taxonómico), puede usar esta función para construir su topología taxonómica a partir de una lista de nombres de taxones.
find_Lineage() Mediante un nombre de taxón explícito, se encuentran todos los linajes taxonómicos bajo ese taxno.
name2rank() Si tiene algunos nombres de taxones definidos (ya sea Reino Phylum Clase Orden Familia Género Especies o cualquier otro nodo taxonómico), puede usar esta función para obtener el nombre del rango de taxonomía (y taxid) según el nombre de los taxones.
name2rank_str() Si tiene algunos nombres de taxones definidos (ya sea Reino Phylum Clase Orden Familia Género Especies o cualquier otro nodo taxonómico), puede usar esta función para obtener el nombre del rango de taxonomía (y taxid) según el nombre de los taxones. Puede ingresar una sola cadena o un vector que contenga varias cadenas en esta función.
plot_taxTree() Dibujar un árbol de taxonomía simple basado en el paquete ggtree
.
write_taxTree() Esta función escribe en un archivo un árbol en formato paréntesis usando el formato Newick, basado en paquetes ape
.
Anotación de especies basada en OTU, permitiendo la construcción de su topología filogenética basada en los nombres de taxones obtenidos de la anotación, utilizando la función make_Taxtree();
Realización de estudios taxonómicos. ¿Tienes curiosidad por conocer los parientes cercanos de los humanos del orden de los primates? find_Lineage("Primates") es un comando de una línea que le dará la respuesta;
Frontera Phylum Orden Familia Género Especies, la clasificación es demasiado complicada. name2rank(), name2rank_str(), simplemente proporciona el nombre del taxón y te dirá su rango taxonómico;
Súper vinculación. taxtree
se basa en la base de datos de taxonomía y se puede vincular al software TaxonKit ; Además, taxtree genera clases filo S3, que se usan comúnmente para almacenar árboles filogenéticos en R. El árbol se puede embellecer fácilmente en profundidad usando el paquete ggtree
. El árbol también se puede generar mediante write_taxTree(), combinarlo con el paquete itol.toolkit y embellecerlo con iTOL.
Hadley Wickham. https://github.com/tidyverse/tidyverse
G Yu, DK Smith, H Zhu, Y Guan, TTY Lam (2017). ggtree: un paquete R para visualización y anotación de árboles filogenéticos con sus covariables y otros datos asociados. Métodos en ecología y evolución, 8(1):28-36. https://doi.org/10.1111/2041-210X.12628
La documentación en inglés está disponible en: https://github.com/nongxinshengxin/taxtree
La documentación china está disponible en - 微信公众号农心生信工作室
Por favor, cuando utilice taxtree
, cítenos utilizando la referencia: https://github.com/nongxinshengxin/taxtree
Correo electrónico: [email protected]
Cuenta oficial de WeChat: