O Banco de Dados de Taxonomia é uma classificação e nomenclatura com curadoria para todos os organismos nos bancos de dados de sequências públicas. Isso representa atualmente cerca de 10% das espécies de vida descritas no planeta. O endereço oficial do banco de dados de taxonomia do NCBI é https://www.ncbi.nlm.nih.gov/taxonomy e o endereço de download de dados públicos é https://ftp.ncbi.nih.gov/pub/taxonomy/. taxtree
é usado para gerar uma topologia filogenética de unidades taxonômicas (taxa) com base no banco de dados Taxonomia processando nomes.dmp e nós.dmp e desenhando árvores evolutivas simples com base na hierarquia de táxons. A implementação da função taxtree
depende de tidyverse
e ggtree
. Atualmente, taxtree
permite que 768.430 táxons do banco de dados de taxonomia sejam usados para construir a topologia de uma árvore filogenética.
Classificações | táxons superiores | gênero | espécies | táxons mais baixos | total |
---|---|---|---|---|---|
Arqueia | 610 | 264 | 878 | 0 | 1.752 |
Bactérias | 5.897 | 5.005 | 24.761 | 952 | 36.615 |
Eucariotos | 67.028 | 98.600 | 515.880 | 36.640 | 718.148 |
Fungos | 6.009 | 7.437 | 55.840 | 1.571 | 70.857 |
Metazoários | 48.564 | 70.320 | 270.261 | 18.292 | 407.437 |
Vírus | 2.064 | 2.587 | 7.180 | 65 | 11.896 |
Bactérias | 5.897 | 5.005 | 24.761 | 952 | 36.615 |
Todos os táxons | 75.630 | 106.458 | 548.685 | 37.657 | 768.430 |
Antes de instalar, você precisará baixar o pacote de dependência taxtree
ggtree
do BiocManager
.
if (!require("BiocManager"))
install.packages("BiocManager")
library(BiocManager)
if (!require("ggtree"))
BiocManager::install("ggtree")
Instale devtools
, que é usado para instalar pacotes R do GitHub.
if (!require("devtools"))
install.packages("devtools")
Depois de concluir as etapas acima, inicie a instalação.
devtools::install_github("nongxinshengxin/taxtree")
taxtree
tem seis funções principais .
make_Taxtree() Se você tiver alguns nomes de táxons definidos (seja Reino Filo Classe Ordem Família Gênero Espécies ou qualquer outro nó taxonômico), você pode usar esta função para construir sua topologia taxonômica a partir de uma lista de nomes de táxons.
find_Lineage() Por um nome de táxon explícito, todas as linhagens taxonômicas sob esse taxno são encontradas.
name2rank() Se você tiver alguns nomes de táxons definidos (seja Reino Filo Classe Ordem Família Gênero Espécies ou qualquer outro nó taxonômico), você pode usar esta função para obter o nome da classificação da taxonomia (e taxid) com base no nome dos táxons.
name2rank_str() Se você tiver alguns nomes de táxons definidos (seja Reino Filo Classe Ordem Família Gênero Espécies ou qualquer outro nó taxonômico), você pode usar esta função para obter o nome da classificação da taxonomia (e taxid) com base no nome dos táxons. Você pode inserir uma única string ou um vetor contendo várias strings nesta função.
plot_taxTree() Desenhando uma árvore de taxonomia simples baseada no pacote ggtree
.
write_taxTree() Esta função escreve em um arquivo uma árvore entre parênteses usando o formato Newick, baseado em pacotes ape
.
Anotação de espécies baseada em OTUs, permitindo a construção de sua topologia filogenética com base nos nomes dos táxons obtidos na anotação, utilizando a função make_Taxtree();
Realização de estudos taxonômicos. Curioso sobre os parentes próximos dos humanos da ordem Primatas? find_Lineage("Primates") é um comando de uma linha que lhe dará a resposta;
Espécies do gênero da família da ordem do filo fronteiriço, a classificação é muito complicada. name2rank(), name2rank_str(), basta fornecer o nome do táxon e ele informará sua classificação taxonômica;
Super ligação. taxtree
é baseado no banco de dados Taxonomy e pode ser vinculado ao software TaxonKit ; além disso, taxtree gera classes filo S3, que são comumente usadas para armazenar árvores filogenéticas em R. A árvore pode ser facilmente embelezada em profundidade usando o pacote ggtree
. A árvore também pode ser gerada via write_taxTree(), combinada com o pacote itol.toolkit e embelezada com iTOL.
Hadley Wickham. https://github.com/tidyverse/tidyverse
G Yu, DK Smith, H Zhu, Y Guan, TTY Lam (2017). ggtree: um pacote R para visualização e anotação de árvores filogenéticas com suas covariáveis e outros dados associados. Métodos em Ecologia e Evolução, 8(1):28-36. https://doi.org/10.1111/2041-210X.12628
A documentação em inglês está disponível em - https://github.com/nongxinshengxin/taxtree
A documentação chinesa está disponível em - 微信公众号农心生信工作室
Por favor, ao usar taxtree
, cite-nos usando a referência: https://github.com/nongxinshengxin/taxtree
E-mail: [email protected]
Conta oficial do Wechat: