분류 데이터베이스 는 공개 서열 데이터베이스의 모든 유기체에 대해 선별된 분류 및 명명법입니다. 이는 현재 지구상에 설명된 생명체 종의 약 10%를 차지합니다. NCBI 분류법 데이터베이스의 공식 주소는 https://www.ncbi.nlm.nih.gov/taxonomy이고 공개 데이터 다운로드 주소는 https://ftp.ncbi.nih.gov/pub/taxonomy/입니다. taxtree
names.dmp 및 node.dmp를 처리하고 분류군 계층을 기반으로 간단한 진화 트리를 그려 분류학 데이터베이스를 기반으로 분류학 단위(분류군)의 계통발생적 토폴로지를 생성하는 데 사용됩니다. taxtree
기능의 구현은 tidyverse
및 ggtree
에 의존합니다. 현재 taxtree
사용하면 분류 데이터베이스의 768,430 개 분류군을 사용하여 계통발생수의 토폴로지를 구성할 수 있습니다.
순위 | 더 높은 분류군 | 속 | 종 | 낮은 분류군 | 총 |
---|---|---|---|---|---|
고고학 | 610 | 264 | 878 | 0 | 1,752 |
박테리아 | 5,897 | 5,005 | 24,761 | 952 | 36,615 |
진핵생물 | 67,028 | 98,600 | 515,880 | 36,640 | 718,148 |
진균류 | 6,009 | 7,437 | 55,840 | 1,571 | 70,857 |
후생동물 | 48,564 | 70,320 | 270,261 | 18,292 | 407,437 |
바이러스 | 2,064 | 2,587 | 7,180 | 65 | 11,896 |
박테리아 | 5,897 | 5,005 | 24,761 | 952 | 36,615 |
모든 분류군 | 75,630 | 106,458 | 548,685 | 37,657 | 768,430 |
설치하기 전에 BiocManager
의 taxtree
종속성 패키지 ggtree
다운로드해야 합니다.
if (!require("BiocManager"))
install.packages("BiocManager")
library(BiocManager)
if (!require("ggtree"))
BiocManager::install("ggtree")
GitHub에서 R 패키지를 설치하는 데 사용되는 devtools
설치합니다.
if (!require("devtools"))
install.packages("devtools")
위의 단계를 완료한 후 설치를 시작합니다.
devtools::install_github("nongxinshengxin/taxtree")
taxtree
6가지 핵심 기능이 있습니다.
make_Taxtree() 명확한 분류군 이름(왕국 문 클래스 목과 속 종 또는 기타 분류학적 노드)이 있는 경우 이 함수를 사용하여 분류군 이름 목록에서 분류학적 토폴로지를 구성할 수 있습니다.
find_Lineage() 명시적인 분류 이름을 통해 해당 분류 번호 아래의 모든 분류 계보를 찾습니다.
name2rank() 명확한 분류군 이름(왕국문강목 과속 종 또는 기타 분류학적 노드)이 있는 경우 이 함수를 사용하여 분류군 이름을 기반으로 분류학 순위 이름(및 택시드)을 얻을 수 있습니다.
name2rank_str() 명확한 분류군 이름(왕국문강목과속종 또는 기타 분류학적 노드)이 있는 경우 이 함수를 사용하여 분류군 이름을 기반으로 분류학 순위 이름(및 택시드)을 얻을 수 있습니다. 이 함수에는 단일 문자열이나 여러 문자열을 포함하는 벡터를 입력할 수 있습니다.
plot_taxTree() ggtree
패키지를 기반으로 간단한 분류 트리를 그립니다.
write_taxTree() 이 함수는 ape
패키지를 기반으로 Newick 형식을 사용하여 괄호 형식으로 트리를 파일에 씁니다.
OTU를 기반으로 한 종 주석으로, make_Taxtree() 함수를 사용하여 주석에서 얻은 분류군의 이름을 기반으로 계통발생적 토폴로지를 구성할 수 있습니다.
분류학 연구를 수행합니다. 영장류목에 속하는 인간의 가까운 친척에 대해 궁금하십니까? find_Lineage("Primates")는 답을 제공하는 한 줄 명령입니다.
Border Phylum Order Family Genus 종, 분류가 너무 복잡합니다. name2rank(), name2rank_str(), 분류군의 이름만 제공하면 분류학적 순위를 알려줍니다.
슈퍼링크. taxtree
Taxonomy 데이터베이스를 기반으로 하며 TaxonKit 소프트웨어 에 연결될 수 있습니다. 또한 Taxtree는 R에서 계통 발생 나무를 저장하는 데 일반적으로 사용되는 S3 문 클래스를 생성합니다. 나무는 ggtree
패키지를 사용하여 깊이 있게 쉽게 꾸밀 수 있습니다. 트리는 itol.toolkit 패키지 와 결합되고 iTOL로 장식된 write_taxTree()를 통해 출력될 수도 있습니다.
해들리 위컴. https://github.com/tidyverse/tidyverse
G Yu, DK Smith, H Zhu, Y Guan, TTY Lam(2017). ggtree: 공변량 및 기타 관련 데이터가 포함된 계통 발생 수의 시각화 및 주석을 위한 R 패키지입니다. 생태학과 진화의 방법, 8(1):28-36. https://doi.org/10.1111/2041-210X.12628
영어 문서는 https://github.com/nongxinshengxin/taxtree에서 확인할 수 있습니다.
중국어 문서는 微信公众号农心生信工事室에서 볼 수 있습니다.
taxtree
사용하는 경우 https://github.com/nongxinshengxin/taxtree 참조를 사용하여 인용해 주세요.
이메일: [email protected]
위챗 공식 계정: