База данных таксономии представляет собой тщательно подобранную классификацию и номенклатуру всех организмов в общедоступных базах данных последовательностей. В настоящее время это составляет около 10% описанных видов жизни на планете. Официальный адрес базы данных таксономии NCBI — https://www.ncbi.nlm.nih.gov/taxonomy, а общедоступный адрес загрузки данных — https://ftp.ncbi.nih.gov/pub/taxonomy/. taxtree
используется для создания филогенетической топологии таксономических единиц (таксонов) на основе базы данных Taxonomy путем обработки имен.dmp и nodes.dmp и рисования простых эволюционных деревьев на основе иерархии таксонов. Реализация функции taxtree
опирается на tidyverse
и ggtree
. В настоящее время taxtree
позволяет использовать 768 430 таксонов из базы данных таксономии для построения топологии филогенетического дерева.
Звания | высшие таксоны | род | разновидность | низшие таксоны | общий |
---|---|---|---|---|---|
Архея | 610 | 264 | 878 | 0 | 1752 |
Бактерии | 5,897 | 5005 | 24 761 | 952 | 36 615 |
Эукариоты | 67 028 | 98 600 | 515 880 | 36 640 | 718 148 |
Грибы | 6009 | 7,437 | 55 840 | 1571 | 70 857 |
многоклеточные животные | 48 564 | 70 320 | 270 261 | 18 292 | 407 437 |
Вирусы | 2064 | 2587 | 7,180 | 65 | 11 896 |
Бактерии | 5,897 | 5005 | 24 761 | 952 | 36 615 |
Все таксоны | 75 630 | 106 458 | 548 685 | 37 657 | 768 430 |
Перед установкой вам необходимо загрузить пакет зависимостей taxtree
ggtree
от BiocManager
.
if (!require("BiocManager"))
install.packages("BiocManager")
library(BiocManager)
if (!require("ggtree"))
BiocManager::install("ggtree")
Установите devtools
, который используется для установки пакетов R с GitHub.
if (!require("devtools"))
install.packages("devtools")
После того, как вы выполнили вышеуказанные шаги, начните установку.
devtools::install_github("nongxinshengxin/taxtree")
taxtree
имеет шесть основных функций .
make_Taxtree() Если у вас есть определенные названия таксонов (либо королевский тип, класс, порядок, семейство, род, виды, либо любой другой таксономический узел), вы можете использовать эту функцию для построения их таксономической топологии из списка названий таксонов.
find_Lineage() По явному названию таксона находятся все таксономические линии под этим таксоном.
name2rank() Если у вас есть определенные названия таксонов (либо королевский тип, класс, порядок, семейство, род, виды, либо любой другой таксономический узел), вы можете использовать эту функцию для получения названия таксономического ранга (и таксида) на основе названия таксономии.
name2rank_str() Если у вас есть определенные названия таксонов (либо королевский тип, класс, порядок, семейство, род, виды, либо любой другой таксономический узел), вы можете использовать эту функцию для получения названия таксономического ранга (и таксида) на основе названия таксономии. В эту функцию вы можете ввести одну строку или вектор, содержащий несколько строк.
plot_taxTree() Рисование простого дерева таксономии на основе пакета ggtree
.
write_taxTree() Эта функция записывает в файл дерево в формате в скобках, используя формат Ньюика, основанный на пакетах ape
.
Аннотация видов на основе OTU, позволяющая строить их филогенетическую топологию на основе названий таксонов, полученных из аннотации, с помощью функции make_Taxtree();
Проведение таксономических исследований. Хотите узнать о близких родственниках человека из отряда приматов? find_Lineage("Приматы") — это однострочная команда, которая даст вам ответ;
Пограничный тип Отряд Семейство Род Виды, классификация слишком сложна. name2rank(), name2rank_str(), просто укажите название таксона, и он сообщит вам его таксономический ранг;
Супер связка. taxtree
основан на базе данных Taxonomy и может быть связан с программным обеспечением TaxonKit ; Кроме того, Taxtree генерирует фило-классы S3, которые обычно используются для хранения филогенетических деревьев в R. Дерево можно легко украсить с помощью пакета ggtree
. Дерево также можно вывести с помощью write_taxTree() в сочетании с пакетом itol.toolkit и дополнить с помощью iTOL.
Хэдли Уикэм. https://github.com/tidyverse/tidyverse
Г Ю, Д. К. Смит, Х Чжу, И Гуань, TTY Лам (2017). ggtree: пакет R для визуализации и аннотирования филогенетических деревьев с их ковариатами и другими связанными данными. Методы экологии и эволюции, 8(1):28-36. https://doi.org/10.1111/2041-210X.12628
Английская документация доступна по адресу: https://github.com/nongxinshengxin/taxtree.
Документация на китайском языке доступна на языке — 微信公众号农心生信工作室.
Пожалуйста, при использовании taxtree
ссылайтесь на нас, используя ссылку: https://github.com/nongxinshengxin/taxtree
Электронная почта: [email protected]
Официальный аккаунт Wechat: