قاعدة بيانات التصنيف عبارة عن تصنيف وتسميات منسقة لجميع الكائنات الحية الموجودة في قواعد بيانات التسلسل العامة. ويمثل هذا حاليًا حوالي 10% من أنواع الحياة الموصوفة على هذا الكوكب. العنوان الرسمي لقاعدة بيانات تصنيف NCBI هو https://www.ncbi.nlm.nih.gov/taxonomy وعنوان تنزيل البيانات العامة هو https://ftp.ncbi.nih.gov/pub/taxonomy/. يتم استخدام taxtree
لإنشاء طوبولوجيا النشوء والتطور للوحدات التصنيفية (الأصناف) بناءً على قاعدة بيانات التصنيف عن طريق معالجة names.dmp و nodes.dmp ورسم أشجار تطورية بسيطة بناءً على التسلسل الهرمي للأصناف. يعتمد تنفيذ وظيفة taxtree
على tidyverse
و ggtree
. حاليًا، تسمح taxtree
باستخدام 768,430 نوعًا من قاعدة بيانات التصنيف لبناء طوبولوجيا شجرة النشوء والتطور.
صفوف | تصنيفات أعلى | جنس | صِنف | تصنيفات أقل | المجموع |
---|---|---|---|---|---|
العتائق | 610 | 264 | 878 | 0 | 1,752 |
البكتيريا | 5,897 | 5,005 | 24,761 | 952 | 36,615 |
حقيقيات النوى | 67,028 | 98,600 | 515,880 | 36,640 | 718,148 |
الفطريات | 6,009 | 7,437 | 55,840 | 1,571 | 70,857 |
ميتازوا | 48,564 | 70,320 | 270,261 | 18,292 | 407,437 |
الفيروسات | 2,064 | 2,587 | 7,180 | 65 | 11,896 |
البكتيريا | 5,897 | 5,005 | 24,761 | 952 | 36,615 |
جميع الأصناف | 75,630 | 106,458 | 548,685 | 37,657 | 768,430 |
قبل التثبيت، ستحتاج إلى تنزيل حزمة تبعية taxtree
ggtree
بواسطة BiocManager
.
if (!require("BiocManager"))
install.packages("BiocManager")
library(BiocManager)
if (!require("ggtree"))
BiocManager::install("ggtree")
قم بتثبيت devtools
، والتي تُستخدم لتثبيت حزم R من GitHub.
if (!require("devtools"))
install.packages("devtools")
بمجرد الانتهاء من الخطوات المذكورة أعلاه، ابدأ التثبيت.
devtools::install_github("nongxinshengxin/taxtree")
لدى taxtree
ست وظائف أساسية .
make_Taxtree() إذا كان لديك بعض أسماء الأصناف المحددة (إما المملكة Phylum Class Order Family Genus Species أو أي عقدة تصنيفية أخرى)، فيمكنك استخدام هذه الوظيفة لإنشاء طوبولوجيا التصنيف الخاصة بها من قائمة أسماء الأصناف.
find_Lineage() من خلال اسم تصنيف واضح، تم العثور على جميع الأنساب التصنيفية ضمن هذا التصنيف.
name2rank() إذا كان لديك بعض أسماء الأصناف المحددة (إما نوع المملكة أو فئة رتبة الأسرة أو أي عقدة تصنيفية أخرى)، فيمكنك استخدام هذه الوظيفة للحصول على اسم رتبة التصنيف (وتصنيفها) بناءً على اسم الصنف.
name2rank_str() إذا كان لديك بعض أسماء الأصناف المحددة (إما نوع عائلة صنف المملكة أو أي عقدة تصنيفية أخرى)، فيمكنك استخدام هذه الوظيفة للحصول على اسم رتبة التصنيف (وتصنيفها) بناءً على اسم الصنف. يمكنك إدخال سلسلة واحدة أو متجه يحتوي على سلاسل متعددة في هذه الوظيفة.
plot_taxTree() رسم شجرة تصنيف بسيطة بناءً على حزمة ggtree
.
write_taxTree() هذه الوظيفة تكتب شجرة في ملف بتنسيق قوسين باستخدام تنسيق Newick، استنادًا إلى حزم ape
.
شرح الأنواع استنادًا إلى وحدات OTU، مما يسمح ببناء طوبولوجيا النشوء والتطور الخاصة بها استنادًا إلى أسماء الأصناف التي تم الحصول عليها من التعليق التوضيحي، باستخدام وظيفة make_Taxtree()؛
إجراء الدراسات التصنيفية. هل تشعر بالفضول تجاه أقرباء البشر تحت رتبة الرئيسيات؟ find_Lineage("Primates") هو أمر من سطر واحد سيعطيك الإجابة؛
ترتيب الأسرة الحدودية جنس الأنواع، التصنيف معقد للغاية. name2rank(), name2rank_str()، ما عليك سوى تقديم اسم الصنف وسيخبرك برتبته التصنيفية؛
الارتباط الفائق. يعتمد taxtree
على قاعدة بيانات التصنيف ويمكن ربطه ببرنامج TaxonKit ؛ أيضًا، تنشئ Taxtree فئات S3 phylo، والتي تُستخدم عادةً لتخزين أشجار النشوء والتطور في R. ويمكن تزيين الشجرة بعمق بسهولة باستخدام حزمة ggtree
. يمكن أيضًا إخراج الشجرة عبر write_taxTree()، ودمجها مع الحزمة itol.toolkit وتزيينها بـ iTOL.
هادلي ويكهام. https://github.com/tidyverse/tidyverse
جي يو، دي كيه سميث، إتش تشو، واي جوان، تي تي واي لام (2017). ggtree: حزمة R للتصور والتعليق التوضيحي لأشجار النشوء والتطور مع متغيراتها والبيانات الأخرى المرتبطة بها. طرق في علم البيئة والتطور، 8(1):28-36. https://doi.org/10.1111/2041-210X.12628
الوثائق الإنجليزية متاحة في - https://github.com/nongxinshengxin/taxtree
الوثائق الصينية متاحة في - 微信公众号农心生信工作室
من فضلك، عند استخدام taxtree
، استشهد بنا باستخدام المرجع: https://github.com/nongxinshengxin/taxtree
البريد الإلكتروني: [email protected]
حساب وي شات الرسمي: