deviaTE هي أداة بيثون لتحليل وتصور تسلسل العناصر الجينية المتنقلة.
علامة سطر أوامر جديدة --tar
لجمع النتائج والمؤامرات في ملفات tar. مفيد في حالة تحليل الكثير من تسلسلات TE
تمت إضافة بيانات اختبار ثقب النانو واختبارات الوحدة
تم إصلاح مشكلة أزواج القراءة المتسلسلة التي لها نفس الاسم. يستخدم هذا لطلب تشغيل scripts/rename_reads.py
لجعل الأسماء فريدة. يتم الآن التعامل مع هذا الأمر داخليًا، لذا لم يعد استخدام البرنامج النصي ضروريًا.
علامة سطر أوامر جديدة --no_viz
لمنع التصور إذا لم تكن هناك حاجة إليها
تحسينات الكفاءة الداخلية
الاستخدام الثابت لملفات الإدخال المضغوطة، بما في ذلك حالات الاختبار الجديدة
منذ أن وصلت قاعدة بايثون السابقة إلى نهاية عمرها الافتراضي، كان deviaTE بحاجة إلى التحديث. أصبح هذا التحديث كبيرًا جدًا - ومن ثم انتقل إلى الإصدار 2:
إهمال الميزة:
يحتاج deviaTE إلى python >=3.10 والنقطة:
pip install deviaTE
usage: deviaTE [-h] [--input INPUT] [--preset {sr,map-ont,map-pb,map-hifi}] [--library LIBRARY] [--annotation ANNOTATION] [--min_align_len MIN_ALIGN_LEN] [--families [FAMILIES ...]] [--no_viz] [-v] [--rpm | --single_copy_genes [SINGLE_COPY_GENES ...]]
options:
-h, --help show this help message and exit
--input INPUT Input file(s) to be analysed. Can be *.fastq, *.fa, or directory of files. Optionally gzipped.
--preset {sr,map-ont,map-pb,map-hifi} Minimap2 mapping preset. (sr, map-ont, map-pb, map-hifi) [sr]
--library LIBRARY Path to reference library. Defaults to drosophila transposons from https://github.com/bergmanlab/drosophila-transposons
--annotation ANNOTATION Path to annotation (gff) of sequences in library. Defaults to drosophila TE annotation from https://github.com/bergmanlab/drosophila-transposons
--min_align_len MIN_ALIGN_LEN Minimum length of valid alignments
--families [FAMILIES ...] Which transposon families to analyse. Default: all sequences in library.
--no_viz Only analyse, but don't visualize the results
-v, --version Show version information and exit.
--rpm normalize all abundances by reads per million
--single_copy_genes [SINGLE_COPY_GENES ...] space-separated names of single-copy genes in reference to use for normalisation
DeviaTE هو برنامج سطر أوامر يقوم بتحليل وتصور تنوع العناصر الوراثية المتنقلة من بيانات التسلسل دون الحاجة إلى جينوم مُجمَّع للأنواع المضيفة. الوسيطة الوحيدة المطلوبة هي --input
. لهذا، فإنه يأخذ بيانات التسلسل ( --input
ملف واحد أو دليل الملفات). يمكن استخدامه مع القراءات القصيرة والطويلة ( --preset
، الإعداد المسبق لمعلمة minimap2 للقراءات القصيرة [sr]، أو القراءات النانوية [map-ont] أو pacbio [map-pb، Map-hifi]). كما يتطلب أيضًا تسلسلات توافقية للعناصر الجينية المتنقلة ( --library
، ملف fasta). إذا لم يتم إعطاء أي مكتبة فسوف تستخدم تسلسلات ذبابة الفاكهة من https://github.com/bergmanlab/drosophila-transposons. يتم تحديد TEs المراد تحليلها باستخدام --families
. يمكن أن تكون هذه التسلسلات متعددة (مفصولة بمسافات) أو إذا لم يتم تحديدها، يتم استخدام جميع التسلسلات المرجعية في المكتبة.
يتم إدراج الوسائط المتاحة مع -h
أو --help
.
مثال متاح للاختبار. التسلسلات مأخوذة من اتحاد ذبابة الفاكهة 12 جينوم وآخرون. 2007. تطور الجينات والجينومات في سلالة ذبابة الفاكهة. طبيعة . 450(7167):203-218.
يمكننا تحليل الفارس TE (DMLINEJA) والحصول على تصور باستخدام:
deviaTE --input ../data/jockey_dmel.fastq --families FBte0000088
يؤدي هذا إلى إنشاء ملف محاذاة يسمى jockey_dmel.fastq.paf
، وإنشاء جدول الإخراج jockey_dmel.fastq.FBte0000088.deviate
مع معلومات حول التغطية والإدراجات المقدرة (إذا تم تحديدها)، والتصور jockey_dmel.fastq.FBte0000088.deviate.pdf
.
يمكن العثور على الدليل الإرشادي والإرشادات التفصيلية للإصدارات السابقة (على رابط جيثب هذا)
يبدأ الجدول ببعض خطوط الرأس التي يُشار إليها بالرمز #. يحتوي هذا الرأس على العدد المقدر لإدخالات TE (إذا تم تحديدها) وأسماء الأعمدة. يتوافق كل صف مع موضع واحد من تسلسل TE. منذ الإصدار 2، أبلغ hq_cov
عن تغطية قواعد عالية الجودة بدلاً من التعيينات عالية الجودة، نظرًا لأن ذلك أكثر إثارة للاهتمام، على سبيل المثال، بالنسبة لبيانات المسام النانوية.
عمود | وصف |
---|---|
TEfam | اسم عائلة TE التي تم تحليلها |
sample_id | اسم ملف الإدخال |
pos | الموقف في التسلسل المرجعي |
refbase | النوكليوتيدات في التسلسل المرجعي في هذا الموقف |
ACGT | عدد كل النيوكليوتيدات في هذا الموقف |
cov | التغطية الشاملة في هذا الموقف |
hq_cov | تغطية القواعد عالية الجودة فقط (>س15) |
snp | مؤشر لموقف البديل |
delet | عدد ملاحظات الفجوة |
بشكل افتراضي، لا يتم إجراء أي تطبيع وتكون الأعداد المُبلغ عنها عبارة عن وفرة خام، وهي غير مناسبة لمقارنة TEs بين العينات. لذلك يتم تنفيذ استراتيجيتين مختلفتين، التطبيع لكل مليون قراءة معيّنة والتطبيع بواسطة الجينات ذات النسخة الواحدة.
--rpm
.--library
. ثم أضف --single_copy_genes GENE1 GENE2 GENE3 ...
حيث GENE1 وما إلى ذلك هي الرؤوس الموجودة في ملف المكتبة. تتم كتابة رقم النسخة المقدرة لكل جينوم أحادي الصيغة الصبغية في قسم الرأس لجدول الإخراج الناتج. إذا كنت تقوم بتحليل TEs في ذبابة الفاكهة، فإن تحديد --library
أو --annotation
للتسلسلات المرجعية أمر اختياري. افتراضيًا، يقوم deviaTE بتنزيل مكتبة TE واستخدامها تلقائيًا من https://github.com/bergmanlab/drosophila-transposons إذا لم يتم توفير مكتبة وتعليقات توضيحية.
لتطبيع الجينات ذات النسخة الواحدة في ذبابة الفاكهة، تتم إضافة خمسة جينات تلقائيًا إلى المكتبة (Dmel_rpl32، Dmel_piwi، Dmel_Act5C، Dmel_RpII140 وDmel_p53)، والتي يمكن استخدامها للتطبيع:
--single_copy_genes Dmel_rpl32 Dmel_piwi ...
يمكنك استخدام DeviaTE للقراءات المزدوجة عن طريق تعيينها في وضع القراءة الفردي.
يمكن القيام بذلك، على سبيل المثال، باستخدام ملف fastq متسلسل واحد يحتوي على كلا أزواج القراءة (read1 وread2). (لم يعد استخدام البرنامج النصي scripts/rename_reads.py
لإعطاء أسماء فريدة للزملاء ضروريًا، ويتم ذلك داخليًا منذ 2.2.0)
تتوفر ورقة تصف deviaTE هنا: https://onlinelibrary.wiley.com/doi/10.1111/1755-0998.13030
@article{weilguny2019,
title = {{{DeviaTE}}: {{Assembly-free}} Analysis and Visualization of Mobile Genetic Element Composition},
author = {Weilguny, Lukas and Kofler, Robert},
year = {2019},
journal = {Molecular Ecology Resources},
volume = {19},
number = {5},
pages = {1346--1354},
doi = {10.1111/1755-0998.13030}
}
إذا وجدت أي مشاكل، أو كانت لديك أسئلة أو أفكار لمزيد من التحسين، فيرجى استخدام أداة تعقب المشكلات في هذا المستودع، شكرًا!
تم ترخيص deviaTE بموجب ترخيص GPLv3
الكود مغطى بـ pytests. لتشغيل هذه التثبيتات: pip install pytest pytest-cov
. ثم قم بإجراء الاختبارات: cd tests; pytest --cov --cov-report html
. لاختبار الإصدارات المحلية: hatch build && pip install dist/deviate-2.2.0-py3-none-any.whl --force-reinstall --no-deps