У нас появился новый биоинформатический ресурс, заменяющий функционал данного проекта! Смотрите наш новый репозиторий здесь: remora.
Этот репозиторий сейчас не поддерживается, и мы не рекомендуем его использовать. Пожалуйста, свяжитесь с Oxford Nanopore: [email protected] для получения помощи с вашим приложением, если обновление невозможно.
Tombo — это набор инструментов, предназначенный в первую очередь для идентификации модифицированных нуклеотидов по данным секвенирования нанопор. Tombo также предоставляет инструменты для анализа и визуализации необработанного сигнала нанопор.
Подробную документацию по всем командам и алгоритмам Tombo можно найти на странице документации tombo.
Установка Conda (предпочтительный метод)
# установить через среду bioconda (https://bioconda.github.io/#set-up-channels) установка conda -c bioconda ont-tombo
Первым шагом в любом анализе Tombo является повторная закорючка (выравнивание необработанного сигнала для выравнивания эталонной последовательности) необработанных считываний нанопор. При этом создается индекс и сохраняются выравнивания необработанных сигналов, необходимые для выполнения последующего анализа.
В этом примере образец E. coli тестируется на метилирование dam и dcm (модель CpG также доступна для анализа на людях). Используя эти результаты, необработанный сигнал строится в наиболее значительно измененных положениях dcm, а базовые прогнозы, измененные плотиной, выводятся в файл покачивания для использования в последующей обработке или визуализации в браузере генома.
tombo resquiggle path/to/fast5s/genome.fasta --processes 4 --num-most-common-errors 5 tombo обнаружение_модификаций альтернативная_модель --fast5-basedirs path/to/fast5s/ --statistics-file-basename own.e_coli_sample --alternate-bases dam dcm --processes 4 # построить необработанный сигнал в наиболее важных местах dcm tomboplot Most_significant --fast5-basedirs путь/к/fast5s/ --statistics-filename own.e_coli_sample.dcm.tombo.stats --plot-standard-model --plot-alternate-model dcm --pdf-имя файла sample.most_significant_dcm_sites.pdf # создает файл wig с расчетной долей измененных чтений на каждом действительном ссылочном сайте tombo text_output Browser_files --statistics-имя_файла Native.e_coli_sample.dam.tombo.stats --file-types dumpened_fraction --browser-file-basename own.e_coli_sample.dam # также создать файл покрытия успешно обработанных операций чтения для справки tombo text_output Browser_files --fast5-basedirs путь/к/fast5s/ --охват типов файлов --browser-file-basenamenative.e_coli_sample
Хотя модели мотивов ( CpG
, dcm
и dam
; наиболее точные) и альтернативные базовые модели для всех контекстов ( 5mC
и 6mA
; более точные) являются предпочтительными, Tombo также позволяет пользователям исследовать другие или даже неизвестные базовые модификации.
Вот два примера команд, запускающих метод de_novo
(обнаружение отклонений от ожидаемых канонических уровней сигнала) и метод level_sample_compare
(обнаружение отклонения уровней сигнала между двумя интересующими выборками; лучше всего работает при большом охвате).
tomboDetect_modifications de_novo --fast5-basedirs путь/к/fast5s/ --statistics-file-basename sample.de_novo_detect --processes 4 tombo text_output Browser_files --statistics-filename sample.de_novo_detect.tombo.stats --browser-file-basename sample.de_novo_detect --file-types dumpened_fraction tomboDetect_modifications level_sample_compare --fast5-basedirs путь/к/fast5s/ --control-fast5-basedirs путь/к/control/fast5s/ --minimum-test-reads 50 --processes 4 --statistics-file-basename sample.level_samp_comp_detect tombo text_output Browser_files --statistics-filename sample.level_samp_comp_detect.tombo.stats --browser-file-basename sample.level_samp_comp_detect --статистика типов файлов
Более полные руководства см. на странице документации.
Tombo доступен для установки через pip, но требует установки R, а также зависимостей пакета R (ggplot2 и Gridextra) для всех функций визуализации.
# установить пакет pip (для оптимизации cython перед tombo требуется установка numpy) pip установить numpy pip install ont-tombo [полный]
Tombo также можно установить непосредственно из исходного кода (в основном для разработки), выполнив следующие команды:
git-клон https://github.com/nanoporetech/tombo компакт-диск томбо пип установить -e .
Tombo не поддерживает файлы данных чтения формата FAST5 с возможностью многократного чтения. Используйте команду multi_to_single_fast5
из пакета ont_fast5_api, чтобы преобразовать в формат FAST5 с однократным чтением перед обработкой с помощью Tombo.
© 2017-18 Oxford Nanopore Technologies Ltd.
Tombo распространяется на условиях прилагаемой лицензии MPL2.
Штойбер, М.Х. и др. Идентификация de novo модификаций ДНК, обеспечиваемая геномной обработкой сигналов нанопор. биоRxiv (2016).
http://biorxiv.org/content/early/2017/04/10/094672