¡Tenemos un nuevo recurso bioinformático que reemplaza la funcionalidad de este proyecto! Vea nuestro nuevo repositorio aquí: remora.
Este repositorio ahora no es compatible y no recomendamos su uso. Comuníquese con Oxford Nanopore: [email protected] para obtener ayuda con su aplicación si no es posible actualizarla.
Tombo es un conjunto de herramientas principalmente para la identificación de nucleótidos modificados a partir de datos de secuenciación de nanoporos. Tombo también proporciona herramientas para el análisis y visualización de señales de nanoporos sin procesar.
Puede encontrar documentación detallada para todos los comandos y algoritmos de Tombo en la página de documentación de Tombo.
Instalación de Conda (método preferido)
# instalar a través del entorno bioconda (https://bioconda.github.io/#set-up-channels) instalación de conda -c bioconda ont-tombo
El primer paso en cualquier análisis Tombo es volver a garabatear (señal sin procesar para hacer referencia a la alineación de la secuencia) lecturas de nanoporos sin procesar. Esto crea un índice y almacena las alineaciones de señales sin procesar necesarias para realizar análisis posteriores.
En este ejemplo, se analiza una muestra de E. coli para determinar la metilación de dam y dcm (el modelo CpG también está disponible para análisis en humanos). Utilizando estos resultados, la señal sin procesar se traza en las posiciones dcm modificadas más significativamente y las predicciones de la base modificada se envían a un archivo de movimiento para su uso en el procesamiento posterior o visualización en un navegador del genoma.
tombo requiggle ruta/a/fast5s/ genome.fasta --procesos 4 --num-most-common-errors 5 tombo detect_modifications modelo_alternativo --fast5-basedirs ruta/a/fast5s/ --nombre-base-archivo-estadísticas nativo.e_coli_sample --bases alternativas presa dcm --procesos 4 # trazar la señal sin procesar en las ubicaciones de dcm más importantes gráfico de tombo most_significant --fast5-basedirs ruta/a/fast5s/ --nombre de archivo de estadísticas nativo.e_coli_sample.dcm.tombo.stats --plot-modelo-estándar --plot-modelo-alterno dcm --pdf-nombre de archivo muestra.most_significant_dcm_sites.pdf # produce un archivo peluca con una fracción estimada de lecturas modificadas en cada sitio de referencia válido tombo text_output browser_files --estadísticas-nombre de archivo nativo.e_coli_sample.dam.tombo.stats --tipos de archivo fracción_amortiguada --nombre-base-del-archivo-del-navegador nativo.e_coli_sample.dam # también produce un archivo de cobertura de lecturas procesadas exitosamente como referencia tombo text_output browser_files --fast5-basedirs ruta/a/fast5s/ --cobertura de tipos de archivos --nombre-base-de-archivo-navegador nativo.e_coli_sample
Si bien se prefieren los modelos de motivos ( CpG
, dcm
y dam
; más precisos) y modelos de base alternativos específicos para todo contexto ( 5mC
y 6mA
; más precisos), Tombo también permite a los usuarios investigar otras modificaciones de bases o incluso desconocidas.
A continuación se muestran dos comandos de ejemplo que ejecutan el método de_novo
(detectar desviaciones de los niveles de señal canónicos esperados) y el método level_sample_compare
(detectar desviación en los niveles de señal entre dos muestras de interés; funciona mejor con una cobertura alta).
tombo detect_modifications de_novo --fast5-basedirs ruta/a/fast5s/ --nombre-base-archivo-estadísticas sample.de_novo_detect --procesos 4 tombo text_output browser_files --estadísticas-nombre de archivo sample.de_novo_detect.tombo.stats --browser-file-basename sample.de_novo_detect --file-types humedecido_fracción tombo detect_modifications nivel_sample_compare --fast5-basedirs ruta/a/fast5s/ --control-fast5-basedirs ruta/a/control/fast5s/ --minimum-test-reads 50 --procesos 4 --nombre-base-del-archivo-de-estadísticas sample.level_samp_comp_detect tombo text_output browser_files --estadísticas-nombre de archivo sample.level_samp_comp_detect.tombo.stats --browser-file-basename sample.level_samp_comp_detect --estadística de tipos de archivos
Vea tutoriales más completos en la página de documentación.
Tombo está disponible para su instalación a través de pip, pero requiere una instalación de R, así como dependencias del paquete R (ggplot2 y gridextra) para todas las funciones de visualización.
# instalar el paquete pip (se requiere una instalación numpy antes de tombo para la optimización de cython) instalación de pip numpy pip instalar ont-tombo [completo]
Tombo también se puede instalar directamente desde el código fuente (principalmente para desarrollo) ejecutando los siguientes comandos:
clon de git https://github.com/nanoporetech/tombo tombo cd instalación de pip -e.
Tombo no admite archivos de datos de lectura en formato FAST5 de lectura múltiple. Utilice el comando multi_to_single_fast5
del paquete ont_fast5_api para convertir al formato FAST5 de lectura única antes de procesar con Tombo.
© 2017-18 Oxford Nanopore Technologies Ltd.
Tombo se distribuye según los términos de la licencia MPL2 incluida.
Stoiber, MH y cols. Identificación de novo de modificaciones del ADN habilitadas mediante el procesamiento de señales de nanoporos guiado por el genoma. bioRxiv (2016).
http://biorxiv.org/content/early/2017/04/10/094672