Nous avons une nouvelle ressource bioinformatique qui remplace la fonctionnalité de ce projet ! Consultez notre nouveau référentiel ici : remora.
Ce référentiel n'est désormais plus pris en charge et nous déconseillons son utilisation. Veuillez contacter Oxford Nanopore : [email protected] pour obtenir de l'aide concernant votre application s'il n'est pas possible de mettre à niveau.
Tombo est une suite d'outils principalement destinés à l'identification de nucléotides modifiés à partir de données de séquençage de nanopores. Tombo fournit également des outils pour l'analyse et la visualisation du signal brut des nanopores.
Une documentation détaillée de toutes les commandes et algorithmes Tombo peut être trouvée sur la page de documentation Tombo.
Installation de Conda (méthode préférée)
# installer via l'environnement bioconda (https://bioconda.github.io/#set-up-channels) conda install -c bioconda ont-tombo
La première étape de toute analyse Tombo consiste à re-gribouiller (alignement du signal brut sur la séquence de référence) les lectures brutes de nanopores. Cela crée un index et stocke les alignements de signaux bruts nécessaires pour effectuer des analyses en aval.
Dans cet exemple, un échantillon d'E. coli est testé pour la méthylation du barrage et du dcm (modèle CpG également disponible pour l'analyse humaine). À l’aide de ces résultats, le signal brut est tracé aux positions DCM les plus significativement modifiées et les prédictions de base modifiées par le barrage sont sorties dans un fichier Wiggle pour être utilisées dans le traitement en aval ou la visualisation dans un navigateur génomique.
tombo resquiggle path/to/fast5s/genome.fasta --processes 4 --num-most-common-errors 5 tombo detector_modifications alternative_model --fast5-basedirs chemin/vers/fast5s/ --statistics-file-basename native.e_coli_sample --bases alternatives barrage dcm --processus 4 # tracer le signal brut aux emplacements DCM les plus importants tombo plot most_significant --fast5-basedirs chemin/vers/fast5s/ --statistics-filename native.e_coli_sample.dcm.tombo.stats --plot-standard-model --plot-alternate-model dcm --pdf-filename sample.most_significant_dcm_sites.pdf # produit un fichier de perruque avec une fraction estimée des lectures modifiées sur chaque site de référence valide tombo text_output browser_files --statistics-filename native.e_coli_sample.dam.tombo.stats --file-types amorti_fraction --browser-file-basename native.e_coli_sample.dam # produit également un fichier de couverture des lectures traitées avec succès pour référence tombo text_output browser_files --fast5-basedirs chemin/vers/fast5s/ --file-types couverture --browser-file-basename native.e_coli_sample
Alors que les modèles de motifs ( CpG
, dcm
et dam
; les plus précis) et les modèles de base alternatifs spécifiques à tous les contextes ( 5mC
et 6mA
; plus précis) sont préférés, Tombo permet également aux utilisateurs d'étudier d'autres modifications de base, voire inconnues.
Voici deux exemples de commandes exécutant la méthode de_novo
(détecter les écarts par rapport aux niveaux de signal canonique attendus) et la méthode level_sample_compare
(détecter l'écart des niveaux de signal entre deux échantillons d'intérêt ; fonctionne mieux avec une couverture élevée).
tombo detector_modifications de_novo --fast5-basedirs chemin/vers/fast5s/ --statistics-file-basename sample.de_novo_detect --processes 4 tombo text_output browser_files --statistics-filename sample.de_novo_detect.tombo.stats --browser-file-basename sample.de_novo_detect --file-types amorti_fraction tombo detector_modifications level_sample_compare --fast5-basedirs chemin/vers/fast5s/ --control-fast5-basedirs chemin/vers/control/fast5s/ --minimum-test-reads 50 --processes 4 --statistics-file-basename sample.level_samp_comp_detect tombo text_output browser_files --statistics-filename sample.level_samp_comp_detect.tombo.stats --browser-file-basename sample.level_samp_comp_detect --file-types statistique
Voir des didacticiels plus complets sur la page de documentation.
Tombo est disponible pour l'installation via pip, mais nécessite une installation R ainsi que les dépendances du package R (ggplot2 et gridextra) pour toutes les fonctions de visualisation.
# installer le package pip (installation numpy requise avant tombo pour l'optimisation de cython) pip installer numpy pip install ont-tombo[complet]
Tombo peut également être installé directement à partir des sources (principalement pour le développement) en exécutant les commandes suivantes :
clone git https://github.com/nanoporetech/tombo cd tombo pip install -e .
Tombo ne prend pas en charge les fichiers de données à lecture multiple au format FAST5. Veuillez utiliser la commande multi_to_single_fast5
du package ont_fast5_api afin de convertir au format FAST5 à lecture unique avant le traitement avec Tombo.
© 2017-18 Oxford Nanopore Technologies Ltd.
Tombo est distribué selon les termes de la licence MPL2 incluse.
Stoiber, MH et coll. Identification de novo des modifications de l'ADN activées par le traitement du signal nanopore guidé par le génome. bioRxiv (2016).
http://biorxiv.org/content/early/2017/04/10/094672