Wir haben eine neue bioinformatische Ressource, die die Funktionalität dieses Projekts ersetzt! Sehen Sie sich hier unser neues Repository an: Remora.
Dieses Repository wird derzeit nicht mehr unterstützt und wir empfehlen seine Verwendung nicht. Wenn ein Upgrade nicht möglich ist, wenden Sie sich bitte an Oxford Nanopore: [email protected], um Hilfe bei Ihrer Anwendung zu erhalten.
Tombo ist eine Reihe von Werkzeugen, die hauptsächlich zur Identifizierung modifizierter Nukleotide aus Nanoporen-Sequenzierungsdaten dienen. Tombo bietet auch Tools für die Analyse und Visualisierung des Roh-Nanoporensignals.
Eine ausführliche Dokumentation zu allen Tombo-Befehlen und -Algorithmen finden Sie auf der Tombo-Dokumentationsseite.
Conda-Installation (bevorzugte Methode)
# über die Bioconda-Umgebung installieren (https://bioconda.github.io/#set-up-channels) conda install -c bioconda ont-tombo
Der erste Schritt bei jeder Tombo-Analyse besteht darin, die Rohdaten der Nanoporen neu zu verknüpfen (Rohsignal mit Referenzsequenzausrichtung zu vergleichen). Dadurch wird ein Index erstellt und die Rohsignalausrichtungen gespeichert, die für die Durchführung nachgelagerter Analysen erforderlich sind.
In diesem Beispiel wird eine E. coli-Probe auf dam- und dcm-Methylierung getestet (CpG-Modell auch für die Analyse am Menschen verfügbar). Anhand dieser Ergebnisse wird das Rohsignal an den am stärksten veränderten dcm-Positionen aufgezeichnet und die Vorhersagen der vom Damm veränderten Basis werden in eine Wiggle-Datei zur Verwendung in der nachgelagerten Verarbeitung oder Visualisierung in einem Genombrowser ausgegeben.
tombo resquiggle path/to/fast5s/ genome.fasta --processes 4 --num-most-common-errors 5 tombo discover_modifications alternative_model --fast5-basedirs path/to/fast5s/ --statistics-file-basename native.e_coli_sample --alternate-bases dam dcm --processes 4 # Zeichnen Sie das Rohsignal an den wichtigsten DCM-Standorten auf Tombo-Plot most_significant --fast5-basedirs path/to/fast5s/ --statistics-filename native.e_coli_sample.dcm.tombo.stats --plot-standard-model --plot-alternate-model dcm --pdf-filename sample.most_significant_dcm_sites.pdf # erzeugt eine Wig-Datei mit dem geschätzten Anteil der geänderten Lesevorgänge an jeder gültigen Referenzstelle tombo text_output browser_files --statistics-filename native.e_coli_sample.dam.tombo.stats --file-types dampened_fraction --browser-file-basename native.e_coli_sample.dam # Außerdem wird eine Coverage-Datei für erfolgreich verarbeitete Lesevorgänge als Referenz erstellt tombo text_output browser_files --fast5-basedirs path/to/fast5s/ --file-types cover --browser-file-basename native.e_coli_sample
Während Motivmodelle ( CpG
, dcm
und dam
; am genauesten) und kontextspezifische alternative Basismodelle ( 5mC
und 6mA
; genauer) bevorzugt werden, ermöglicht Tombo Benutzern auch die Untersuchung anderer oder sogar unbekannter Basismodifikationen.
Hier sind zwei Beispielbefehle, die die de_novo
-Methode (Abweichungen von erwarteten kanonischen Signalpegeln erkennen) und die level_sample_compare
-Methode (Abweichungen der Signalpegel zwischen zwei interessierenden Samples erkennen; funktioniert am besten bei hoher Abdeckung) ausführen.
tombo discover_modifications de_novo --fast5-basedirs path/to/fast5s/ --statistics-file-basename sample.de_novo_detect --processes 4 tombo text_output browser_files --statistics-filename sample.de_novo_detect.tombo.stats --browser-file-basename sample.de_novo_detect --file-types dampened_fraction tombo discover_modifications level_sample_compare --fast5-basedirs path/to/fast5s/ --control-fast5-basedirs Pfad/zu/control/fast5s/ --minimum-test-reads 50 --processes 4 --statistics-file-basename sample.level_samp_comp_detect tombo text_output browser_files --statistics-filename sample.level_samp_comp_detect.tombo.stats --browser-file-basename sample.level_samp_comp_detect --file-types Statistik
Weitere vollständige Tutorials finden Sie auf der Dokumentationsseite.
Tombo ist für die Installation über pip verfügbar, erfordert jedoch eine R-Installation sowie R-Paketabhängigkeiten (ggplot2 und gridextra) für alle Visualisierungsfunktionen.
# pip-Paket installieren (Numpy-Installation vor Tombo für Cython-Optimierung erforderlich) pip install numpy pip install ont-tombo[vollständig]
Tombo kann auch direkt aus dem Quellcode installiert werden (hauptsächlich für die Entwicklung), indem Sie die folgenden Befehle ausführen:
Git-Klon https://github.com/nanoporetech/tombo CD-Tombo pip install -e .
Tombo unterstützt keine mehrfach lesbaren Lesedatendateien im FAST5-Format. Bitte verwenden Sie den Befehl multi_to_single_fast5
aus dem Paket ont_fast5_api, um vor der Verarbeitung mit Tombo in das Single-Read-FAST5-Format zu konvertieren.
© 2017-18 Oxford Nanopore Technologies Ltd.
Tombo wird unter den Bedingungen der enthaltenen MPL2-Lizenz vertrieben.
Stoiber, MH et al. De-novo-Identifizierung von DNA-Modifikationen, die durch genomgesteuerte Nanoporen-Signalverarbeitung ermöglicht werden. bioRxiv (2016).
http://biorxiv.org/content/early/2017/04/10/094672