我们有一个新的生物信息资源来取代该项目的功能!请在此处查看我们的新存储库:remora。
该存储库现在不受支持,我们不建议使用它。如果无法升级,请联系 Oxford Nanopore:[email protected],获取应用方面的帮助。
Tombo 是一套主要用于从纳米孔测序数据中识别修饰核苷酸的工具。 Tombo 还提供用于原始纳米孔信号分析和可视化的工具。
所有 Tombo 命令和算法的详细文档可以在 Tombo 文档页面上找到。
Conda安装(首选方法)
# 通过bioconda环境安装(https://bioconda.github.io/#set-up-channels) conda 安装-c bioconda ont-tombo
任何 Tombo 分析的第一步都是重新绘制原始纳米孔读数(原始信号与参考序列比对)。这将创建一个索引并存储执行下游分析所需的原始信号对齐。
在此示例中,测试了大肠杆菌样品的 dam 和 dcm 甲基化(CpG 模型也可用于人体分析)。使用这些结果,在最显着修改的 dcm 位置绘制原始信号,并将 dam 修改的碱基预测输出到 wiggle 文件,用于下游处理或在基因组浏览器中可视化。
tombo resquiggle path/to/fast5s/genome.fasta --processes 4 --num-most-common-errors 5 tombo detector_modifications Alternative_model --fast5-basedirs 路径/to/fast5s/ --statistics-file-basename native.e_coli_sample --替代碱基 dam dcm --过程 4 # 在最重要的 dcm 位置绘制原始信号 tombo 图most_significant --fast5-basedirs 路径/to/fast5s/ --统计文件名native.e_coli_sample.dcm.tombo.stats --plot-standard-model --plot-alternate-model dcm --pdf-文件名sample.most_significant_dcm_sites.pdf # 生成 wig 文件,其中包含每个有效参考位点的修改读数的估计部分 tombo text_output browser_files --statistics-文件名 native.e_coli_sample.dam.tombo.stats --文件类型damned_fraction --浏览器文件基名native.e_coli_sample.dam # 还生成成功处理的读取覆盖文件以供参考 tombo text_output browser_files --fast5-basedirs 路径/to/fast5s/ --文件类型覆盖范围--浏览器文件基名native.e_coli_sample
虽然基序模型( CpG
、 dcm
和dam
;最准确)和全上下文特定替代碱基模型( 5mC
和6mA
;更准确)是首选,但 Tombo 还允许用户研究其他甚至未知的碱基修饰。
以下是运行de_novo
方法(检测与预期规范信号水平的偏差)和level_sample_compare
方法(检测两个感兴趣样本之间信号水平的偏差;在高覆盖率下效果最佳)的两个示例命令。
tombo detector_modifications de_novo --fast5-basedirs 路径/to/fast5s/ --statistics-file-basename 样本.de_novo_detect --processes 4 tombo text_output browser_files --statistics-filename example.de_novo_detect.tombo.stats --browser-file-basename example.de_novo_detect --文件类型damened_fraction tombo detector_modifications level_sample_compare --fast5-basedirs 路径/to/fast5s/ --control-fast5-basedirs 路径/到/control/fast5s/ --minimum-test-reads 50 --processes 4 --statistics-file-basename example.level_samp_comp_detect tombo text_output browser_files --statistics-filename example.level_samp_comp_detect.tombo.stats --browser-file-basename example.level_samp_comp_detect --文件类型统计
在文档页面上查看更完整的教程。
Tombo 可通过 pip 安装,但需要 R 安装以及所有可视化功能的 R 包依赖项(ggplot2 和 gridextra)。
# 安装 pip 包(在 tombo 之前需要安装 numpy 以进行 cython 优化) pip安装numpy pip install ont-tombo[完整]
Tombo 也可以通过运行以下命令直接从源代码安装(主要用于开发):
git 克隆 https://github.com/nanoporetech/tombo CD通博 pip install -e 。
Tombo不支持多次读取FAST5格式读取数据文件。请使用 ont_fast5_api 包中的multi_to_single_fast5
命令,以便在使用 Tombo 处理之前转换为单读 FAST5 格式。
© 2017-18 牛津纳米孔技术有限公司
Tombo 根据随附的 MPL2 许可证条款进行分发。
斯托伊伯,MH 等人。通过基因组引导的纳米孔信号处理实现 DNA 修饰的从头鉴定。生物Rxiv (2016)。
http://biorxiv.org/content/early/2017/04/10/094672