Bactopia 是一个用于完整分析细菌基因组的灵活管道。 Bactopia 的目标是使用广泛的工具来处理您的数据,以便您可以更快地进入分析的有趣部分!
Bactopia 可以分为两个主要部分:Bactopia 分析管道和 Bactopia 工具。
Bactopia 分析流程是 Bactopia 中每个分离株的主要工作流程。使用 Nextflow 构建的输入 FASTQ(本地或可从 SRA/ENA 获得)经过大量分析,包括:质量控制、装配、注释、最小草图查询、序列输入等。
Bactopia Tools 是一套用于比较分析的独立工作流程。比较分析可能包括总结报告、泛基因组或系统发育树构建。使用 Bactopia 的可预测输出结构,您可以选择要包含哪些样本以使用 Bactopia 工具进行处理。
Bactopia 的灵感来自 Staphopia,这是我们(蒂姆·里德和我自己)发布的针对金黄色葡萄球菌基因组的工作流程。利用我们从 Staphopia 中学到的知识和用户反馈,Bactopia 是从头开始开发的,从一开始就考虑到了可用性、便携性和速度。
快速入门
mamba create -y -n bactopia -c conda-forge -c bioconda bactopia conda activate bactopia bactopia datasets # Paired-end bactopia --R1 R1.fastq.gz --R2 R2.fastq.gz --sample SAMPLE_NAME --datasets datasets/ --outdir OUTDIR # Single-End bactopia --SE SAMPLE.fastq.gz --sample SAMPLE --datasets datasets/ --outdir OUTDIR # Multiple Samples bactopia prepare MY-FASTQS/ > fastqs.txt bactopia --fastqs fastqs.txt --datasets datasets --outdir OUTDIR # Single ENA/SRA Experiment bactopia --accession SRX000000 --datasets datasets --outdir OUTDIR # Multiple ENA/SRA Experiments bactopia search "staphylococcus aureus" > accessions.txt bactopia --accessions accessions.txt --dataset datasets --outdir ${OUTDIR}
Bactopia 的工作流程中内置了许多工具。正如您可以想象的那样,所有这些工具都会导致大量的依赖关系,而导航依赖关系通常会变成一个非常令人沮丧的过程。考虑到这一点,Bactopia 从一开始就被开发为仅包含可使用 Conda 安装的程序。
Conda 是一个开源包管理系统和环境管理系统,可在 Windows、macOS 和 Linux 上运行。换句话说,它使您可以非常轻松地安装所需的工具! Conda 官方文档是开始使用 Conda 的一个很好的起点。 Bactopia 已使用 Miniforge 安装程序进行了测试,但 Anaconda 安装程序的工作原理应该相同。
一旦你完成了 Conda 的设置,你就可以为 Bactopia 创建一个环境了。
# Recommended mamba create -n bactopia -c conda-forge -c bioconda bactopia # or with standard conda conda create -n bactopia -c conda-forge -c bioconda bactopia
几分钟后,您将拥有一个新的 conda 环境,适当命名为bactopia 。要激活此环境,您可以使用以下命令:
conda activate bactopia
瞧,您已经准备好开始处理您的数据了!
如果您在工作中使用过 Bactopia,请务必引用您可能使用过的任何数据集或工具。 Bactopia 使用的每个数据集/工具的列表已提供。
如果引用需要更新,请告诉我!
Bactopia确实是一个“站在巨人肩膀上”的案例。 Bactopia 的几乎每个组件都是由其他人创建并免费向公众提供的。
我想亲自向这些软件包和公共数据集的作者致以深深的谢意和感谢。如果你已经走到这一步了,我欠你一杯啤酒? (或咖啡☕!)如果我们面对面见面。真的,非常感谢!
如果 Bactopia 不能满足您的需求,您可以选择以下一些替代方案。我个人没有使用过它们,但您可能会发现它们可以满足您的需求!如果您在使用 Bactopia 时遇到问题,请随时与我们联系!
阿奎米斯
Deneke C、Brendebach H、Uelze L、Borowiak M、Malorny B、Tausch SH。使用 AQUAMIS 对微生物分离序列进行物种特异性质量控制、组装和污染检测。基因。 2021;12。 doi:10.3390/genes12050644
ASA³P
Schwengers O、Hoek A、Fritzenwanker M、Falgenhauer L、Hain T、Chakraborty T、Goesmann A. ASA³P:一种自动且可扩展的管道,用于密切相关的细菌分离株的组装、注释和高级分析。 PLoS 计算机生物学2020;16:e1007134。 https://doi.org/10.1371/journal.pcbi.1007134。
微管
Murigneux V, Roberts LW, Forde BM, Phan MD, Nhu NTK, Irwin AD, Harris PNA, Paterson DL, Schembri MA, Whiley DM, Beatson SA MicroPIPE:验证高质量完整细菌基因组构建的端到端工作流程。 BMC 基因组学,22(1), 474。(2021) https://doi.org/10.1186/s12864-021-07767-z
纳拉伯
Seemann T、Goncalves da Silva A、Bulach DM、Schultz MB、Kwong JC、Howden BP。 Nullarbor Github https://github.com/tseemann/nullarbor
普罗克埃沃
Pavlovikj N、Gomes-Neto JC、Deogun JS、Benson AK ProkEvo:用于高通量细菌群体基因组学分析的自动化、可重复且可扩展的框架。 PeerJ ,e11376 (2021) https://doi.org/10.7717/peerj.11376
公共卫生细菌基因组学
Libuit K、Ambrosio F、Kapsak C公共卫生细菌基因组学GitHub https://github.com/theiagen/public_health_bacterial_genomics
平均MAP
Sserwadda I、Mboowa G rMAP:ESKAPE 细菌群全基因组序列数据的快速微生物分析管道。微生物基因组学,7(6)。 (2021) https://doi.org/10.1099/mgen.0.000583
托尔梅斯
Quijada NM、Rodríguez-Lázaro D、Eiros JM、Hernández M. TORMES:用于全细菌基因组分析的自动化管道。生物信息学2019;35:4207–12。 https://doi.org/10.1093/bioinformatics/btz220。
您的反馈非常有价值!如果您在使用 Bactopia 时遇到任何问题、有疑问或有一些改进 Bactopia 的想法,我强烈建议您将其提交到问题跟踪器。
麻省理工学院许可证
Petit III RA、Read TD、 Bactopia:用于全面分析细菌基因组的灵活管道。移动系统。 5(2020),https://doi.org/10.1128/mSystems.00190-20。
罗伯特·A·珀蒂三世
推特:@rpetit3
该项目的支持(部分)来自埃默里公共卫生生物信息学奖学金,该奖学金由 CDC 新发感染计划 (U50CK000485) PPHF/ACA:增强流行病学和实验室能力、怀俄明州公共卫生部门以及应用病原体流行病学和应用中心资助疫情控制(CAPE)。