Bactopia 是一個用於完整分析細菌基因組的靈活管道。 Bactopia 的目標是使用廣泛的工具來處理您的數據,以便您可以更快地進入分析的有趣部分!
Bactopia 可以分為兩個主要部分:Bactopia 分析管道和 Bactopia 工具。
Bactopia 分析流程是 Bactopia 中每個分離株的主要工作流程。使用 Nextflow 建構的輸入 FASTQ(本地或可從 SRA/ENA 取得)經過大量分析,包括:品質控制、組裝、註釋、最小草圖查詢、序列輸入等。
Bactopia Tools 是一套用於比較分析的獨立工作流程。比較分析可能包括總結報告、泛基因組或系統發育樹建構。使用 Bactopia 的可預測輸出結構,您可以選擇要包含哪些樣本以使用 Bactopia 工具進行處理。
Bactopia 的靈感來自 Staphopia,這是我們(蒂姆·里德和我自己)發布的針對金黃色葡萄球菌基因組的工作流程。利用我們從 Staphopia 中學到的知識和用戶回饋,Bactopia 是從頭開始開發的,從一開始就考慮到了可用性、便攜性和速度。
快速入門
mamba create -y -n bactopia -c conda-forge -c bioconda bactopia conda activate bactopia bactopia datasets # Paired-end bactopia --R1 R1.fastq.gz --R2 R2.fastq.gz --sample SAMPLE_NAME --datasets datasets/ --outdir OUTDIR # Single-End bactopia --SE SAMPLE.fastq.gz --sample SAMPLE --datasets datasets/ --outdir OUTDIR # Multiple Samples bactopia prepare MY-FASTQS/ > fastqs.txt bactopia --fastqs fastqs.txt --datasets datasets --outdir OUTDIR # Single ENA/SRA Experiment bactopia --accession SRX000000 --datasets datasets --outdir OUTDIR # Multiple ENA/SRA Experiments bactopia search "staphylococcus aureus" > accessions.txt bactopia --accessions accessions.txt --dataset datasets --outdir ${OUTDIR}
Bactopia 的工作流程中內建了許多工具。正如您可以想像的那樣,所有這些工具都會導致大量的依賴關係,而導航依賴關係通常會變成一個非常令人沮喪的過程。考慮到這一點,Bactopia 從一開始就被開發為僅包含可使用 Conda 安裝的程式。
Conda 是一個開源套件管理系統和環境管理系統,可在 Windows、macOS 和 Linux 上運作。換句話說,它使您可以非常輕鬆地安裝所需的工具! Conda 官方文件是開始使用 Conda 的一個很好的起點。 Bactopia 已使用 Miniforge 安裝程式進行了測試,但 Anaconda 安裝程式的工作原理應該相同。
一旦你完成了 Conda 的設置,你就可以為 Bactopia 創建一個環境了。
# Recommended mamba create -n bactopia -c conda-forge -c bioconda bactopia # or with standard conda conda create -n bactopia -c conda-forge -c bioconda bactopia
幾分鐘後,您將擁有一個新的 conda 環境,適當命名為bactopia 。若要啟動此環境,您可以使用以下命令:
conda activate bactopia
瞧,您已經準備好開始處理您的資料了!
如果您在工作中使用過 Bactopia,請務必引用您可能使用過的任何資料集或工具。 Bactopia 使用的每個資料集/工具的清單已提供。
如果引用需要更新,請告訴我!
Bactopia確實是一個「站在巨人肩膀上」的案例。 Bactopia 的幾乎每個元件都是由其他人創建並免費向公眾提供的。
我想親自向這些軟體包和公共資料集的作者致以深深的謝意和感謝。如果你已經走到這一步了,我欠你一杯啤酒? (或咖啡☕!)如果我們面對面見面。真的,非常感謝!
如果 Bactopia 無法滿足您的需求,您可以選擇以下一些替代方案。我個人沒有使用過它們,但您可能會發現它們可以滿足您的需求!如果您在使用 Bactopia 時遇到問題,請隨時與我們聯絡!
阿奎米斯
Deneke C、Brendebach H、Uelze L、Borowiak M、Malorny B、Tausch SH。使用 AQUAMIS 對微生物分離序列進行物種特異性品質控制、組裝和污染檢測。基因。 2021;12。 doi:10.3390/genes12050644
ASA³P
Schwengers O、Hoek A、Fritzenwanker M、Falgenhauer L、Hain T、Chakraborty T、Goesmann A. ASA³P:一種自動且可擴展的管道,用於密切相關的細菌分離株的組裝、註釋和高級分析。 PLoS 計算機生物學2020;16:e1007134。 https://doi.org/10.1371/journal.pcbi.1007134。
微管
Murigneux V, Roberts LW, Forde BM, Phan MD, Nhu NTK, Irwin AD, Harris PNA, Paterson DL, Schembri MA, Whiley DM, Beatson SA MicroPIPE:驗證高品質完整細菌基因組建構的端到端工作流程。 BMC 基因組學,22(1), 474。
納拉伯
Seemann T、Goncalves da Silva A、Bulach DM、Schultz MB、Kwong JC、Howden BP。 Nullarbor Github https://github.com/tseemann/nullarbor
普羅克埃沃
Pavlovikj N、Gomes-Neto JC、Deogun JS、Benson AK ProkEvo:用於高通量細菌群體基因組學分析的自動化、可重複且可擴展的框架。 PeerJ ,e11376 (2021) https://doi.org/10.7717/peerj.11376
公共衛生細菌基因組學
Libuit K、Ambrosio F、Kapsak C公共衛生細菌基因體學GitHub https://github.com/theiagen/public_health_bacterial_genomics
平均MAP
Sserwadda I、Mboowa G rMAP:ESKAPE 細菌群全基因組序列資料的快速微生物分析管道。微生物基因組學,7(6)。 (2021) https://doi.org/10.1099/mgen.0.000583
托爾梅斯
Quijada NM、Rodríguez-Lázaro D、Eiros JM、Hernández M. TORMES:用於全細菌基因組分析的自動化管道。生物資訊學2019;35:4207–12。 https://doi.org/10.1093/bioinformatics/btz220。
您的反饋非常有價值!如果您在使用 Bactopia 時遇到任何問題、有疑問或有一些改進 Bactopia 的想法,我強烈建議您將其提交到問題追蹤器。
麻省理工學院許可證
Petit III RA、Read TD、 Bactopia:用於全面分析細菌基因組的靈活管道。移動系統。 5(2020),https://doi.org/10.1128/mSystems.00190-20。
羅伯特·A·珀蒂三世
推特:@rpetit3
該計畫的支持(部分)來自埃默里公共衛生生物資訊學獎學金,該獎學金由CDC 新發感染計畫(U50CK000485) PPHF/ACA:增強流行病學和實驗室能力、懷俄明州公共衛生部門以及應用病原體流行病學和應用中心資助疫情控制(CAPE)。