Bactopia é um pipeline flexível para análise completa de genomas bacterianos. O objetivo do Bactopia é processar seus dados com um amplo conjunto de ferramentas, para que você chegue mais rápido à parte divertida das análises!
Bactopia pode ser dividida em duas partes principais: Bactopia Analysis Pipeline e Bactopia Tools.
O Bactopia Analysis Pipeline é o principal fluxo de trabalho por isolamento no Bactopia. Construídos com Nextflow, os FASTQs de entrada (locais ou disponíveis na SRA/ENA) são submetidos a inúmeras análises, incluindo: controle de qualidade, montagem, anotação, consultas mínimas de esboço, digitação de sequência e muito mais.
Bactopia Tools é um conjunto de fluxos de trabalho independentes para análises comparativas. As análises comparativas podem incluir relatórios resumidos, pan-genoma ou construção de árvores filogenéticas. Usando a estrutura de saída previsível do Bactopia, você pode escolher quais amostras incluir para processamento com uma ferramenta Bactopia.
Bactopia foi inspirado em Staphopia, um fluxo de trabalho que nós (Tim Read e eu) lançamos que tem como alvo os genomas de Staphylococcus aureus . Usando o que aprendemos com o Staphopia e o feedback dos usuários, o Bactopia foi desenvolvido do zero com usabilidade, portabilidade e velocidade em mente desde o início.
Início rápido
mamba create -y -n bactopia -c conda-forge -c bioconda bactopia conda activate bactopia bactopia datasets # Paired-end bactopia --R1 R1.fastq.gz --R2 R2.fastq.gz --sample SAMPLE_NAME --datasets datasets/ --outdir OUTDIR # Single-End bactopia --SE SAMPLE.fastq.gz --sample SAMPLE --datasets datasets/ --outdir OUTDIR # Multiple Samples bactopia prepare MY-FASTQS/ > fastqs.txt bactopia --fastqs fastqs.txt --datasets datasets --outdir OUTDIR # Single ENA/SRA Experiment bactopia --accession SRX000000 --datasets datasets --outdir OUTDIR # Multiple ENA/SRA Experiments bactopia search "staphylococcus aureus" > accessions.txt bactopia --accessions accessions.txt --dataset datasets --outdir ${OUTDIR}
Bactopia possui muitas ferramentas integradas em seu fluxo de trabalho. Como você pode imaginar, todas essas ferramentas levam a inúmeras dependências, e navegar pelas dependências muitas vezes pode se transformar em um processo muito frustrante. Pensando nisso, desde o início o Bactopia foi desenvolvido para incluir apenas programas que podem ser instalados usando o Conda.
Conda é um sistema de gerenciamento de pacotes de código aberto e sistema de gerenciamento de ambiente que roda em Windows, macOS e Linux. Em outras palavras, torna muito fácil instalar as ferramentas necessárias! A documentação oficial do Conda é um bom ponto de partida para começar a usar o Conda. Bactopia foi testado usando o instalador Miniforge, mas o instalador Anaconda deve funcionar da mesma forma.
Depois de configurar o Conda, você estará pronto para criar um ambiente para Bactopia.
# Recommended mamba create -n bactopia -c conda-forge -c bioconda bactopia # or with standard conda conda create -n bactopia -c conda-forge -c bioconda bactopia
Depois de alguns minutos você terá um novo ambiente conda apropriadamente chamado bactopia . Para ativar este ambiente, você pode usar o seguinte comando:
conda activate bactopia
E pronto, você está pronto para começar a processar seus dados!
Se você usou Bactopia em seu trabalho, certifique-se de citar quaisquer conjuntos de dados ou ferramentas que possa ter usado. Uma lista de cada conjunto de dados/ferramenta utilizado pelo Bactopia foi disponibilizada.
Se uma citação precisar ser atualizada, por favor me avise!
Bactopia é verdadeiramente um caso de “ficar sobre ombros de gigantes” . Quase todos os componentes do Bactopia foram criados por terceiros e disponibilizados gratuitamente ao público.
Gostaria de estender pessoalmente meus muitos agradecimentos e gratidão aos autores desses pacotes de software e conjuntos de dados públicos. Se você chegou até aqui, devo uma cerveja a você? (ou café ☕!) se algum dia nos encontrarmos pessoalmente. Realmente, muito obrigado!
Caso o Bactopia não atenda às suas necessidades, aqui estão algumas alternativas que você pode conferir. Eu pessoalmente não os usei, mas você pode encontrá-los para atender às suas necessidades! Se você tiver problemas ao usar o Bactopia, sinta-se à vontade para entrar em contato!
AQUAMIS
Deneke C, Brendebach H, Uelze L, Borowiak M, Malorny B, Tausch SH. Controle de qualidade específico para espécies, montagem e detecção de contaminação em sequências de isolados microbianos com AQUAMIS. Genes . 2021;12. doi:10.3390/genes12050644
ASA³P
Schwengers O, Hoek A, Fritzenwanker M, Falgenhauer L, Hain T, Chakraborty T, Goesmann A. ASA³P: Um pipeline automático e escalável para montagem, anotação e análise de nível superior de isolados bacterianos intimamente relacionados. PLoS Comput Biol 2020;16:e1007134. https://doi.org/10.1371/journal.pcbi.1007134.
MicroPIPE
Murigneux V, Roberts LW, Forde BM, Phan MD, Nhu NTK, Irwin AD, Harris PNA, Paterson DL, Schembri MA, Whiley DM, Beatson SA MicroPIPE: validando um fluxo de trabalho de ponta a ponta para construção completa de genoma bacteriano de alta qualidade . BMC Genomics , 22(1), 474. (2021) https://doi.org/10.1186/s12864-021-07767-z
Nullarbor
Seemann T, Gonçalves da Silva A, Bulach DM, Schultz MB, Kwong JC, Howden BP. Nullarbor Github https://github.com/tseemann/nullarbor
ProkEvo
Pavlovikj N, Gomes-Neto JC, Deogun JS, Benson AK ProkEvo: uma estrutura automatizada, reproduzível e escalonável para análises genômicas de populações bacterianas de alto rendimento. PeerJ , e11376 (2021) https://doi.org/10.7717/peerj.11376
Genômica Bacteriana de Saúde Pública
Libuit K, Ambrosio F, Kapsak C Saúde Pública Genômica Bacteriana GitHub https://github.com/theiagen/public_health_bacterial_genomics
rMAP
Sserwadda I, Mboowa G rMAP: o pipeline de análise microbiana rápida para dados de sequência do genoma completo do grupo bacteriano ESKAPE. Genômica Microbiana , 7(6). (2021) https://doi.org/10.1099/mgen.0.000583
TORMES
Quijada NM, Rodríguez-Lázaro D, Eiros JM, Hernández M. TORMES: um pipeline automatizado para análise do genoma bacteriano completo. Bioinformática 2019;35:4207–12. https://doi.org/10.1093/bioinformatics/btz220.
Seu feedback é muito valioso! Se você tiver algum problema ao usar o Bactopia, tiver dúvidas ou tiver algumas ideias para melhorar o Bactopia, recomendo enfaticamente que você envie-o para o Issue Tracker.
Licença MIT
Petit III RA, Read TD, Bactopia: um pipeline flexível para análise completa de genomas bacterianos. mSystems . 5 (2020), https://doi.org/10.1128/mSystems.00190-20.
Roberto A. Petit III
Twitter: @rpetit3
O apoio para este projeto veio (em parte) de uma Emory Public Health Bioinformatics Fellowship financiada pelo Programa de Infecções Emergentes do CDC (U50CK000485) PPHF/ACA: Melhorando a Epidemiologia e a Capacidade Laboratorial, a Divisão de Saúde Pública de Wyoming e o Centro de Epidemiologia Aplicada de Patógenos e Controle de Surtos (CAPE).