Bactopia est un pipeline flexible pour l'analyse complète des génomes bactériens. L'objectif de Bactopia est de traiter vos données avec un large éventail d'outils, afin que vous puissiez accéder plus rapidement à la partie amusante des analyses !
Bactopia peut être divisé en deux parties principales : le pipeline d'analyse de Bactopia et les outils de Bactopia.
Bactopia Analysis Pipeline est le principal flux de travail par isolat de Bactopia. Construits avec Nextflow, les FASTQ d'entrée (locaux ou disponibles auprès de SRA/ENA) sont soumis à de nombreuses analyses, notamment : contrôle qualité, assemblage, annotation, requêtes d'esquisse Minmer, typage de séquence, etc.
Les outils Bactopia sont un ensemble de flux de travail indépendants pour des analyses comparatives. Les analyses comparatives peuvent inclure des rapports de synthèse, la construction d'un pan-génome ou d'un arbre phylogénétique. En utilisant la structure de sortie prévisible de Bactopia, vous pouvez sélectionner les échantillons à inclure pour le traitement avec un outil Bactopia.
Bactopia a été inspiré par Staphopia, un flux de travail que nous (Tim Read et moi-même) avons publié et qui cible les génomes de Staphylococcus aureus . En utilisant ce que nous avons appris de Staphopia et les commentaires des utilisateurs, Bactopia a été développé à partir de zéro en gardant à l'esprit dès le départ la convivialité, la portabilité et la rapidité.
Démarrage rapide
mamba create -y -n bactopia -c conda-forge -c bioconda bactopia conda activate bactopia bactopia datasets # Paired-end bactopia --R1 R1.fastq.gz --R2 R2.fastq.gz --sample SAMPLE_NAME --datasets datasets/ --outdir OUTDIR # Single-End bactopia --SE SAMPLE.fastq.gz --sample SAMPLE --datasets datasets/ --outdir OUTDIR # Multiple Samples bactopia prepare MY-FASTQS/ > fastqs.txt bactopia --fastqs fastqs.txt --datasets datasets --outdir OUTDIR # Single ENA/SRA Experiment bactopia --accession SRX000000 --datasets datasets --outdir OUTDIR # Multiple ENA/SRA Experiments bactopia search "staphylococcus aureus" > accessions.txt bactopia --accessions accessions.txt --dataset datasets --outdir ${OUTDIR}
Bactopia dispose de nombreux outils intégrés à son flux de travail. Comme vous pouvez l’imaginer, tous ces outils conduisent à de nombreuses dépendances, et naviguer dans les dépendances peut souvent se transformer en un processus très frustrant. Dans cet esprit, Bactopia a été développé dès le départ pour inclure uniquement les programmes installables à l’aide de Conda.
Conda est un système de gestion de packages et un système de gestion d'environnement open source qui fonctionne sous Windows, macOS et Linux. En d’autres termes, il est très facile d’installer les outils dont vous avez besoin ! La documentation officielle de Conda est un bon point de départ pour démarrer avec Conda. Bactopia a été testé à l'aide du programme d'installation Miniforge, mais le programme d'installation d'Anaconda devrait fonctionner de la même manière.
Une fois que Conda est configuré, vous êtes prêt à créer un environnement pour Bactopia.
# Recommended mamba create -n bactopia -c conda-forge -c bioconda bactopia # or with standard conda conda create -n bactopia -c conda-forge -c bioconda bactopia
Après quelques minutes, vous aurez un nouvel environnement conda convenablement nommé bactopia . Pour activer cet environnement, vous pourrez utiliser la commande suivante :
conda activate bactopia
Et voilà, vous êtes prêt à commencer à traiter vos données !
Si vous avez utilisé Bactopia dans votre travail, assurez-vous de citer tous les ensembles de données ou outils que vous avez pu utiliser. Une liste de chaque ensemble de données/outil utilisé par Bactopia a été mise à disposition.
Si une citation doit être mise à jour, faites-le-moi savoir !
Bactopia est véritablement un exemple de « se tenir sur les épaules de géants » . Presque tous les composants de Bactopia ont été créés par d’autres et mis gratuitement à la disposition du public.
Je tiens personnellement à exprimer mes nombreux remerciements et ma gratitude aux auteurs de ces progiciels et ensembles de données publics. Si tu es arrivé jusqu'ici, je te dois une bière ? (ou un café ☕ !) si jamais nous nous rencontrons en personne. Vraiment, merci beaucoup !
Si Bactopia ne répond pas à vos besoins, voici quelques alternatives que vous pouvez consulter. Personnellement, je ne les ai pas utilisés, mais vous pourriez les trouver adaptés à vos besoins ! Si vous rencontrez des problèmes lors de l'utilisation de Bactopia, n'hésitez pas à nous contacter !
AQUAMIS
Deneke C, Brendebach H, Uelze L, Borowiak M, Malorny B, Tausch SH. Contrôle qualité spécifique à l'espèce, détection d'assemblage et de contamination dans les séquences d'isolats microbiens avec AQUAMIS. Gènes . 2021;12. est ce que je:10.3390/genes12050644
ASA³P
Schwengers O, Hoek A, Fritzenwanker M, Falgenhauer L, Hain T, Chakraborty T, Goesmann A. ASA³P : Un pipeline automatique et évolutif pour l'assemblage, l'annotation et l'analyse de niveau supérieur d'isolats bactériens étroitement liés. PLoS Comput Biol 2020 ;16 :e1007134. https://doi.org/10.1371/journal.pcbi.1007134.
MicroPIPE
Murigneux V, Roberts LW, Forde BM, Phan MD, Nhu NTK, Irwin AD, Harris PNA, Paterson DL, Schembri MA, Whiley DM, Beatson SA MicroPIPE : validation d'un flux de travail de bout en bout pour la construction complète du génome bactérien de haute qualité . BMC Génomique , 22(1), 474. (2021) https://doi.org/10.1186/s12864-021-07767-z
Nullarbor
Seemann T, Goncalves da Silva A, Bulach DM, Schultz MB, Kwong JC, Howden BP. Nullarbor Github https://github.com/tseemann/nullarbor
ProkEvo
Pavlovikj N, Gomes-Neto JC, Deogun JS, Benson AK ProkEvo : un cadre automatisé, reproductible et évolutif pour les analyses génomiques de populations bactériennes à haut débit. PeerJ , e11376 (2021) https://doi.org/10.7717/peerj.11376
Génomique bactérienne de santé publique
Libuit K, Ambrosio F, Kapsak C Génomique bactérienne de santé publique GitHub https://github.com/theiagen/public_health_bacterial_genomics
rMAP
Sserwadda I, Mboowa G rMAP : le pipeline d'analyse microbienne rapide pour les données de séquence du génome entier du groupe bactérien ESKAPE. Génomique microbienne , 7(6). (2021) https://doi.org/10.1099/mgen.0.000583
TORMES
Quijada NM, Rodríguez-Lázaro D, Eiros JM, Hernández M. TORMES : un pipeline automatisé pour l'analyse du génome bactérien entier. Bioinformatique 2019 ; 35 : 4207-12. https://doi.org/10.1093/bioinformatics/btz220.
Vos retours sont très précieux ! Si vous rencontrez des problèmes lors de l'utilisation de Bactopia, si vous avez des questions ou si vous avez des idées pour améliorer Bactopia, je vous encourage vivement à les soumettre à Issue Tracker.
Licence MIT
Petit III RA, Read TD, Bactopia : un pipeline flexible pour l'analyse complète des génomes bactériens. mSystèmes . 5 (2020), https://doi.org/10.1128/mSystems.00190-20.
Robert A. Petit III
Twitter : @rpetit3
Le soutien à ce projet est venu (en partie) d'une bourse Emory Public Health Bioinformatics financée par le CDC Emerging Infections Program (U50CK000485) PPHF/ACA : Enhancing Epidemiology and Laboratory Capacity, la Division de santé publique du Wyoming et le Centre d'épidémiologie appliquée des agents pathogènes et Contrôle des épidémies (CAPE).