Bactopia ist eine flexible Pipeline zur vollständigen Analyse bakterieller Genome. Das Ziel von Bactopia ist es, Ihre Daten mit einer breiten Palette an Tools zu verarbeiten, damit Sie schneller zum spaßigen Teil der Analysen gelangen!
Bactopia kann in zwei Hauptteile unterteilt werden: Bactopia Analysis Pipeline und Bactopia Tools.
Die Bactopia Analysis Pipeline ist der Haupt -Pro-Isolat -Workflow in Bactopia. Mit Nextflow erstellte Eingabe-FASTQs (lokal oder bei SRA/ENA erhältlich) werden zahlreichen Analysen unterzogen, darunter: Qualitätskontrolle, Montage, Anmerkung, Minmer-Skizzenabfragen, Sequenztypisierung und mehr.
Bactopia Tools sind eine Reihe unabhängiger Arbeitsabläufe für vergleichende Analysen. Die vergleichenden Analysen können zusammenfassende Berichte, Pan-Genom-Analysen oder phylogenetische Baumkonstruktionen umfassen. Mithilfe der vorhersehbaren Ausgabestruktur von Bactopia können Sie auswählen, welche Proben zur Verarbeitung mit einem Bactopia-Tool einbezogen werden sollen.
Bactopia wurde von Staphoopia inspiriert, einem von uns (Tim Read und mir) veröffentlichten Workflow, der auf Staphylococcus aureus -Genome abzielt. Basierend auf den Erkenntnissen aus Staphoopia und dem Feedback der Benutzer wurde Bactopia von Anfang an mit Blick auf Benutzerfreundlichkeit, Portabilität und Geschwindigkeit entwickelt.
Schnellstart
mamba create -y -n bactopia -c conda-forge -c bioconda bactopia conda activate bactopia bactopia datasets # Paired-end bactopia --R1 R1.fastq.gz --R2 R2.fastq.gz --sample SAMPLE_NAME --datasets datasets/ --outdir OUTDIR # Single-End bactopia --SE SAMPLE.fastq.gz --sample SAMPLE --datasets datasets/ --outdir OUTDIR # Multiple Samples bactopia prepare MY-FASTQS/ > fastqs.txt bactopia --fastqs fastqs.txt --datasets datasets --outdir OUTDIR # Single ENA/SRA Experiment bactopia --accession SRX000000 --datasets datasets --outdir OUTDIR # Multiple ENA/SRA Experiments bactopia search "staphylococcus aureus" > accessions.txt bactopia --accessions accessions.txt --dataset datasets --outdir ${OUTDIR}
In den Workflow von Bactopia sind zahlreiche Tools integriert. Wie Sie sich vorstellen können, führen all diese Tools zu zahlreichen Abhängigkeiten, und das Navigieren in Abhängigkeiten kann oft zu einem sehr frustrierenden Prozess werden. Vor diesem Hintergrund wurde Bactopia von Anfang an so entwickelt, dass es nur Programme enthält, die mit Conda installierbar sind.
Conda ist ein Open-Source-Paketverwaltungssystem und Umgebungsverwaltungssystem, das unter Windows, macOS und Linux läuft. Mit anderen Worten: Es macht es super einfach, die benötigten Tools zu installieren! Die offizielle Conda-Dokumentation ist ein guter Ausgangspunkt für den Einstieg in Conda. Bactopia wurde mit dem Miniforge-Installationsprogramm getestet, aber das Anaconda-Installationsprogramm sollte genauso funktionieren.
Sobald Sie Conda vollständig eingerichtet haben, können Sie eine Umgebung für Bactopia erstellen.
# Recommended mamba create -n bactopia -c conda-forge -c bioconda bactopia # or with standard conda conda create -n bactopia -c conda-forge -c bioconda bactopia
Nach ein paar Minuten haben Sie eine neue Conda-Umgebung mit dem passenden Namen bactopia . Um diese Umgebung zu aktivieren, können Sie den folgenden Befehl verwenden:
conda activate bactopia
Und voilà, Sie können mit der Verarbeitung Ihrer Daten beginnen!
Wenn Sie Bactopia in Ihrer Arbeit verwendet haben, geben Sie bitte unbedingt alle Datensätze oder Tools an, die Sie möglicherweise verwendet haben. Eine Liste aller von Bactopia verwendeten Datensätze/Tools wurde zur Verfügung gestellt.
Wenn ein Zitat aktualisiert werden muss, lassen Sie es mich bitte wissen!
Bei Bactopia geht es wirklich darum , „auf den Schultern von Riesen zu stehen“ . Nahezu jede Komponente von Bactopia wurde von anderen erstellt und der Öffentlichkeit frei zugänglich gemacht.
Ich möchte den Autoren dieser Softwarepakete und öffentlichen Datensätze persönlich meinen großen Dank und meine Dankbarkeit aussprechen. Wenn du es bis hierher geschafft hast, schulde ich dir ein Bier? (oder Kaffee ☕!) falls wir uns jemals persönlich begegnen. Wirklich, vielen Dank!
Falls Bactopia nicht Ihren Anforderungen entspricht, finden Sie hier einige Alternativen, die Sie ausprobieren können. Ich persönlich habe sie noch nicht verwendet, aber vielleicht finden Sie sie, die Ihren Bedürfnissen entsprechen! Wenn bei der Verwendung von Bactopia Probleme aufgetreten sind, wenden Sie sich bitte an uns!
AQUAMIS
Deneke C, Brendebach H, Uelze L, Borowiak M, Malorny B, Tausch SH. Speziesspezifische Qualitätskontrolle, Assemblierung und Kontaminationserkennung in mikrobiellen Isolatsequenzen mit AQUAMIS. Gene . 2021;12. doi:10.3390/genes12050644
ASA³P
Schwengers O, Hoek A, Fritzenwanker M, Falgenhauer L, Hain T, Chakraborty T, Goesmann A. ASA³P: Eine automatische und skalierbare Pipeline für die Zusammenstellung, Annotation und übergeordnete Analyse eng verwandter Bakterienisolate. PLoS Comput Biol 2020;16:e1007134. https://doi.org/10.1371/journal.pcbi.1007134.
MikroPIPE
Murigneux V, Roberts LW, Forde BM, Phan MD, Nhu NTK, Irwin AD, Harris PNA, Paterson DL, Schembri MA, Whiley DM, Beatson SA MicroPIPE: Validierung eines End-to-End-Workflows für die hochwertige Konstruktion vollständiger Bakteriengenome . BMC Genomics , 22(1), 474. (2021) https://doi.org/10.1186/s12864-021-07767-z
Nullarbor
Seemann T, Goncalves da Silva A, Bulach DM, Schultz MB, Kwong JC, Howden BP. Nullarbor Github https://github.com/tseemann/nullarbor
ProkEvo
Pavlovikj N, Gomes-Neto JC, Deogun JS, Benson AK ProkEvo: ein automatisiertes, reproduzierbares und skalierbares Framework für Genomanalysen von Bakterienpopulationen mit hohem Durchsatz. PeerJ , e11376 (2021) https://doi.org/10.7717/peerj.11376
Bakterielle Genomik im öffentlichen Gesundheitswesen
Libuit K, Ambrosio F, Kapsak C Public Health Bacterial Genomics GitHub https://github.com/theiagen/public_health_icrobial_genomics
rMAP
Sserwadda I, Mboowa G rMAP: die Rapid Microbial Analysis Pipeline für Gesamtgenomsequenzdaten der ESKAPE-Bakteriengruppe. Mikrobielle Genomik , 7(6). (2021) https://doi.org/10.1099/mgen.0.000583
TORMES
Quijada NM, Rodríguez-Lázaro D, Eiros JM, Hernández M. TORMES: eine automatisierte Pipeline für die Analyse des gesamten Bakteriengenoms. Bioinformatik 2019;35:4207–12. https://doi.org/10.1093/bioinformatics/btz220.
Ihr Feedback ist sehr wertvoll! Wenn Sie bei der Verwendung von Bactopia auf Probleme stoßen, Fragen haben oder Ideen zur Verbesserung von Bactopia haben, empfehle ich Ihnen dringend, diese an den Issue Tracker zu senden.
MIT-Lizenz
Petit III RA, Read TD, Bactopia: eine flexible Pipeline für die vollständige Analyse bakterieller Genome. mSystems . 5 (2020), https://doi.org/10.1128/mSystems.00190-20.
Robert A. Petit III
Twitter: @rpetit3
Die Unterstützung für dieses Projekt kam (teilweise) durch ein Emory Public Health Bioinformatics Fellowship, das vom CDC Emerging Infections Program (U50CK000485) PPHF/ACA: Enhancing Epidemiology and Laboratory Capacity, der Wyoming Public Health Division und dem Center for Applied Pathogen Epidemiology and finanziert wurde Ausbruchskontrolle (CAPE).