Bactopia es un sistema flexible para el análisis completo de genomas bacterianos. El objetivo de Bactopia es procesar tus datos con un amplio conjunto de herramientas, para que puedas llegar más rápido a la parte divertida de los análisis.
Bactopia se puede dividir en dos partes principales: Bactopia Analysis Pipeline y Bactopia Tools.
Bactopia Analysis Pipeline es el principal flujo de trabajo por aislamiento en Bactopia. Construidos con Nextflow, los FASTQ de entrada (locales o disponibles en SRA/ENA) se someten a numerosos análisis que incluyen: control de calidad, ensamblaje, anotaciones, consultas de bocetos miner, tipificación de secuencias y más.
Bactopia Tools son un conjunto de flujos de trabajo independientes para análisis comparativos. Los análisis comparativos pueden incluir informes resumidos, pangenoma o construcción de árboles filogenéticos. Usando la estructura de salida predecible de Bactopia, puede elegir qué muestras incluir para procesar con una herramienta Bactopia.
Bactopia se inspiró en Stapopia, un flujo de trabajo que nosotros (Tim Read y yo) lanzamos y que apunta a los genomas de Staphylococcus aureus . Utilizando lo que aprendimos de Stapopia y los comentarios de los usuarios, Bactopia se desarrolló desde cero teniendo en cuenta la usabilidad, la portabilidad y la velocidad desde el principio.
Inicio rápido
mamba create -y -n bactopia -c conda-forge -c bioconda bactopia conda activate bactopia bactopia datasets # Paired-end bactopia --R1 R1.fastq.gz --R2 R2.fastq.gz --sample SAMPLE_NAME --datasets datasets/ --outdir OUTDIR # Single-End bactopia --SE SAMPLE.fastq.gz --sample SAMPLE --datasets datasets/ --outdir OUTDIR # Multiple Samples bactopia prepare MY-FASTQS/ > fastqs.txt bactopia --fastqs fastqs.txt --datasets datasets --outdir OUTDIR # Single ENA/SRA Experiment bactopia --accession SRX000000 --datasets datasets --outdir OUTDIR # Multiple ENA/SRA Experiments bactopia search "staphylococcus aureus" > accessions.txt bactopia --accessions accessions.txt --dataset datasets --outdir ${OUTDIR}
Bactopia tiene muchas herramientas integradas en su flujo de trabajo. Como puede imaginar, todas estas herramientas generan numerosas dependencias, y navegar por ellas a menudo puede convertirse en un proceso muy frustrante. Con esto en mente, desde el principio Bactopia se desarrolló para incluir solo programas que se puedan instalar usando Conda.
Conda es un sistema de gestión de paquetes y de entorno de código abierto que se ejecuta en Windows, macOS y Linux. En otras palabras, ¡hace que sea muy fácil instalar las herramientas que necesitas! La documentación oficial de Conda es un buen punto de partida para empezar a utilizar Conda. Bactopia se ha probado con el instalador Miniforge, pero el instalador Anaconda debería funcionar igual.
Una vez que haya configurado Conda, estará listo para crear un entorno para Bactopia.
# Recommended mamba create -n bactopia -c conda-forge -c bioconda bactopia # or with standard conda conda create -n bactopia -c conda-forge -c bioconda bactopia
Después de unos minutos, tendrá un nuevo entorno de conda llamado apropiadamente bactopia . Para activar este entorno, podrá utilizar el siguiente comando:
conda activate bactopia
Y listo, ¡ya está todo listo para comenzar a procesar sus datos!
Si ha utilizado Bactopia en su trabajo, asegúrese de citar cualquier conjunto de datos o herramientas que haya utilizado. Se ha puesto a disposición una lista de cada conjunto de datos/herramienta utilizada por Bactopia.
Si es necesario actualizar una cita, ¡hágamelo saber!
Bactopia es verdaderamente un caso de "pararse sobre los hombros de gigantes" . Casi todos los componentes de Bactopia fueron creados por otros y puestos a disposición del público de forma gratuita.
Me gustaría expresar personalmente mi agradecimiento y gratitud a los autores de estos paquetes de software y conjuntos de datos públicos. Si has llegado hasta aquí, ¿te debo una cerveza? (¡o café ☕!) si alguna vez nos encontramos en persona. De verdad, muchas gracias!
En caso de que Bactopia no se ajuste a sus necesidades, aquí hay algunas alternativas que puede consultar. Yo personalmente no los he usado, ¡pero es posible que los encuentres que se ajusten a tus necesidades! Si tuvo problemas al utilizar Bactopia, ¡no dude en comunicarse con nosotros!
AQUAMIS
Deneke C, Brendebach H, Uelze L, Borowiak M, Malorny B, Tausch SH. Control de calidad, ensamblaje y detección de contaminación para especies específicas en secuencias de aislados microbianos con AQUAMIS. Genes . 2021;12. doi:10.3390/genes12050644
ASA³P
Schwengers O, Hoek A, Fritzenwanker M, Falgenhauer L, Hain T, Chakraborty T, Goesmann A. ASA³P: un canal automático y escalable para el ensamblaje, anotación y análisis de alto nivel de aislados bacterianos estrechamente relacionados. PLoS Comput Biol 2020;16:e1007134. https://doi.org/10.1371/journal.pcbi.1007134.
MicroTUBO
Murigneux V, Roberts LW, Forde BM, Phan MD, Nhu NTK, Irwin AD, Harris PNA, Paterson DL, Schembri MA, Whiley DM, Beatson SA MicroPIPE: validación de un flujo de trabajo de extremo a extremo para la construcción completa del genoma bacteriano de alta calidad . BMC Genomics , 22(1), 474. (2021) https://doi.org/10.1186/s12864-021-07767-z
Nullarbor
Seemann T, Gonçalves da Silva A, Bulach DM, Schultz MB, Kwong JC, Howden BP. Nullarbor Github https://github.com/tseemann/nullarbor
ProkEvo
Pavlovikj N, Gomes-Neto JC, Deogun JS, Benson AK ProkEvo: un marco automatizado, reproducible y escalable para análisis genómicos de poblaciones bacterianas de alto rendimiento. PeerJ , e11376 (2021) https://doi.org/10.7717/peerj.11376
Genómica bacteriana de salud pública
Libuit K, Ambrosio F, Kapsak C Salud pública Genómica bacteriana GitHub https://github.com/theiagen/public_health_bacterial_genomics
mapar
Sserwadda I, Mboowa G rMAP: el canal de análisis microbiano rápido para datos de secuencia del genoma completo del grupo bacteriano ESKAPE. Genómica microbiana , 7 (6). (2021) https://doi.org/10.1099/mgen.0.000583
TORMES
Quijada NM, Rodríguez-Lázaro D, Eiros JM, Hernández M. TORMES: un proceso automatizado para el análisis del genoma bacteriano completo. Bioinformática 2019;35:4207–12. https://doi.org/10.1093/bioinformatics/btz220.
¡Tus comentarios son muy valiosos! Si tiene algún problema al utilizar Bactopia, tiene preguntas o tiene algunas ideas para mejorar Bactopia, le recomiendo que lo envíe al Rastreador de problemas.
Licencia MIT
Petit III RA, Read TD, Bactopia: un canal flexible para el análisis completo de genomas bacterianos. mSistemas . 5 (2020), https://doi.org/10.1128/mSystems.00190-20.
Robert A.Petit III
Twitter: @rpetit3
El apoyo a este proyecto provino (en parte) de una beca de bioinformática de salud pública de Emory financiada por el Programa de Infecciones Emergentes de los CDC (U50CK000485) PPHF/ACA: Enhancing Epidemiology and Laboratory Capacity, la División de Salud Pública de Wyoming y el Centro de Epidemiología Aplicada de Patógenos y Control de Brotes (CAPE).