Bactopia는 박테리아 게놈의 완전한 분석을 위한 유연한 파이프라인입니다. Bactopia의 목표는 광범위한 도구 세트를 사용하여 데이터를 처리하여 분석의 재미있는 부분을 더 빨리 얻을 수 있도록 하는 것입니다!
Bactopia는 Bactopia 분석 파이프라인과 Bactopia 도구의 두 가지 주요 부분으로 나눌 수 있습니다.
Bactopia 분석 파이프라인은 Bactopia의 주요 분리별 워크플로우입니다. Nextflow로 구축된 입력 FASTQ(로컬 또는 SRA/ENA에서 사용 가능)는 품질 관리, 어셈블리, 주석, 최소 스케치 쿼리, 시퀀스 타이핑 등을 포함한 다양한 분석을 거칩니다.
Bactopia 도구는 비교 분석을 위한 독립적인 작업 흐름 세트입니다. 비교 분석에는 요약 보고서, 범게놈 또는 계통수 구성이 포함될 수 있습니다. Bactopia의 예측 가능한 출력 구조를 사용하면 Bactopia 도구로 처리하기 위해 포함할 샘플을 선택할 수 있습니다.
Bactopia는 Staphylococcus aureus 게놈을 대상으로 하는 우리(Tim Read와 나 자신)가 출시한 워크플로우인 Staphopia에서 영감을 받았습니다. Staphopia에서 배운 내용과 사용자 피드백을 사용하여 Bactopia는 처음부터 유용성, 이식성 및 속도를 염두에 두고 처음부터 개발되었습니다.
빠른 시작
mamba create -y -n bactopia -c conda-forge -c bioconda bactopia conda activate bactopia bactopia datasets # Paired-end bactopia --R1 R1.fastq.gz --R2 R2.fastq.gz --sample SAMPLE_NAME --datasets datasets/ --outdir OUTDIR # Single-End bactopia --SE SAMPLE.fastq.gz --sample SAMPLE --datasets datasets/ --outdir OUTDIR # Multiple Samples bactopia prepare MY-FASTQS/ > fastqs.txt bactopia --fastqs fastqs.txt --datasets datasets --outdir OUTDIR # Single ENA/SRA Experiment bactopia --accession SRX000000 --datasets datasets --outdir OUTDIR # Multiple ENA/SRA Experiments bactopia search "staphylococcus aureus" > accessions.txt bactopia --accessions accessions.txt --dataset datasets --outdir ${OUTDIR}
Bactopia에는 워크플로우에 많은 도구가 내장되어 있습니다. 상상할 수 있듯이 이러한 모든 도구는 수많은 종속성을 초래하며 종속성을 탐색하는 것은 종종 매우 실망스러운 프로세스로 바뀔 수 있습니다. 이를 염두에 두고 Bactopia는 처음부터 Conda를 사용하여 설치할 수 있는 프로그램만 포함하도록 개발되었습니다.
Conda는 Windows, macOS 및 Linux에서 실행되는 오픈 소스 패키지 관리 시스템 및 환경 관리 시스템입니다. 즉, 필요한 도구를 설치하는 것이 매우 쉽습니다! 공식 Conda 문서는 Conda를 시작하기 위한 좋은 출발점입니다. Bactopia는 Miniforge 설치 프로그램을 사용하여 테스트되었지만 Anaconda 설치 프로그램도 동일하게 작동합니다.
Conda를 모두 설정하고 나면 Bactopia용 환경을 만들 준비가 된 것입니다.
# Recommended mamba create -n bactopia -c conda-forge -c bioconda bactopia # or with standard conda conda create -n bactopia -c conda-forge -c bioconda bactopia
몇 분 후에는 bactopia 라는 이름의 새로운 conda 환경이 생성됩니다. 이 환경을 활성화하려면 다음 명령을 사용할 수 있습니다.
conda activate bactopia
이제 데이터 처리를 시작할 준비가 모두 완료되었습니다!
귀하의 작업에 Bactopia를 사용한 경우, 사용했을 수 있는 데이터세트나 도구를 모두 인용해 주시기 바랍니다. Bactopia에서 사용하는 각 데이터세트/도구 목록이 공개되었습니다.
인용을 업데이트해야 하는 경우 알려주시기 바랍니다!
백토피아는 그야말로 '거인의 어깨 위에 올라선' 사례다. Bactopia의 거의 모든 구성 요소는 다른 사람들에 의해 만들어졌으며 대중에게 무료로 제공되었습니다.
개인적으로 이러한 소프트웨어 패키지와 공개 데이터 세트의 작성자에게 많은 감사를 표하고 싶습니다. 여기까지 오셨다면, 맥주 한 잔 빚졌나요? (혹은 커피 찻잔!) 우리가 직접 만난다면요. 정말로, 정말 감사합니다!
Bactopia가 귀하의 요구 사항에 맞지 않는 경우 다음과 같은 대안을 확인해 보세요. 저는 개인적으로 사용하지 않았지만 귀하의 필요에 맞게 찾을 수 있을 것입니다! Bactopia를 사용하면서 문제가 발생하면 언제든지 문의해 주세요!
아쿠아미스
Deneke C, Brendebach H, Uelze L, Borowiak M, Malorny B, Tausch SH. AQUAMIS를 사용한 미생물 분리 서열의 종별 품질 관리, 조립 및 오염 검출. 유전자 . 2021;12. doi:10.3390/genes12050644
ASAóP
Schwengers O, Hoek A, Fritzenwanker M, Falgenhauer L, Hain T, Chakraborty T, Goesmann A. ASA³P: 밀접하게 관련된 박테리아 분리물의 조립, 주석 및 상위 수준 분석을 위한 자동 확장 가능한 파이프라인입니다. PLoS Comput Biol 2020;16:e1007134. https://doi.org/10.1371/journal.pcbi.1007134.
마이크로파이프
Murigneux V, Roberts LW, Forde BM, Phan MD, Nhu NTK, Irwin AD, Harris PNA, Paterson DL, Schembri MA, Whiley DM, Beatson SA MicroPIPE: 고품질의 완전한 박테리아 게놈 구성을 위한 엔드투엔드 워크플로우 검증 . BMC Genomics , 22(1), 474. (2021) https://doi.org/10.1186/s12864-021-07767-z
눌라보
Seemann T, Goncalves da Silva A, Bulach DM, Schultz MB, Kwong JC, Howden BP. Nullarbor Github https://github.com/tseemann/nullarbor
프로크에보
Pavlovikj N, Gomes-Neto JC, Deogun JS, Benson AK ProkEvo: 처리량이 많은 박테리아 집단 게놈 분석을 위한 자동화되고 재현 가능하며 확장 가능한 프레임워크입니다. PeerJ , e11376 (2021) https://doi.org/10.7717/peerj.11376
공중보건 세균 유전체학
Libuit K, Ambrosio F, Kapsak C 공중 보건 세균 유전체학 GitHub https://github.com/theiagen/public_health_bacterial_genomics
rMAP
Sserwadda I, Mboowa G rMAP: ESKAPE 박테리아 그룹 전체 게놈 서열 데이터를 위한 신속한 미생물 분석 파이프라인. 미생물 유전체학 , 7(6). (2021) https://doi.org/10.1099/mgen.0.000583 See More
토르메스
Quijada NM, Rodríguez-Lázaro D, Eiros JM, Hernández M. TORMES: 전체 박테리아 게놈 분석을 위한 자동화된 파이프라인. 생물정보학 2019;35:4207–12. https://doi.org/10.1093/bioinformatics/btz220.
귀하의 의견은 매우 소중합니다! Bactopia를 사용하면서 문제가 발생하거나, 질문이 있거나, Bactopia를 개선할 수 있는 아이디어가 있는 경우 이슈 트래커에 제출하시기 바랍니다.
MIT 라이센스
Petit III RA, Read TD, Bactopia: 박테리아 게놈의 완전한 분석을 위한 유연한 파이프라인. m시스템 . 5 (2020), https://doi.org/10.1128/mSystems.00190-20.
로버트 A. 프티 3세
트위터: @rpetit3
이 프로젝트에 대한 지원은 CDC 신흥 감염 프로그램(U50CK000485) PPHF/ACA: 전염병학 및 실험실 역량 강화, 와이오밍 공중 보건 부서, 응용 병원체 역학 및 응용 병원체 역학 센터의 자금 지원을 받는 에모리 공중 보건 생물정보학 펠로우십에서 (일부) 이루어졌습니다. 발병 통제(CAPE).