우리는 이 프로젝트의 기능을 대체하는 새로운 생물정보학 리소스를 보유하고 있습니다! 여기에서 새로운 저장소를 확인하세요: remora.
이 저장소는 현재 지원되지 않으며 사용을 권장하지 않습니다. 업그레이드가 불가능한 경우 응용 분야에 대한 도움이 필요하면 Oxford Nanopore([email protected])에 문의하세요.
Tombo는 주로 나노기공 서열 분석 데이터에서 변형된 뉴클레오티드를 식별하는 데 사용되는 도구 모음입니다. Tombo는 또한 원시 나노포어 신호를 분석하고 시각화하기 위한 도구도 제공합니다.
모든 Tombo 명령 및 알고리즘에 대한 자세한 문서는 tombo 문서 페이지에서 찾을 수 있습니다.
Conda 설치(선호되는 방법)
# bioconda 환경을 통해 설치 (https://bioconda.github.io/#set-up-channels) conda install -c bioconda ont-tombo
Tombo 분석의 첫 번째 단계는 원시 나노포어 읽기를 다시 표시하는 것(참조 서열 정렬에 대한 원시 신호)입니다. 이는 인덱스를 생성하고 다운스트림 분석을 수행하는 데 필요한 원시 신호 정렬을 저장합니다.
이 예에서는 E. coli 샘플을 dam 및 dcm 메틸화에 대해 테스트합니다(CpG 모델은 인간 분석에도 사용 가능). 이러한 결과를 사용하여 원시 신호는 가장 크게 수정된 DCM 위치에 플롯되고 댐 수정된 기본 예측은 다운스트림 처리 또는 게놈 브라우저의 시각화에 사용하기 위해 흔들기 파일로 출력됩니다.
tombo 재구배 경로/to/fast5s/genome.fasta --processes 4 --num-most-common-errors 5 tombo discover_modifications Alternative_model --fast5-basedirs 경로/to/fast5s/ --통계-파일-기본 이름 Native.e_coli_sample --대체 기반 댐 DCM --프로세스 4 # 가장 중요한 DCM 위치에 원시 신호를 표시합니다. 톰보 플롯 Most_significant --fast5-basedirs 경로/to/fast5s/ --통계-파일 이름 Native.e_coli_sample.dcm.tombo.stats --플롯-표준-모델 --플롯-대체-모델 DCM --pdf-파일 이름 샘플.most_significant_dcm_sites.pdf # 각 유효한 참조 사이트에서 수정된 읽기의 예상 비율이 포함된 가발 파일을 생성합니다. tombo text_output browser_files --statistics-filename Native.e_coli_sample.dam.tombo.stats --파일 유형damened_fraction --browser-file-basename Native.e_coli_sample.dam # 참조용으로 성공적으로 처리된 읽기 범위 파일도 생성합니다. tombo text_output browser_files --fast5-basedirs 경로/to/fast5s/ --파일 유형 적용 범위 --browser-file-basename Native.e_coli_sample
모티프 모델( CpG
, dcm
및 dam
; 가장 정확함)과 모든 상황별 대체 기본 모델( 5mC
및 6mA
, 더 정확함)이 선호되지만 Tombo를 사용하면 사용자가 다른 또는 심지어 알려지지 않은 기본 수정 사항도 조사할 수 있습니다.
다음은 de_novo
방법(예상되는 정규 신호 수준의 편차 감지)과 level_sample_compare
방법(관심 있는 두 샘플 간 신호 수준의 편차 감지, 높은 적용 범위에서 가장 잘 작동함)을 실행하는 두 가지 예제 명령입니다.
tombo discover_modifications de_novo --fast5-basedirs 경로/to/fast5s/ --statistics-file-basename 샘플.de_novo_Detect --processes 4 tombo text_output browser_files --statistics-filename 샘플.de_novo_Detect.tombo.stats --browser-file-basename 샘플.de_novo_Detect --file-types 완충_분수 tombo detector_modifications level_sample_compare --fast5-basedirs 경로/to/fast5s/ --control-fast5-basedirs 경로/to/control/fast5s/ --minimum-test-reads 50 --processes 4 --statistics-file-basename 샘플.level_samp_comp_Detect tombo text_output browser_files --statistics-filename 샘플.level_samp_comp_Detect.tombo.stats --browser-file-basename 샘플.level_samp_comp_Detect --file-types 통계
설명서 페이지에서 더 완전한 튜토리얼을 확인하세요.
Tombo는 pip를 통해 설치할 수 있지만 모든 시각화 기능을 위해서는 R 설치와 R 패키지 종속성(ggplot2 및 Gridextra)이 필요합니다.
# pip 패키지 설치(cython 최적화를 위해 tombo 이전에 numpy 설치 필요) pip 설치 numpy pip 설치 ont-tombo[전체]
Tombo는 다음 명령을 실행하여 소스에서 직접 설치할 수도 있습니다(주로 개발용).
자식 클론 https://github.com/nanoporetech/tombo CD 톰보 pip 설치 -e .
Tombo는 다중 읽기 FAST5 형식 읽기 데이터 파일을 지원하지 않습니다. Tombo로 처리하기 전에 단일 읽기 FAST5 형식으로 변환하려면 ont_fast5_api 패키지의 multi_to_single_fast5
명령을 사용하십시오.
© 2017-18 옥스퍼드 나노포어 테크놀로지스(Oxford Nanopore Technologies Ltd.)
Tombo는 포함된 MPL2 라이센스 조건에 따라 배포됩니다.
Stoiber, MH 등. 게놈 유도 나노기공 신호 처리를 통해 구현되는 DNA 변형의 새로운 식별. bioRxiv (2016).
http://biorxiv.org/content/early/2017/04/10/094672