(c) 2017 티모시 베커 & 이완핑
SVE는 SV(구조적 변형) 감지를 위한 Python 스크립트 기반 실행 엔진으로, 모든 수준의 데이터 입력, 원시 FASTQ, 정렬된 BAM 또는 변형 호출 형식(VCF)에 사용할 수 있으며 통합 VCF를 출력으로 생성합니다. 설계상 SVE는 기본적으로 정렬, 재정렬 및 최첨단 SV 호출 알고리즘의 앙상블로 구성됩니다. BreakDancer, BreakSeq, cnMOPS, CNVnator, DELLY, Hydra 및 LUMPY가 있습니다. FusorSV는 성능을 평가하고 SV 호출 알고리즘 앙상블에서 호출 세트를 병합하는 데이터 마이닝 접근 방식인 FusorSV도 내장되어 있습니다.
ROOT 환경을 설정해주세요.
export ROOTSYS=/ROOT_Build_Path
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$ROOTSYS/lib
git clone --recursive https://github.com/TheJacksonLaboratory/SVE.git
cd SVE
make
python2.7 헤더 파일을 확인하고 Makefile에서 "CFLAGS_FUSOR_SV"를 수정하세요. 헤더 파일은 "/usr/include/python2.7"에 있을 수 있으며 대신 "CFLAGS_FUSOR_SV=-I /usr/include/python2.7"을 사용할 수 있습니다.
make FusorSV
또는 setup.py를 통해 FusorSV를 설치할 수 있습니다.
cd SVE/scripts/FusorSV/
python setup.py build_ext --inplace
tar -zxvf data.tar.gz
또는 Dockerfile과 Docker 이미지가 제공됩니다. 시스템 설정에 따라 docker 사용에 sudo가 필요할 수 있습니다.
cd SVE
docker build .
저장소에서 도커 이미지를 가져옵니다.
docker pull wanpinglee/sve
SVE는 /tools/SVE를 기반으로 구축되었습니다. 도움말을 확인하세요.
/tools/SVE/bin/sve
FASTQ의 짧은 읽기는 지정된 FASTA에 대해 매핑되고 정렬된 BAM이 생성됩니다.
bin/sve align [options] -r <FASTA> <FASTQ1 [FASTQ2]>
읽기가 BAM 형식으로 제공되는 경우 재정렬은 FASTA에 대한 읽기를 다시 매핑하고 정렬된 BAM을 생성합니다. SpeedSeq을 사용하여 재정렬을 수행합니다.
bin/sve realign -r <FASTA> <BAM>
SV 호출에 사용할 수 있는 SV 호출 알고리즘은 7가지가 있습니다. VCF가 생성됩니다.
bin/sve call -r <FASTA> -g <hg19|hg38|others> -a <breakdancer|breakseq|cnvnator|hydra|delly|lumpy|cnmops> <BAM [BAM ...]>
호출 후 각 샘플에는 사용된 호출자 수에 따라 여러 개의 VCF가 있을 수 있습니다. 샘플의 VCF를 폴더에 모아주세요.
vcf는 SVE ID를 사용하여 호출자를 표시해야 합니다.
SVE ID | 방문객 |
---|---|
4 | 브레이크댄서(v1.4.5) |
9 | cn.MOPS(v1.20) |
10 | CNVnator(v0.3.3) |
11 | 델리(v2) |
14* | 게놈STRiP |
17 | 히드라 |
18 | 럼피 |
35 | BreakSeq(v2.2) |
0 | 진실(선택사항) |
참고*: 라이센스 문제로 인해 GenomeSTRiP는 SVE에 내장되어 있지 않습니다. 그러나 FusorSV 기본 모델은 GenomeSTRiP VCF를 처리할 수 있습니다.
예제 입력 vcf 파일은 다음과 같이 구성될 수 있습니다. vcfFiles는 FusorSV의 -i에 대한 인수입니다.
python scripts/FusorSV/FusorSV.py -f scripts/FusorSV/data/models/default.pickle -L DEFAULT -r <FASTA> -i <vcfFiles>/ -p <THREADS> -o <OUT_DIR>
S0.vcf에 따르면 새 모델이 생성되고 VCF가 새 모델에 의해 병합됩니다.
python scripts/FusorSV/FusorSV.py -L DEFAULT -r <FASTA> -i <vcfFiles>/ -p <THREADS> -o <OUT_DIR>
이 프로젝트는 GPL-3.0 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 라이선스를 참조하세요.