힌트 (카피 N UMBER 변동 및 T 랜 슬로 위치 검출에 대한 HI -C), HI -C 데이터로부터 CNV 및 전위를 검출하는 계산 방법 인 힌트. 힌트에는 힌트-프레 , 힌트 -CNV 및 힌트 -TL 의 세 가지 주요 구성 요소가 있습니다. HINT-PRE PREPROCESSES HI-C 데이터 및 접촉 행렬을 계산하며, 이는 2 개의 게놈 유전자좌 사이에 접촉 주파수를 저장합니다. HINT-CNV와 HINT-TL은 모두 HI-C 접촉 행렬로 시작하여 카피 번호 세그먼트를 예측하며, 각각의 염색체 간 전위를 각각 예측합니다.
R 및 R 패키지
파이썬 및 파이썬 패키지
Java 및 관련 도구 (선택 사항 : Juicer 도구로 Hi-C 데이터를 처리 할 때 필수)
펄
다른 종속성
Method1 : Conda를 사용하여 설치 (적극 권장)
$ conda install -c su hint
또는
$ conda install hint
Method2 : PIP를 사용하여 PYPI에서 설치하십시오.
$ pip install HiNT-Packages
방법 3 : 수동으로 설치하십시오
git clone https://github.com/parklab/HiNT.git
다운로드하십시오$ python setup.py install
로 설치하십시오. *** 힌트가 성공적으로 설치되는지 테스트하려면 $ hint
입력하십시오.
방법 4 : Docker 컨테이너에서 힌트를 실행 (적극 권장)
$ docker pull suwangbio/hint
$ docker run suwangbio/hint hint
Docker Hub의 힌트 페이지의 사용에 대한 자세한 내용을 참조하십시오.
$ unzip hg19.zip
$ unzip hg19.zip
$ unzip hg19.zip
힌트 프리 : HI-C 데이터 전처리. 힌트 프리는 정렬, 한 명령 줄에서 매트릭스 생성 및 정규화에 연락합니다.
$ hint pre -d /path/to/hic_1.fastq.gz,/path/to/hic_2.fastq.gz -i /path/to/bwaIndex/hg19/hg19.fa --refdir /path/to/refData/hg19 --informat fastq --outformat cooler -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --coolerpath /path/to/cooler
$ hint pre -d /path/to/test.bam --refdir /path/to/refData/hg19 --informat bam --outformat juicer -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --juicerpath /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
use $ which samtools
$ which pairtools
$ which cooler
to get the absolute path of these tools, and /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
should be the path where you store this file
세부 사항 및 더 많은 옵션을 참조하십시오
$ hint pre -h
힌트 CNV : 카피 번호 정보의 예측 및 Hi-C의 분할.
$ hint cnv -m contactMatrix.cool -f cooler --refdir /path/to/refDir/hg19 -r 50 -g hg19 -n test -o /path/to/outputDir --bicseq /path/to/BICseq2-seg_v0.7.3 -e MboI
$ hint cnv -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/50000 -f cooler --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --maptrack 36mer
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --doiter
/path/to/BICseq2-seg_v0.7.3
은이 패키지를 저장하는 경로 여야합니다.
세부 사항 및 더 많은 옵션을 참조하십시오
$ hint cnv -h
힌트 TL : HI-C 간 염색체 상호 작용 매트릭스로부터의 크로모 좀 전위 및 중단 점 검출.
$ hint tl -m /path/to/data_1Mb.cool,/path/to/data_100kb.cool --chimeric /path/to/test_chimeric.sorted.pairsam.gz --refdir /path/to/refDir/hg19 --backdir /path/to/backgroundMatrices/hg19 --ppath /path/to/pairix -f cooler -g hg19 -n test -o /path/to/outputDir
$ hint tl -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/1000000,/path/to/4DNFIS6HAUPP.mcool::/resolutions/100000 -f cooler --refdir /path/to/refDir/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12
$ hint tl -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refData/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12 -o HiNTtransl_juicerOUTPUT
쌍의 절대 경로를 얻으려면 $ which pairix
사용하십시오.
세부 사항 및 더 많은 옵션을 참조하십시오
$ hint tl -h
힌트 프레 출력 디렉토리에서는 찾을 수 있습니다
jobname.bam
BAM 형식으로 무손실 파일을 정렬합니다jobname_merged_valid.pairs.gz
쌍 형식으로 쌍을 읽습니다jobname_chimeric.sorted.pairsam.gz
모호한 키메라 읽기 Pairsam 형식의 중단 점 감지에 사용되는 쌍jobname_valid.sorted.deduped.pairsam.gz
유효한 읽기 쌍 쌍 쌍 쌍 쌍 쌍 쌍 쌍 쌍은 pairsam 형식의 매트릭스 생성jobname.mcool
hi-c 쿨 형식의 매트릭스 연락처 매트릭스jobname.hic
hi-c 연락처 매트릭스는 HIC 형식입니다힌트 -CNV 출력 디렉토리에서는 찾을 수 있습니다
jobname_GAMPoisson.pdf
게임 회귀 결과segmentation/jobname_bicsq_allchroms.txt
cnv 세그먼트 로그 2 복사 비율 및 p- 값이 txt 파일segmentation/jobname_resolution_CNV_segments.png
그림 CNV 세그먼트를 시각화합니다segmentation/jobname_bicseq_allchroms.l2r.pdf
각 빈에서 로그 2 복사 배급을 시각화하려면 (빈 크기 = 해상도)segmentation/other_files
BIC-Seq를 실행하는 데 사용되는 중간 파일jonname_dataForRegression/*
HI-C 바이어스를 제거한 후 잔차뿐만 아니라 회귀에 사용되는 데이터HINT-TL 출력 디렉토리에서는 찾을 수 있습니다
jobname_Translocation_IntegratedBP.txt
최종 통합 전위 브레이크 포인트입니다jobname_chrompairs_rankProduct.txt
rank product는 잠재적 인 전위 염색체 쌍을 예측했습니다otherFolders
중간 파일