提示(用于副本N umber变化和TRANSLOCATION检测的HI -C),一种计算方法,用于检测HI -C数据中的CNV和易位。提示具有三个主要组成部分: Hint-Pre , Hint-CNV和Hint-TL 。提示PRE预处理HI-C数据并计算触点矩阵,该触点矩阵存储任何两个基因组基因局之间的接触频率; Hint-CNV和Hint-TL均以HI-C触点矩阵开始,预测副本编号段和染色体间易位
R和R包
Python和Python包裹
Java及相关工具(可选:需要使用Juicer工具处理HI-C数据时需要)
珀尔
其他依赖性
方法1:使用conda安装(强烈建议)
$ conda install -c su hint
或者
$ conda install hint
方法2:使用PIP从PYPI安装。
$ pip install HiNT-Packages
方法3:手动安装
git clone https://github.com/parklab/HiNT.git
$ python setup.py install
安装***类型$ hint
要测试是否成功安装了提示
方法4:在Docker容器中运行提示(强烈建议)
$ docker pull suwangbio/hint
$ docker run suwangbio/hint hint
在Docker Hub的提示页面上查看使用详细信息
$ unzip hg19.zip
$ unzip hg19.zip
$ unzip hg19.zip
提示前:预处理HI-C数据。提示在一个命令行中进行对齐,联系矩阵创建和归一化。
$ hint pre -d /path/to/hic_1.fastq.gz,/path/to/hic_2.fastq.gz -i /path/to/bwaIndex/hg19/hg19.fa --refdir /path/to/refData/hg19 --informat fastq --outformat cooler -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --coolerpath /path/to/cooler
$ hint pre -d /path/to/test.bam --refdir /path/to/refData/hg19 --informat bam --outformat juicer -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --juicerpath /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
使用$ which samtools
$ which pairtools
$ which cooler
以获取这些工具的绝对路径,以及/path/to/juicer_tools.1.8.9_jcuda.0.8.jar
应该是存储此文件的路径
查看详细信息和更多选项
$ hint pre -h
提示CNV:副本编号信息的预测以及HI-C的分割。
$ hint cnv -m contactMatrix.cool -f cooler --refdir /path/to/refDir/hg19 -r 50 -g hg19 -n test -o /path/to/outputDir --bicseq /path/to/BICseq2-seg_v0.7.3 -e MboI
$ hint cnv -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/50000 -f cooler --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --maptrack 36mer
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --doiter
/path/to/BICseq2-seg_v0.7.3
应该是您存储此软件包的路径
查看详细信息和更多选项
$ hint cnv -h
提示TL:从HI-C间相互作用矩阵检测染色体易位和断点。
$ hint tl -m /path/to/data_1Mb.cool,/path/to/data_100kb.cool --chimeric /path/to/test_chimeric.sorted.pairsam.gz --refdir /path/to/refDir/hg19 --backdir /path/to/backgroundMatrices/hg19 --ppath /path/to/pairix -f cooler -g hg19 -n test -o /path/to/outputDir
$ hint tl -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/1000000,/path/to/4DNFIS6HAUPP.mcool::/resolutions/100000 -f cooler --refdir /path/to/refDir/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12
$ hint tl -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refData/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12 -o HiNTtransl_juicerOUTPUT
使用$ which pairix
获取Paimix的绝对路径
查看详细信息和更多选项
$ hint tl -h
在提示pre输出目录中,您会发现
jobname.bam
以BAM格式对齐无损耗文件jobname_merged_valid.pairs.gz
读取对成对格式jobname_chimeric.sorted.pairsam.gz
模棱两可的嵌合读对,用于以配对格式进行断点检测jobname_valid.sorted.deduped.pairsam.gz
有效阅读对,用于HI-C Contact Matrix创建以PairSam格式创建jobname.mcool
Hi-C以凉爽格式联系矩阵jobname.hic
HI-C联络矩阵以HIC格式在Hint-CNV输出目录中,您会发现
jobname_GAMPoisson.pdf
GAM回归结果segmentation/jobname_bicsq_allchroms.txt
CNV段,log2副本比和p值在txt文件中segmentation/jobname_resolution_CNV_segments.png
图形以可视化CNV段segmentation/jobname_bicseq_allchroms.l2r.pdf
图形可视化每个bin中的log2副本评分(bin size =您设置的分辨率)segmentation/other_files
用于运行BIC-SEQ的中间文件jonname_dataForRegression/*
用于回归的数据以及删除HI-C偏见后的残差在Hint-TL输出目录中,您会发现
jobname_Translocation_IntegratedBP.txt
最终集成的易位断点jobname_chrompairs_rankProduct.txt
等级产品预测潜在的易位染色体对otherFolders
用来识别易位断点的中间文件