ヒント(コピーn UmberのバリエーションとTranslocation検出のためのHI -C)、HI -CデータからCNVと転座を検出する計算方法。ヒントには、 Hint-Pre 、 Hint-CNV 、およびHint-TLの3つの主要なコンポーネントがあります。 Hint-Pre Preprocesses hi-c DataとContact Matrixを計算します。コンタクトマトリックスは、任意の2つのゲノム遺伝子座の間に連絡先頻度を保存します。 HINT-CNVとHINT-TLの両方は、Hi-Cコンタクトマトリックスから始まり、コピー数セグメントと染色体間転座をそれぞれ予測します。
RおよびRパッケージ
PythonおよびPythonパッケージ
Javaおよび関連ツール(オプション:JuicerツールでHI-Cデータを処理する場合に必要)
Perl
その他の依存関係
方法1:コンドラを使用してインストールします(強くお勧めします)
$ conda install -c su hint
または
$ conda install hint
方法2:PIPを使用してPYPIからインストールします。
$ pip install HiNT-Packages
方法3:手動でインストールします
git clone https://github.com/parklab/HiNT.git
をダウンロードしてください$ python setup.py install
でインストールします***タイプ$ hint
正常にインストールされたかどうかをテストする
方法4:Dockerコンテナでヒントを実行します(強くお勧めします)
$ docker pull suwangbio/hint
$ docker run suwangbio/hint hint
Docker Hubのヒントページで使用法の詳細を参照してください
$ unzip hg19.zip
$ unzip hg19.zip
$ unzip hg19.zip
ヒントPRE:Hi-Cデータの前処理。ヒントPREは、1つのコマンドラインでマトリックスの作成と正規化に連絡し、連絡先のマトリックスの作成と正規化を行います。
$ hint pre -d /path/to/hic_1.fastq.gz,/path/to/hic_2.fastq.gz -i /path/to/bwaIndex/hg19/hg19.fa --refdir /path/to/refData/hg19 --informat fastq --outformat cooler -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --coolerpath /path/to/cooler
$ hint pre -d /path/to/test.bam --refdir /path/to/refData/hg19 --informat bam --outformat juicer -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --juicerpath /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
これらのツールの絶対パスを取得するために$ which cooler
$ which pairtools
使用する$ which samtools
を使用します/path/to/juicer_tools.1.8.9_jcuda.0.8.jar
詳細とその他のオプションをご覧ください
$ hint pre -h
ヒントCNV:コピー数情報の予測、およびHi-Cからのセグメンテーション。
$ hint cnv -m contactMatrix.cool -f cooler --refdir /path/to/refDir/hg19 -r 50 -g hg19 -n test -o /path/to/outputDir --bicseq /path/to/BICseq2-seg_v0.7.3 -e MboI
$ hint cnv -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/50000 -f cooler --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --maptrack 36mer
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --doiter
/path/to/BICseq2-seg_v0.7.3
このパッケージを保存するパスである必要があります
詳細とその他のオプションをご覧ください
$ hint cnv -h
ヒントTL:HI-C染色体間相互作用マトリックスからの染色体間転座とブレークポイントの検出。
$ hint tl -m /path/to/data_1Mb.cool,/path/to/data_100kb.cool --chimeric /path/to/test_chimeric.sorted.pairsam.gz --refdir /path/to/refDir/hg19 --backdir /path/to/backgroundMatrices/hg19 --ppath /path/to/pairix -f cooler -g hg19 -n test -o /path/to/outputDir
$ hint tl -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/1000000,/path/to/4DNFIS6HAUPP.mcool::/resolutions/100000 -f cooler --refdir /path/to/refDir/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12
$ hint tl -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refData/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12 -o HiNTtransl_juicerOUTPUT
$ which pairix
使用します
詳細とその他のオプションをご覧ください
$ hint tl -h
ヒント-PRE出力ディレクトリには、見つかります
jobname.bam
bam形式でロスレスファイルを調整しましたjobname_merged_valid.pairs.gz
ペアをペア形式で読み取りますjobname_chimeric.sorted.pairsam.gz
曖昧なキメラ読み取りペアペアム形式でのブレークポイント検出に使用されるペアjobname_valid.sorted.deduped.pairsam.gz
有効な読み取りペアhi-c連絡先マトリックス作成に使用されるペアjobname.mcool
hi-c連絡先マトリックスはクールな形式でマトリックスを連絡しますjobname.hic
hi-c連絡先マトリックスは、HIC形式でマトリックスを連絡しますHint-CNV出力ディレクトリには、見つかります
jobname_GAMPoisson.pdf
GAM回帰結果segmentation/jobname_bicsq_allchroms.txt
log2コピー比とtxtファイルのp値を備えたCNVセグメントsegmentation/jobname_resolution_CNV_segments.png
図CNVセグメントを視覚化しますsegmentation/jobname_bicseq_allchroms.l2r.pdf
各ビンのlog2コピー配給を視覚化する図(bin size =解像度を設定)segmentation/other_files
bic-seqの実行に使用される中間ファイルjonname_dataForRegression/*
hi-cバイアスを削除した後の残差に使用されるデータHint-TL出力ディレクトリには、見つかります
jobname_Translocation_IntegratedBP.txt
最終的な統合転座ブレークポイントjobname_chrompairs_rankProduct.txt
ランク製品は、潜在的な転座化された染色体ペアを予測しましたotherFolders
転座のブレークポイントを識別するために使用されます