DINT ( HI -C para cópia N UMBER Variação e detecção de ranslocation ), um método computacional para detectar CNVs e translocações de dados Hi -C. A dica tem três componentes principais: Dint-Pre , Dint-CNV e DINT-TL . Os pré-processos de pré-processos hint hi-c e calcula a matriz de contato, que armazena frequências de contato entre dois locos genômicos; Tanto o DINT-CNV quanto o DINT-TL começam com a matriz de contato Hi-C, prevê segmentos de número de cópias e translocações inter-cromossômicas, respectivamente
Pacotes R e R
Pacotes Python e Python
Java e ferramentas relacionadas (opcional: exigido quando desejar processar dados Hi-C com ferramentas de espremedor)
Perl
Outras dependências
Método1: Instale usando o CONDA (altamente recomendado)
$ conda install -c su hint
ou
$ conda install hint
Método2: Instale a partir do Pypi usando o PIP.
$ pip install HiNT-Packages
Método3: Instale manualmente
git clone https://github.com/parklab/HiNT.git
$ python setup.py install
*** Tipo $ hint
para testar se a dica foi instalada com sucesso
Método 4: Execute dica em um contêiner do Docker (altamente recomendado)
$ docker pull suwangbio/hint
$ docker run suwangbio/hint hint
Veja detalhes do uso na página de dica no Docker Hub
$ unzip hg19.zip
$ unzip hg19.zip
$ unzip hg19.zip
DINT pré: Pré-processamento de dados Hi-C. DINT ALING, Criação e normalização da matriz de contato em uma linha de comando.
$ hint pre -d /path/to/hic_1.fastq.gz,/path/to/hic_2.fastq.gz -i /path/to/bwaIndex/hg19/hg19.fa --refdir /path/to/refData/hg19 --informat fastq --outformat cooler -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --coolerpath /path/to/cooler
$ hint pre -d /path/to/test.bam --refdir /path/to/refData/hg19 --informat bam --outformat juicer -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --juicerpath /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
Use $ which samtools
$ which pairtools
$ which cooler
para obter o caminho absoluto dessas ferramentas, e /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
Veja detalhes e mais opções
$ hint pre -h
DINT CNV: Previsão de informações sobre o número de cópias, bem como a segmentação do Hi-C.
$ hint cnv -m contactMatrix.cool -f cooler --refdir /path/to/refDir/hg19 -r 50 -g hg19 -n test -o /path/to/outputDir --bicseq /path/to/BICseq2-seg_v0.7.3 -e MboI
$ hint cnv -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/50000 -f cooler --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --maptrack 36mer
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --doiter
/path/to/BICseq2-seg_v0.7.3
deve ser o caminho em que você armazena este pacote
Veja detalhes e mais opções
$ hint cnv -h
Dica TL: Translocações intercromossômicas e detecção de pontos de interrupção de matrizes de interação inter-cromossômica Hi-C.
$ hint tl -m /path/to/data_1Mb.cool,/path/to/data_100kb.cool --chimeric /path/to/test_chimeric.sorted.pairsam.gz --refdir /path/to/refDir/hg19 --backdir /path/to/backgroundMatrices/hg19 --ppath /path/to/pairix -f cooler -g hg19 -n test -o /path/to/outputDir
$ hint tl -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/1000000,/path/to/4DNFIS6HAUPP.mcool::/resolutions/100000 -f cooler --refdir /path/to/refDir/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12
$ hint tl -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refData/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12 -o HiNTtransl_juicerOUTPUT
Use $ which pairix
para obter o caminho absoluto do parix
Veja detalhes e mais opções
$ hint tl -h
No diretório de saída da dica, você encontrará
jobname.bam
alinhado arquivo sem perdas em formato BAMjobname_merged_valid.pairs.gz
lê pares em formato de paresjobname_chimeric.sorted.pairsam.gz
pares de leitura quimérica ambíguos usados para detecção de ponto de interrupção em formato de parsamjobname_valid.sorted.deduped.pairsam.gz
pares de leitura válidos usados para criação de matriz de contato hi-c em formato parsamjobname.mcool
Hi-C Matriz de contato em formato legaljobname.hic
Hi-C Matriz de contato em formato HICNo diretório de saída da dica-CNV, você encontrará
jobname_GAMPoisson.pdf
O resultado da regressão do GAMsegmentation/jobname_bicsq_allchroms.txt
segmentos CNV com taxa de cópia log2 e valores p em arquivo txtsegmentation/jobname_resolution_CNV_segments.png
figura para visualizar segmentos CNVsegmentation/jobname_bicseq_allchroms.l2r.pdf
Figura para visualizar a ração de copiar log2 em cada compartimento (tamanho do compartimento = resolução que você define)segmentation/other_files
arquivos intermediários usados para executar o BIC-seqjonname_dataForRegression/*
Dados usados para regressão e resíduos após remover vieses Hi-CNo diretório de saída da dica-tl, você encontrará
jobname_Translocation_IntegratedBP.txt
O ponto de interrupção da translocação integrada finaljobname_chrompairs_rankProduct.txt
Rank Product previu potenciais pares de cromossomos translocadosotherFolders
arquivos intermediários usados para identificar os pontos de interrupção da translocação