Sugerencia ( Hi -C para la variación de la copia y la detección de ranslocación T ), un método computacional para detectar CNV y translocaciones de datos HI -C. Sugerencia tiene tres componentes principales: TIGN-PRE , TIGN-CNV y TIGN-TL . Preprocesos de indicio de pre-pre Datos y calcula la matriz de contacto, que almacena frecuencias de contacto entre dos loci genómicos; Tanto Hint-CNV como TIGN-TL comienzan con la matriz de contacto Hi-C, predice segmentos de números de copias y translocaciones intercromosómicas, respectivamente
Paquetes R y R
Paquetes de Python y Python
Java y herramientas relacionadas (opcional: requerido cuando desea procesar datos HI-C con herramientas de exprimidor)
Perl
Otras dependencias
Método1: Instalar usando Conda (muy recomendable)
$ conda install -c su hint
o
$ conda install hint
Método2: Instale desde PYPI usando PIP.
$ pip install HiNT-Packages
Método3: instalar manualmente
git clone https://github.com/parklab/HiNT.git
$ python setup.py install
*** escriba $ hint
para probar si se instala correctamente
Método 4: Ejecute una pista en un contenedor Docker (muy recomendable)
$ docker pull suwangbio/hint
$ docker run suwangbio/hint hint
Vea los detalles del uso en la página de sugerencias en Docker Hub
$ unzip hg19.zip
$ unzip hg19.zip
$ unzip hg19.zip
Sugerencia previa: preprocesamiento de datos HI-C. Sugerencia previa alineación, creación de matriz de contacto y normalización en una línea de comando.
$ hint pre -d /path/to/hic_1.fastq.gz,/path/to/hic_2.fastq.gz -i /path/to/bwaIndex/hg19/hg19.fa --refdir /path/to/refData/hg19 --informat fastq --outformat cooler -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --coolerpath /path/to/cooler
$ hint pre -d /path/to/test.bam --refdir /path/to/refData/hg19 --informat bam --outformat juicer -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --juicerpath /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
Use $ which samtools
$ which pairtools
$ which cooler
obtiene la ruta absoluta de estas herramientas, y /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
debería ser el camino donde almacena este archivo
Ver detalles y más opciones
$ hint pre -h
Sugerencia CNV: Predicción de la información del número de copias, así como la segmentación de HI-C.
$ hint cnv -m contactMatrix.cool -f cooler --refdir /path/to/refDir/hg19 -r 50 -g hg19 -n test -o /path/to/outputDir --bicseq /path/to/BICseq2-seg_v0.7.3 -e MboI
$ hint cnv -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/50000 -f cooler --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --maptrack 36mer
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --doiter
/path/to/BICseq2-seg_v0.7.3
debería ser el camino donde almacena este paquete
Ver detalles y más opciones
$ hint cnv -h
Sugerencia TL: translocaciones intercromosómicas y detección de puntos de interrupción de matrices de interacción intercromosómica HI-C.
$ hint tl -m /path/to/data_1Mb.cool,/path/to/data_100kb.cool --chimeric /path/to/test_chimeric.sorted.pairsam.gz --refdir /path/to/refDir/hg19 --backdir /path/to/backgroundMatrices/hg19 --ppath /path/to/pairix -f cooler -g hg19 -n test -o /path/to/outputDir
$ hint tl -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/1000000,/path/to/4DNFIS6HAUPP.mcool::/resolutions/100000 -f cooler --refdir /path/to/refDir/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12
$ hint tl -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refData/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12 -o HiNTtransl_juicerOUTPUT
Use $ which pairix
para obtener la ruta absoluta de Pairix
Ver detalles y más opciones
$ hint tl -h
En el directorio de salida de indicio, encontrará
jobname.bam
Alineado Archivo sin pérdidas en formato BAMjobname_merged_valid.pairs.gz
lee pares en formato de parjobname_chimeric.sorted.pairsam.gz
pares de lectura quimérica ambigua utilizados para la detección de punto de interrupción en formato de pars de paresjobname_valid.sorted.deduped.pairsam.gz
Válido Leer Pares utilizados para Hi-C Contact Matrix Creation en formato de parsamjobname.mcool
Hi-C Contact Matrix en formato genialjobname.hic
Hi-C Contact Matrix en formato HICEn el directorio de salida de hint-CNV, encontrará
jobname_GAMPoisson.pdf
El resultado de la regresión GAMsegmentation/jobname_bicsq_allchroms.txt
segmentos CNV con relación de copia log2 y valores p en el archivo txtsegmentation/jobname_resolution_CNV_segments.png
Figura para visualizar segmentos CNVsegmentation/jobname_bicseq_allchroms.l2r.pdf
Figura para visualizar la ración de copia log2 en cada bin (bin size = resolution que establece)segmentation/other_files
Archivos intermedios utilizados para ejecutar Bic-seqjonname_dataForRegression/*
Datos utilizados para la regresión y los residuos después de eliminar los sesgos HI-CEn el directorio de salida de tinte-tl, encontrará
jobname_Translocation_IntegratedBP.txt
El punto de interrupción de translocación integrado finaljobname_chrompairs_rankProduct.txt
PRODUCTO RANGO PROBLE PUBLIS POTENCIOS CRomosoma TranslocadosotherFolders
archivos intermedios de las tardidades utilizados para identificar los puntos de interrupción de la translocación