Astuce ( HI -C pour la variation de la copie et la détection de ranslocation T ), une méthode de calcul pour détecter les CNV et les translocations à partir de données Hi-C. L'un indice a trois composants principaux: l'indice-prre , l'inscription-CNV et l'instination . PRÉCORISSANCES PRÉCORISES HINT-PRE et calcule la matrice de contact, qui stocke les fréquences de contact entre deux loci génomiques; L'insuffisance et l'inscription commencent tous deux par la matrice de contact Hi-C, prédit respectivement les segments de numéro de copie et les translocations inter-chromosomiques, respectivement
Packages R et R
Packages python et python
Java et outils connexes (facultatif: requis lorsque vous souhaitez traiter les données HI-C avec des outils de presse-agrumes)
Perler
Autres dépendances
Méthode 1: Installer à l'aide de conda (hautement recommandé)
$ conda install -c su hint
ou
$ conda install hint
Méthode 2: Installer à partir de PYPI à l'aide de PIP.
$ pip install HiNT-Packages
Méthode 3: Installer manuellement
git clone https://github.com/parklab/HiNT.git
$ python setup.py install
*** Type $ hint
pour tester si un indice est installé avec succès
Méthode 4: Exécutez un indice dans un conteneur Docker (fortement recommandé)
$ docker pull suwangbio/hint
$ docker run suwangbio/hint hint
Voir les détails de l'utilisation sur la page d'assistance de Docker Hub
$ unzip hg19.zip
$ unzip hg19.zip
$ unzip hg19.zip
Astuce pré: prétraitement des données HI-C. L'indice pré-alignement, la création et la normalisation de la matrice de contact dans une ligne de commande.
$ hint pre -d /path/to/hic_1.fastq.gz,/path/to/hic_2.fastq.gz -i /path/to/bwaIndex/hg19/hg19.fa --refdir /path/to/refData/hg19 --informat fastq --outformat cooler -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --coolerpath /path/to/cooler
$ hint pre -d /path/to/test.bam --refdir /path/to/refData/hg19 --informat bam --outformat juicer -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --juicerpath /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
Utilisez $ which samtools
$ which pairtools
$ which cooler
pour obtenir le chemin absolu de ces outils, et /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
devrait être le chemin où vous stockez ce fichier
Voir les détails et plus d'options
$ hint pre -h
Astuce CNV: prédiction des informations du numéro de copie, ainsi que la segmentation de Hi-C.
$ hint cnv -m contactMatrix.cool -f cooler --refdir /path/to/refDir/hg19 -r 50 -g hg19 -n test -o /path/to/outputDir --bicseq /path/to/BICseq2-seg_v0.7.3 -e MboI
$ hint cnv -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/50000 -f cooler --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --maptrack 36mer
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --doiter
/path/to/BICseq2-seg_v0.7.3
devrait être le chemin où vous stockez ce package
Voir les détails et plus d'options
$ hint cnv -h
Astuce TL: Translocations interchromosomales et détection des points de rupture à partir de matrices d'interaction inter-chromosomales HI-C.
$ hint tl -m /path/to/data_1Mb.cool,/path/to/data_100kb.cool --chimeric /path/to/test_chimeric.sorted.pairsam.gz --refdir /path/to/refDir/hg19 --backdir /path/to/backgroundMatrices/hg19 --ppath /path/to/pairix -f cooler -g hg19 -n test -o /path/to/outputDir
$ hint tl -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/1000000,/path/to/4DNFIS6HAUPP.mcool::/resolutions/100000 -f cooler --refdir /path/to/refDir/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12
$ hint tl -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refData/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12 -o HiNTtransl_juicerOUTPUT
Utilisez $ which pairix
pour obtenir le chemin absolu de Pairix
Voir les détails et plus d'options
$ hint tl -h
Dans le répertoire de sortie de l'indice, vous trouverez
jobname.bam
Fichier sans perte aligné au format BAMjobname_merged_valid.pairs.gz
lit les paires au format de pairejobname_chimeric.sorted.pairsam.gz
paires de lecture chimériques ambiguës utilisées pour la détection des points d'arrêt au format pairejobname_valid.sorted.deduped.pairsam.gz
paires de lecture valides utilisées pour la création de matrice de contact hi-c au format pairsamjobname.mcool
Hi-C Contact Matrix au format cooljobname.hic
Hi-C Contact Matrix au format HICDans le répertoire de sortie Hint-CNV, vous trouverez
jobname_GAMPoisson.pdf
le résultat de la régression du GAMsegmentation/jobname_bicsq_allchroms.txt
segments cnv avec rapport log2 et valeurs p dans le fichier txtsegmentation/jobname_resolution_CNV_segments.png
figurez-vous pour visualiser les segments CNVsegmentation/jobname_bicseq_allchroms.l2r.pdf
Figure pour visualiser Log2 Copier la ration dans chaque bac (Bin Size = Résolution que vous définissez)segmentation/other_files
fichiers intermédiaires de fichiers utilisés pour exécuter BIC-seqjonname_dataForRegression/*
DONNÉES UTILISÉS POUR RÉGRESSION ainsi que pour les résidus après avoir supprimé les biais HI-CDans le répertoire de sortie de l'indice, vous trouverez
jobname_Translocation_IntegratedBP.txt
le point d'arrêt de translocation intégré finaljobname_chrompairs_rankProduct.txt
Rank Produit prédit potentiel paires chromosomes transloquéesotherFolders
fichiers intermédiaires utilisés utilisés pour identifier les points d'arrêt de translocation