Hinweis ( HI -C für die Kopie n UMBer -Variation und die Erkennung von Ranslokation ), eine Rechenmethode zum Erkennen von CNVs und Translokationen aus Hi -C -Daten. Tipp hat drei Hauptkomponenten: Tipp-Pre , Hint-CNV und Hint-TL . TIP-PRE-PRE-Vorverarbeitungen Hi-C-Daten und berechnet die Kontaktmatrix, die Kontaktfrequenzen zwischen zwei beliebigen genomischen Loci speichert. Sowohl Hint-CNV als auch Hint-TL beginnen mit Hi-C-Kontaktmatrix, prognostizieren Kopiennummernsegmente bzw. inter-chromosomale Translokationen
R- und R -Pakete
Python- und Python -Pakete
Java und verwandte Tools (optional: Erforderlich, wenn Sie Hi-C-Daten mit Entsorgungs-Tools verarbeiten möchten)
Perl
Andere Abhängigkeiten
Methode1: Installation mit Conda (sehr empfohlen)
$ conda install -c su hint
oder
$ conda install hint
Methode2: Installieren Sie von PYPI mit PIP.
$ pip install HiNT-Packages
Methode3: Manuell installieren
git clone https://github.com/parklab/HiNT.git
$ python setup.py install
*** Geben Sie $ hint
zum Testen, ob Hinweise erfolgreich installiert wird
Methode 4: Tipp in einem Docker -Container ausführen (sehr empfohlen)
$ docker pull suwangbio/hint
$ docker run suwangbio/hint hint
Siehe Details zur Nutzung auf Hinweisseite bei Docker Hub
$ unzip hg19.zip
$ unzip hg19.zip
$ unzip hg19.zip
Hinweis Pre: Vorverarbeitungs-Hi-C-Daten. Tipp Pre Fites Alignment, Kontaktmatrixerstellung und Normalisierung in einer Befehlszeile.
$ hint pre -d /path/to/hic_1.fastq.gz,/path/to/hic_2.fastq.gz -i /path/to/bwaIndex/hg19/hg19.fa --refdir /path/to/refData/hg19 --informat fastq --outformat cooler -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --coolerpath /path/to/cooler
$ hint pre -d /path/to/test.bam --refdir /path/to/refData/hg19 --informat bam --outformat juicer -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --juicerpath /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
Verwenden Sie $ which samtools
$ /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
$ which pairtools
$ which cooler
, um den absoluten Pfad dieser Tools zu erhalten
Siehe Details und weitere Optionen
$ hint pre -h
Hinweis CNV: Vorhersage von Kopiennummerninformationen sowie Segmentierung von Hi-C.
$ hint cnv -m contactMatrix.cool -f cooler --refdir /path/to/refDir/hg19 -r 50 -g hg19 -n test -o /path/to/outputDir --bicseq /path/to/BICseq2-seg_v0.7.3 -e MboI
$ hint cnv -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/50000 -f cooler --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --maptrack 36mer
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --doiter
/path/to/BICseq2-seg_v0.7.3
sollte der Pfad sein, in dem Sie dieses Paket speichern
Siehe Details und weitere Optionen
$ hint cnv -h
Hinweis TL: Interchromosomale Translokationen und Breakpoints Nachweis von HI-C-interromosomalen Wechselwirkungsmatrizen.
$ hint tl -m /path/to/data_1Mb.cool,/path/to/data_100kb.cool --chimeric /path/to/test_chimeric.sorted.pairsam.gz --refdir /path/to/refDir/hg19 --backdir /path/to/backgroundMatrices/hg19 --ppath /path/to/pairix -f cooler -g hg19 -n test -o /path/to/outputDir
$ hint tl -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/1000000,/path/to/4DNFIS6HAUPP.mcool::/resolutions/100000 -f cooler --refdir /path/to/refDir/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12
$ hint tl -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refData/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12 -o HiNTtransl_juicerOUTPUT
Verwenden Sie $ which pairix
um den absoluten Pairix -Pfad zu erhalten
Siehe Details und weitere Optionen
$ hint tl -h
Im Verzeichnis "Hinweis-PRE-Ausgang" finden Sie
jobname.bam
stimmte verlustfreie Datei im BAM -Format ausjobname_merged_valid.pairs.gz
liest Paare im Paarformatjobname_chimeric.sorted.pairsam.gz
mehrdeutige chimäre Lesepaare, die für die Breakpoint -Erkennung im Paarsamam -Format verwendet werdenjobname_valid.sorted.deduped.pairsam.gz
Gültige Lesepaare, die für die Erstellung von Hi-C-Kontaktmatrix im Pairsam-Format verwendet werdenjobname.mcool
Hi-C-Kontaktmatrix im coolen Formatjobname.hic
Hi-C-Kontaktmatrix im HIC-FormatIm Ausgangsverzeichnis von Hint-CNV finden Sie
jobname_GAMPoisson.pdf
Das Gam -Regressionsergebnissegmentation/jobname_bicsq_allchroms.txt
CNV-Segmente mit Log2-Kopierverhältnis und P-Werten in der TXT-Dateisegmentation/jobname_resolution_CNV_segments.png
Abbildung zur Visualisierung von CNV -Segmentensegmentation/jobname_bicseq_allchroms.l2r.pdf
Abbildung, um die Log2 -Ration in jedem Bin zu visualisieren (Bin Size = Auflösung, die Sie festgelegt haben)segmentation/other_files
Intermediate-Dateien, die zum Ausführen von BIC-seq verwendet werdenjonname_dataForRegression/*
Daten, die sowohl für RegressionIm Hinweis-TL-Ausgangsverzeichnis finden Sie
jobname_Translocation_IntegratedBP.txt
Der endgültige integrierte Translokations -Breakpointjobname_chrompairs_rankProduct.txt
Rang Produkt prognostizierte potenzielle translozierte ChromosomenpaareotherFolders
Falten -Intermediate -Dateien, die zur Identifizierung der Translocation Breakpoints verwendet werden