Подсказка ( hi -c для копирования вариаций и обнаружения Ranslocation ), вычислительный метод для обнаружения CNV и транслокаций из данных HI -C. Подсказка имеет три основных компонента: Hint-Pre , Hint-CNV и Hint-TL . Hint-Pre-предварительные обработки данных HI-C и вычисляют контактную матрицу, которая хранит частоты контактов между любыми двумя геномными локусами; Как Hint-CNV, так и Hint-TL начинаются с контактной матрицы HI-C, прогнозируют сегменты числа копий и межхромосомные транслокации, соответственно, соответственно
Пакеты R и R
Python и Python Packages
Java и связанные с ними инструменты (необязательно: требуется, когда хотите обработать данные HI-C с помощью инструментов соковыжималки)
Перв
Другие зависимости
Метод1: установить с использованием Conda (настоятельно рекомендуется)
$ conda install -c su hint
или
$ conda install hint
Метод2: Установите из PYPI с помощью PIP.
$ pip install HiNT-Packages
Метод3: Установите вручную
git clone https://github.com/parklab/HiNT.git
$ python setup.py install
*** Тип $ hint
для проверки, успешно ли установлен подсказка
Метод 4: Подсказка запустить в контейнере Docker (настоятельно рекомендуется)
$ docker pull suwangbio/hint
$ docker run suwangbio/hint hint
Смотрите подробности об использовании на странице Hint в Docker Hub
$ unzip hg19.zip
$ unzip hg19.zip
$ unzip hg19.zip
Подсказка Pre: Предварительная обработка данных HI-C. Подсказка Pre делает выравнивание, создание контактной матрицы и нормализацию в одной командной строке.
$ hint pre -d /path/to/hic_1.fastq.gz,/path/to/hic_2.fastq.gz -i /path/to/bwaIndex/hg19/hg19.fa --refdir /path/to/refData/hg19 --informat fastq --outformat cooler -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --coolerpath /path/to/cooler
$ hint pre -d /path/to/test.bam --refdir /path/to/refData/hg19 --informat bam --outformat juicer -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --juicerpath /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
Используйте $ which samtools
$ which pairtools
$ which cooler
должен получить абсолютный путь этих инструментов, и /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
должен быть путем, в котором вы храните этот файл
См. Подробности и больше вариантов
$ hint pre -h
Подсказка CNV: прогнозирование информации о номере копирования, а также сегментация от HI-C.
$ hint cnv -m contactMatrix.cool -f cooler --refdir /path/to/refDir/hg19 -r 50 -g hg19 -n test -o /path/to/outputDir --bicseq /path/to/BICseq2-seg_v0.7.3 -e MboI
$ hint cnv -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/50000 -f cooler --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --maptrack 36mer
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --doiter
/path/to/BICseq2-seg_v0.7.3
должен быть путем, в котором вы храните этот пакет
См. Подробности и больше вариантов
$ hint cnv -h
Подсказка TL: Межхромосомные транслокации и обнаружение точек перерыва из межхсомных матриц взаимодействия HI-C.
$ hint tl -m /path/to/data_1Mb.cool,/path/to/data_100kb.cool --chimeric /path/to/test_chimeric.sorted.pairsam.gz --refdir /path/to/refDir/hg19 --backdir /path/to/backgroundMatrices/hg19 --ppath /path/to/pairix -f cooler -g hg19 -n test -o /path/to/outputDir
$ hint tl -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/1000000,/path/to/4DNFIS6HAUPP.mcool::/resolutions/100000 -f cooler --refdir /path/to/refDir/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12
$ hint tl -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refData/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12 -o HiNTtransl_juicerOUTPUT
Используйте $ which pairix
, чтобы получить абсолютный путь Paintix
См. Подробности и больше вариантов
$ hint tl -h
В результате вывода подсказки вы найдете
jobname.bam
выровнял файл без потерь в формате BAMjobname_merged_valid.pairs.gz
считывает пары в формате парыjobname_chimeric.sorted.pairsam.gz
Неосмоленные химерные пары чтения, используемые для обнаружения точек остановаjobname_valid.sorted.deduped.pairsam.gz
Действительные пары чтения, используемые для создания контактной матрицы HI-C в формате packsamjobname.mcool
HI-C Contact Matrix в Cool Formatjobname.hic
hi-c Контактная матрица в формате HICВ выводном каталоге подсказка-CNV вы найдете
jobname_GAMPoisson.pdf
Результат регрессии GAMsegmentation/jobname_bicsq_allchroms.txt
cnv сегменты с коэффициентом копирования log2 и p-значениями в файле txtsegmentation/jobname_resolution_CNV_segments.png
Рисунок для визуализации сегментов CNVsegmentation/jobname_bicseq_allchroms.l2r.pdf
Рисунок для визуализации log2 -копии в каждом бункеsegmentation/other_files
промежуточные файлы, используемые для запуска BIC-seqjonname_dataForRegression/*
Данные, используемые для регрессии, а также остатки после удаления смещений HI-CВ выводом Hint-TL вы найдете
jobname_Translocation_IntegratedBP.txt
Окончательная интегрированная точка останова транслокацииjobname_chrompairs_rankProduct.txt
Рейнг продукт прогнозируемый потенциальные транслоцированные пары хромосомotherFolders