คำแนะนำ ( HI -C สำหรับการคัดลอก n umber การเปลี่ยนแปลงและการตรวจจับ t ranslocation), วิธีการคำนวณเพื่อตรวจจับ CNVs และ translocations จากข้อมูล HI -C คำแนะนำมีสามองค์ประกอบหลัก: คำแนะนำ-Pre , Hint-CNV และ Hint-TL คำแนะนำล่วงหน้าข้อมูล hi-c และคำนวณเมทริกซ์ติดต่อซึ่งเก็บความถี่ติดต่อระหว่างตำแหน่งจีโนมสองตำแหน่งใด ๆ ทั้ง Hint-CNV และ HINT-TL เริ่มต้นด้วยเมทริกซ์ติดต่อ Hi-C ทำนายเซ็กเมนต์หมายเลขสำเนาและการย้ายตำแหน่งระหว่างโครโมโซมตามลำดับตามลำดับ
แพ็คเกจ R และ R
แพ็คเกจ Python และ Python
Java และเครื่องมือที่เกี่ยวข้อง (ไม่จำเป็น: จำเป็นเมื่อต้องการประมวลผลข้อมูล HI-C ด้วยเครื่องมือคั้นน้ำผลไม้)
Perl
การพึ่งพาอื่น ๆ
วิธีการที่ 1: ติดตั้งโดยใช้ Conda (แนะนำเป็นอย่างยิ่ง)
$ conda install -c su hint
หรือ
$ conda install hint
Method2: ติดตั้งจาก PYPI โดยใช้ PIP
$ pip install HiNT-Packages
Method3: ติดตั้งด้วยตนเอง
git clone https://github.com/parklab/HiNT.git
$ python setup.py install
*** พิมพ์ $ hint
เพื่อทดสอบว่าติดตั้งได้สำเร็จ
วิธีที่ 4: เรียกใช้คำใบ้ในคอนเทนเนอร์ Docker (แนะนำเป็นอย่างยิ่ง)
$ docker pull suwangbio/hint
$ docker run suwangbio/hint hint
ดูรายละเอียดการใช้งานในหน้าคำแนะนำที่ Docker Hub
$ unzip hg19.zip
$ unzip hg19.zip
$ unzip hg19.zip
คำแนะนำก่อน: การประมวลผลข้อมูล HI-C ล่วงหน้า คำใบ้ก่อนจะจัดตำแหน่งการสร้างเมทริกซ์ติดต่อและการทำให้เป็นมาตรฐานในบรรทัดคำสั่งเดียว
$ hint pre -d /path/to/hic_1.fastq.gz,/path/to/hic_2.fastq.gz -i /path/to/bwaIndex/hg19/hg19.fa --refdir /path/to/refData/hg19 --informat fastq --outformat cooler -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --coolerpath /path/to/cooler
$ hint pre -d /path/to/test.bam --refdir /path/to/refData/hg19 --informat bam --outformat juicer -g hg19 -n test -o /path/to/outputdir --pairtoolspath /path/to/pairtools --samtoolspath /path/to/samtools --juicerpath /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
ใช้ $ which samtools
$ which pairtools
$ which cooler
เพื่อรับเส้นทางที่แน่นอนของเครื่องมือเหล่านี้และ /path/to/juicer_tools.1.8.9_jcuda.0.8.jar
ควรเป็นเส้นทางที่คุณเก็บไฟล์นี้
ดูรายละเอียดและตัวเลือกเพิ่มเติม
$ hint pre -h
คำแนะนำ CNV: การทำนายข้อมูลหมายเลขสำเนารวมถึงการแบ่งส่วนจาก HI-C
$ hint cnv -m contactMatrix.cool -f cooler --refdir /path/to/refDir/hg19 -r 50 -g hg19 -n test -o /path/to/outputDir --bicseq /path/to/BICseq2-seg_v0.7.3 -e MboI
$ hint cnv -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/50000 -f cooler --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --maptrack 36mer
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII
$ hint cnv -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refDir/hg38 -r 50 -g hg38 -n HepG2 --bicseq /path/to/BICseq2-seg_v0.7.3 -e DpnII --doiter
/path/to/BICseq2-seg_v0.7.3
ควรเป็นเส้นทางที่คุณเก็บแพ็คเกจนี้
ดูรายละเอียดและตัวเลือกเพิ่มเติม
$ hint cnv -h
คำใบ้ TL: interchromosomal translocations และการตรวจจับจุดเบรกจาก HI-C inter-chromosomal matrices
$ hint tl -m /path/to/data_1Mb.cool,/path/to/data_100kb.cool --chimeric /path/to/test_chimeric.sorted.pairsam.gz --refdir /path/to/refDir/hg19 --backdir /path/to/backgroundMatrices/hg19 --ppath /path/to/pairix -f cooler -g hg19 -n test -o /path/to/outputDir
$ hint tl -m /path/to/4DNFIS6HAUPP.mcool::/resolutions/1000000,/path/to/4DNFIS6HAUPP.mcool::/resolutions/100000 -f cooler --refdir /path/to/refDir/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12
$ hint tl -m /path/to/4DNFICSTCJQZ.hic -f juicer --refdir /path/to/refData/hg38 --backdir /path/to/backgroundMatrices/hg38 -g hg38 -n 4DNFICSTCJQZ -c 0.05 --ppath /path/to/pairix -p 12 -o HiNTtransl_juicerOUTPUT
ใช้ $ which pairix
เพื่อรับเส้นทางที่สมบูรณ์ของ pairix
ดูรายละเอียดและตัวเลือกเพิ่มเติม
$ hint tl -h
ในไดเรกทอรีเอาท์พุทคำแนะนำคุณจะพบ
jobname.bam
จัดตำแหน่งไฟล์ Lossless ในรูปแบบ BAMjobname_merged_valid.pairs.gz
อ่านคู่ในรูปแบบคู่jobname_chimeric.sorted.pairsam.gz
คู่อ่าน chimeric ที่คลุมเครือซึ่งใช้สำหรับการตรวจจับจุดพักในรูปแบบคู่jobname_valid.sorted.deduped.pairsam.gz
คู่อ่านที่ถูกต้องที่ใช้สำหรับการสร้างเมทริกซ์การติดต่อ Hi-C ในรูปแบบ mairsamjobname.mcool
hi-c ติดต่อเมทริกซ์ในรูปแบบเย็นjobname.hic
hi-c ติดต่อเมทริกซ์ในรูปแบบ hicในไดเรกทอรีเอาท์พุท Hint-CNV คุณจะพบ
jobname_GAMPoisson.pdf
ผลการถดถอย GAMsegmentation/jobname_bicsq_allchroms.txt
เซ็กเมนต์ CNV ที่มีอัตราส่วนการคัดลอก log2 และค่า p ในไฟล์ txtsegmentation/jobname_resolution_CNV_segments.png
รูปที่จะเห็นภาพกลุ่ม CNVsegmentation/jobname_bicseq_allchroms.l2r.pdf
รูปเพื่อแสดงภาพการปันส่วนการคัดลอก log2 ในแต่ละถัง (ขนาดถัง = ความละเอียดที่คุณตั้งไว้)segmentation/other_files
ที่ใช้ในการเรียกใช้ bic-seqjonname_dataForRegression/*
ข้อมูลที่ใช้สำหรับการถดถอยเช่นเดียวกับที่เหลือหลังจากลบอคติ Hi-Cในไดเรกทอรีเอาท์พุท Hint-TL คุณจะพบ
jobname_Translocation_IntegratedBP.txt
จุดพักการเคลื่อนที่แบบบูรณาการขั้นสุดท้ายjobname_chrompairs_rankProduct.txt
อันดับผลิตภัณฑ์ทำนายคู่โครโมโซมที่มีศักยภาพotherFolders
ที่ใช้ในการระบุจุดพักการเคลื่อนที่