Varus ถูกเขียนขึ้นโดย Willy Bruhn ในฐานะวิทยานิพนธ์ระดับปริญญาตรีภายใต้การดูแลของ Mario Stanke ที่เก็บนี้เป็นสำเนาของ https://github.com/willybruhn/varus ที่ผลิตในเดือนพฤศจิกายน 2018 และมีข้อผิดพลาดมากมายคุณลักษณะฐานข้อมูล intron ที่เพิ่มขึ้นและส่วนขยายสำหรับการใช้โปรแกรมการจัดตำแหน่งทางเลือก Hisat al
Varus ทำการเลือกและดาวน์โหลด RNA-seq จำนวน จำกัด โดยอัตโนมัติจากที่ NCBI ของ NCBI Read Read Archive (SRA) ซึ่งกำหนดเป้าหมายการครอบคลุมที่สูง พอ สำหรับยีนจำนวนมากเพื่อจุดประสงค์ในการฝึกอบรมจีโนมและคำอธิบายประกอบจีโนม การวนซ้ำแต่ละอัลกอริทึมออนไลน์
เรียกใช้คำสั่งต่อไปนี้จากบรรทัดคำสั่งเพื่อโคลนที่เก็บ:
git clone https://github.com/MarioStanke/VARUS.git
Varus ขึ้นอยู่กับ
sudo apt-get install bamtools libbamtools-dev
รวบรวม Varus ด้วยตนเองด้วย
cd Implementation
make
โดยค่าเริ่มต้นเครื่องมือ NCBI fastq-dump
สร้างไฟล์ชั่วคราวภายใต้ ~/ncbi
ที่มีขนาดเท่ากันกับไฟล์รันที่ดาวน์โหลดข้อมูลแม้ว่าจะดาวน์โหลดเพียงส่วนเล็ก ๆ เท่านั้น ปิดการใช้งานพฤติกรรมการแคชที่อาจต้องใช้พื้นที่ฮาร์ดไดรฟ์มากเกินไปสำหรับผู้ใช้ส่วนใหญ่ด้วย
mkdir -p ~/.ncbi
echo '/repository/user/cache-disabled = "true"' >> ~/.ncbi/user-settings.mkfg
เปลี่ยนเป็น example
ไดเรกทอรีและทำตามคำแนะนำในตัวอย่าง/readme
คัดลอกไฟล์ VARUSparameters.txt
จากโฟลเดอร์ตัวอย่างไปยังไดเรกทอรีการทำงานของคุณและปรับหากจำเป็น:
พารามิเตอร์ที่สำคัญที่สุด:
-Batchsize ระบุจำนวนการอ่านที่ควรดาวน์โหลดในการวนซ้ำแต่ละครั้ง (เช่น 50000 หรือ 200000)
-MaxBatches ระบุจำนวนแบทช์ที่ควรดาวน์โหลดมากที่สุด
เอาต์พุตสุดท้ายคือไฟล์การจัดตำแหน่ง spliced ที่เรียงลำดับ (แบทช์ทั้งหมดเข้าด้วยกัน) เรียกว่า varus.bam
โปรดอ้างอิง: Varus: การสุ่มตัวอย่าง RNA เสริมอ่านจากลำดับการอ่านลำดับ 2019; BMC Bioinformatics , 20: 558
ค้นหาวิทยานิพนธ์ปริญญาตรีของ Willy Bruhn ที่สอดคล้องกับ Varus in /docs /วิทยานิพนธ์