หมายเหตุ: MinimAP2 ได้แทนที่ BWA-MEM สำหรับ PACBIO และ NANOPORE อ่านการจัดตำแหน่ง มันยังคงรักษาคุณสมบัติ BWA-MEM ที่สำคัญทั้งหมดไว้ แต่ประมาณ 50 เท่าเร็วขึ้นอเนกประสงค์มากขึ้นแม่นยำยิ่งขึ้นและสร้างการจัดตำแหน่งฐานที่ดีขึ้น BWA-MEM2 เวอร์ชันเบต้าได้รับการเผยแพร่สำหรับการทำแผนที่ระยะสั้น BWA-MEM2 นั้นเร็วเท่า BWA-MEM และเอาต์พุตใกล้เคียงกันประมาณสองเท่าใกล้กับการจัดตำแหน่งที่เหมือนกัน
git clone https://github.com/lh3/bwa.git
cd bwa; make
./bwa index ref.fa
./bwa mem ref.fa read-se.fq.gz | gzip -3 > aln-se.sam.gz
./bwa mem ref.fa read1.fq read2.fq | gzip -3 > aln-pe.sam.gz
BWA เป็นแพคเกจซอฟต์แวร์สำหรับการทำแผนที่ลำดับดีเอ็นเอกับจีโนมอ้างอิงขนาดใหญ่เช่นจีโนมมนุษย์ ประกอบด้วยอัลกอริทึมสามอัลกอริทึม: BWA-Backtrack, BWA-SW และ BWA-MEM อัลกอริทึมแรกได้รับการออกแบบมาสำหรับลำดับ Illumina อ่านได้มากถึง 100bp ในขณะที่ส่วนที่เหลือสองลำดับสำหรับลำดับที่ยาวขึ้นอยู่ระหว่าง 70bp ถึงไม่กี่เมกะบาส BWA-MEM และ BWA-SW แบ่งปันคุณสมบัติที่คล้ายกันเช่นการสนับสนุนของการอ่านยาวและการจัดตำแหน่ง chimeric แต่ BWA-MEM ซึ่งเป็นล่าสุดแนะนำโดยทั่วไปว่ามันเร็วขึ้นและแม่นยำยิ่งขึ้น BWA-MEM ยังมีประสิทธิภาพที่ดีกว่า BWA-Backtrack สำหรับการอ่าน Illumina 70-100bp
สำหรับอัลกอริทึมทั้งหมด BWA จำเป็นต้องสร้างดัชนี FM สำหรับจีโนมอ้างอิง (คำสั่ง ดัชนี ) อัลกอริทึมการจัดตำแหน่งจะถูกเรียกใช้กับคำสั่งย่อยที่แตกต่างกัน: ALN/SAMSE/SAMPE สำหรับ BWA-Backtrack, BWASW สำหรับ BWA-SW และ MEM สำหรับอัลกอริทึม BWA-MEM
BWA เปิดตัวภายใต้ GPLV3 ซอร์สโค้ดล่าสุดสามารถใช้ได้อย่างอิสระที่ GitHub แพ็คเกจที่ปล่อยออกมาสามารถดาวน์โหลดได้ที่ SourceForge หลังจากที่คุณได้รับซอร์สโค้ดเพียงใช้ make
เพื่อรวบรวมและคัดลอก bwa
ที่เรียกใช้งานได้เพียงครั้งเดียวไปยังปลายทางที่คุณต้องการ การพึ่งพาเพียงอย่างเดียวที่จำเป็นในการสร้าง BWA คือ zlib
ตั้งแต่ 0.7.11 ไบนารีที่คอมไพล์ล่วงหน้าสำหรับ x86_64-linux มีอยู่ใน Bwakit นอกเหนือจาก BWA แล้วแพ็คเกจที่สอดคล้องกันนี้ยังมาพร้อมกับเครื่องมือที่เกี่ยวข้องกับ BWA และเครื่องมือที่ 3 สำหรับการแปลง BAM-to-FASTQ ที่เหมาะสมการทำแผนที่ไปยัง alt contigs, การตัดแต่งอะแดปเตอร์, การทำเครื่องหมายซ้ำ, การพิมพ์ HLA และไฟล์ข้อมูลที่เกี่ยวข้อง
การใช้งานโดยละเอียดอธิบายไว้ในหน้า MAN พร้อมกับซอร์สโค้ด คุณสามารถใช้ man ./bwa.1
เพื่อดูหน้า man ในเทอร์มินัล สามารถดูหน้า MAN เวอร์ชัน HTML ได้ที่เว็บไซต์ BWA หากคุณมีคำถามเกี่ยวกับ BWA คุณสามารถลงทะเบียนรายชื่อผู้รับจดหมายแล้วส่งคำถามไปที่ [email protected] คุณอาจถามคำถามในฟอรัมเช่น Biostar และ Seqanswers
Li H. และ Durbin R. (2009) การจัดเรียงระยะสั้นที่รวดเร็วและแม่นยำและแม่นยำด้วยการแปลง Burrows-Wheeler ชีวสารสนเทศศาสตร์ , 25 , 1754-1760 [PMID: 19451168] (ถ้าคุณใช้อัลกอริทึม BWA-Backtrack)
Li H. และ Durbin R. (2010) การจัดตำแหน่งที่อ่านได้อย่างรวดเร็วและแม่นยำด้วยการแปลง Burrows-Wheeler ชีวสารสนเทศศาสตร์ , 26 , 589-595 [PMID: 20080505] (ถ้าคุณใช้อัลกอริทึม BWA-SW)
Li H. (2013) การจัดลำดับการอ่านลำดับการโคลนและการประกอบ contigs กับ BWA-MEM arxiv: 1303.3997v2 [q-bio.gn] (หากคุณใช้อัลกอริทึม BWA-MEM หรือคำสั่ง FASTMAP หรือต้องการอ้างอิงแพ็คเกจ BWA ทั้งหมด)
โปรดทราบว่าการอ้างอิงล่าสุดคือการพิมพ์ล่วงหน้าที่ arxiv.org ฉันไม่ได้วางแผนที่จะส่งไปยังวารสารที่ผ่านการตรวจสอบโดยเพื่อนในอนาคตอันใกล้
BWA ทำงานร่วมกับข้อมูลลำดับดีเอ็นเอหลากหลายประเภทแม้ว่าอัลกอริทึมและการตั้งค่าที่ดีที่สุดอาจแตกต่างกันไป รายการต่อไปนี้ให้การตั้งค่าที่แนะนำ:
Illumina/454/iontorrent end end อ่านนานกว่า ~ 70bp หรือแอสเซมบลี contigs สูงถึงสองสามเมกะโคสที่แมปกับจีโนมอ้างอิงที่เกี่ยวข้องอย่างใกล้ชิด:
bwa mem ref.fa reads.fq > aln.sam
Illumina end end อ่านสั้นกว่า ~ 70bp:
bwa aln ref.fa reads.fq > reads.sai; bwa samse ref.fa reads.sai reads.fq > aln-se.sam
Illumina/454/iontorrent end อ่านนานกว่า ~ 70bp:
bwa mem ref.fa read1.fq read2.fq > aln-pe.sam
Illumina Paired-end อ่านสั้นกว่า ~ 70bp:
bwa aln ref.fa read1.fq > read1.sai; bwa aln ref.fa read2.fq > read2.sai
bwa sampe ref.fa read1.sai read2.sai read1.fq read2.fq > aln-pe.sam
Subreads Pacbio หรือ Oxford Nanopore อ่านจีโนมอ้างอิง:
bwa mem -x pacbio ref.fa reads.fq > aln.sam
bwa mem -x ont2d ref.fa reads.fq > aln.sam
แนะนำให้ใช้ BWA-MEM สำหรับลำดับการสืบค้นนานกว่า ~ 70bp สำหรับอัตราความผิดพลาดที่หลากหลาย (หรือความแตกต่างของลำดับ) โดยทั่วไป BWA-MEM มีความอดทนมากขึ้นกับข้อผิดพลาดที่ได้รับลำดับการสืบค้นนานขึ้นเนื่องจากโอกาสที่จะหายไปทั้งหมดเมล็ดมีขนาดเล็ก ดังที่แสดงไว้ข้างต้นด้วยการตั้งค่าที่ไม่ได้รับการป้องกัน BWA-MEM ทำงานร่วมกับ Oxford Nanopore อ่านด้วยอัตราความผิดพลาดในการเรียงลำดับมากกว่า 20%
BWA-SW และ BWA-MEM ดำเนินการจัดตำแหน่งท้องถิ่น หากมีการโยกย้ายการหลอมรวมของยีนหรือการลบที่ยาวนานการอ่านการเชื่อมโยงจุดพักอาจมีสองเพลงฮิตครอบครองสองบรรทัดในเอาท์พุท SAM ด้วยการตั้งค่าเริ่มต้นของ BWA-MEM หนึ่งและหนึ่งบรรทัดเดียวคือหลักและถูกตัดนุ่ม; บรรทัดอื่น ๆ ถูกแท็กด้วย 0x800 SAM Flag (การจัดตำแหน่งเสริม) และถูกตัดอย่างหนัก
ใช่. ตั้งแต่ 0.6.x อัลกอริทึม BWA ทั้งหมดทำงานกับจีโนมที่มีความยาวรวมมากกว่า 4GB อย่างไรก็ตามโครโมโซมแต่ละตัวไม่ควรนานกว่า 2GB
สิ่งนี้ถูกต้อง คุณภาพการทำแผนที่ถูกกำหนดไว้สำหรับการอ่านแต่ละรายการไม่ใช่สำหรับคู่อ่าน เป็นไปได้ว่าการอ่านหนึ่งครั้งสามารถแมปได้อย่างไม่น่าสงสัย แต่คู่ของมันตกอยู่ในการทำซ้ำแบบตีคู่และทำให้ไม่สามารถกำหนดตำแหน่งที่ถูกต้องได้
ภายใน BWA เชื่อมต่อลำดับการอ้างอิงทั้งหมดเป็นลำดับยาวหนึ่งลำดับ การอ่านอาจถูกแมปไปยังทางแยกของลำดับการอ้างอิงที่อยู่ติดกันสองลำดับ ในกรณีนี้ BWA-Backtrack จะตั้งค่าสถานะการอ่านเป็น unmapped (0x4) แต่คุณจะเห็นตำแหน่งซิการ์และแท็กทั้งหมด ปัญหาที่คล้ายกันอาจเกิดขึ้นกับการจัดตำแหน่ง BWA-SW เช่นกัน BWA-MEM ไม่มีปัญหานี้
ใช่ตั้งแต่ 0.7.11 BWA-MEM สนับสนุนการทำแผนที่อย่างเป็นทางการกับ GRCH38+ALT BWA-Backtrack และ BWA-SW ไม่รองรับการทำแผนที่ ALT อย่างเหมาะสม ณ ตอนนี้ โปรดดูรายละเอียด readme-Alt.MD โดยสังเขปขอแนะนำให้ใช้ bwakit, การเปิดตัวไบนารีของ BWA สำหรับการสร้างจีโนมอ้างอิงและสำหรับการทำแผนที่
หากคุณไม่สนใจที่จะเข้าชม Alt contigs มันก็โอเคที่จะเรียกใช้ BWA-MEM โดยไม่ต้องโพสต์การประมวลผล การจัดตำแหน่งที่ผลิตด้วยวิธีนี้อยู่ใกล้กับการจัดตำแหน่งกับ GRCH38 โดยไม่มี alt contigs อย่างไรก็ตามการใช้การโพสต์การประมวลผลช่วยลดการแมปเท็จที่เกิดจากการอ่านจากส่วนที่แตกต่างของ alt contigs และยังช่วยให้การพิมพ์ HLA ขอแนะนำให้เรียกใช้สคริปต์หลังการประมวลผล