ملاحظة: استبدل MinimAp2 BWA-MEM لباكبيو و Nanopore قراءة المحاذاة. إنه يحتفظ بجميع ميزات BWA-MEM الرئيسية ، ولكنها تقارب 50 مرة أسرع وأكثر تنوعًا وأكثر دقة وتنتج محاذاة أفضل على مستوى الأساس. تم إصدار نسخة تجريبية من BWA-MEM2 لرسم الخرائط للقراءة قصيرة. يبلغ طول BWA-MEM2 ضعف أسرع من BWA-MEM والمخرجات بالقرب من محاذاة متطابقة.
git clone https://github.com/lh3/bwa.git
cd bwa; make
./bwa index ref.fa
./bwa mem ref.fa read-se.fq.gz | gzip -3 > aln-se.sam.gz
./bwa mem ref.fa read1.fq read2.fq | gzip -3 > aln-pe.sam.gz
BWA هي حزمة برامج لتخطيط تسلسل الحمض النووي مقابل جينوم مرجعي كبير ، مثل الجينوم البشري. وهو يتألف من ثلاث خوارزميات: BWA-Backtrack ، BWA-SW و BWA-MEM. تم تصميم الخوارزمية الأولى لتسلسل Illumina يقرأ ما يصل إلى 100 بت في البلاط ، في حين تراوحت الباقي للتسلسلات الأطول من 70 نقطة أساس إلى بضعة ميغابات. تشترك BWA-MEM و BWA-SW في ميزات مماثلة مثل دعم القراءة الطويلة والمحاذاة الوهمية ، لكن BWA-MEM ، التي تعد الأحدث ، موصى بها عمومًا لأنها أسرع وأكثر دقة. لدى BWA-MEM أداء أفضل من BWA-Backtrack لقراءات Illumina 70-100bp.
بالنسبة لجميع الخوارزميات ، تحتاج BWA أولاً إلى إنشاء مؤشر FM للجينوم المرجعي (أمر الفهرس ). يتم استدعاء خوارزميات المحاذاة بأجهزة فرعية مختلفة: ALN/SAMSE/SAMPE لـ BWA-Backtrack ، BWASW لـ BWA-SW و MEM لخوارزمية BWA-MEM.
يتم إصدار BWA تحت GPLV3. أحدث رمز المصدر متاح بحرية في Github. يمكن تنزيل الحزم التي تم إصدارها في SourceForge. بعد الحصول على الكود المصدري ، ما عليك سوى استخدام make
لتجميع ونسخ bwa
القابل للتنفيذ إلى الوجهة التي تريدها. التبعية الوحيدة المطلوبة لبناء BWA هي Zlib.
منذ 0.7.11 ، يتوفر الثنائي المسبق لـ X86_64-Linux في Bwakit. بالإضافة إلى BWA ، تأتي هذه الحزمة المتسقة ذاتيًا أيضًا مع أدوات BWA المرتبطة بالـ BWA والثلاثين لتحويل BAM إلى FASTQ المناسب ، ورسم الخرائط إلى contigs alt ، وتوصل المحول ، وعلامة مكررة ، وكتابة HLA وملفات البيانات المرتبطة بها.
تم وصف الاستخدام التفصيلي في صفحة MAN المتاحة مع رمز المصدر. يمكنك استخدام man ./bwa.1
لعرض صفحة الرجل في محطة. يمكن العثور على إصدار HTML من صفحة MAN على موقع BWA. إذا كانت لديك أسئلة حول BWA ، فيمكنك التسجيل في القائمة البريدية ثم إرسال الأسئلة إلى bio-bwa [email protected]. يمكنك أيضًا طرح أسئلة في منتديات مثل Biostar و Seqanswers.
Li H. و Durbin R. (2009) محاذاة قصيرة ودقيقة للقراءة القصيرة القصيرة مع تحويل العجلات الجحور. المعلوماتية الحيوية ، 25 ، 1754-1760. [بميد: 19451168]. (إذا كنت تستخدم خوارزمية BWA-Backtrack)
Li H. و Durbin R. (2010) محاذاة سريعة ودقيقة طويلة القراءة مع تحويل العجلات الجحور. المعلوماتية الحيوية ، 26 ، 589-595. [بميد: 20080505]. (إذا كنت تستخدم خوارزمية BWA-SW)
Li H. (2013) محاذاة تسلسل القراءات ، تسلسل الاستنساخ و contigs التجميع مع BWA-MEM. Arxiv: 1303.3997v2 [q-bio.gn]. (إذا كنت تستخدم خوارزمية BWA-MEM أو أمر fastmap ، أو تريد الاستشهاد بحزمة BWA بأكملها)
يرجى ملاحظة أن المرجع الأخير هو preprint المستضافة في arxiv.org. ليس لدي خطة لتقديمها إلى مجلة مراجعة النظراء في المستقبل القريب.
تعمل BWA مع مجموعة متنوعة من بيانات تسلسل الحمض النووي ، على الرغم من أن الخوارزمية المثلى والإعداد قد تختلف. القائمة التالية تعطي الإعدادات الموصى بها:
تقرأ Illumina/454/iontorrent نهاية واحدة أطول من ~ 70bp أو تجميع ما يصل إلى عدد قليل من megabases تم تعيينه إلى جينوم مرجعي مرتبط ارتباطًا وثيقًا:
bwa mem ref.fa reads.fq > aln.sam
تقرأ Illumina نهاية واحدة أقصر من ~ 70bp:
bwa aln ref.fa reads.fq > reads.sai; bwa samse ref.fa reads.sai reads.fq > aln-se.sam
Illumina/454/iontorrent يقرأ نهاية الانحناء لفترة أطول من ~ 70bp:
bwa mem ref.fa read1.fq read2.fq > aln-pe.sam
تقرأ Illumina inving-end أقصر من ~ 70bp:
bwa aln ref.fa read1.fq > read1.sai; bwa aln ref.fa read2.fq > read2.sai
bwa sampe ref.fa read1.sai read2.sai read1.fq read2.fq > aln-pe.sam
يقرأ Pacbio Subreads أو Oxford Nanopore إلى جينوم مرجعي:
bwa mem -x pacbio ref.fa reads.fq > aln.sam
bwa mem -x ont2d ref.fa reads.fq > aln.sam
ينصح BWA-MEM بتسلسل الاستعلام لفترة أطول من ~ 70bp لمجموعة متنوعة من معدلات الخطأ (أو تباعد التسلسل). بشكل عام ، فإن BWA-MEM أكثر تسامحًا مع الأخطاء التي أعطيت تسلسل الاستعلام لفترة أطول لأن فرصة فقدان جميع البذور صغيرة. كما هو موضح أعلاه ، مع إعدادات غير Default ، تعمل BWA-MEM مع قراءة Oxford Nanopore مع معدل خطأ التسلسل أكثر من 20 ٪.
تؤدي BWA-SW و BWA-MEM محاذاة محلية. إذا كان هناك إزاحة أو دمج جيني أو حذف طويل ، فقد يكون للقراءة سد نقطة الاستراحة ضربتين ، تشغل سطرين في إخراج SAM. مع الإعداد الافتراضي لـ BWA-MEM ، يكون خط واحد وخط واحد فقط أساسيًا ويتم قصه ناعمًا ؛ يتم وضع علامة على خطوط أخرى بعلم SAM 0x800 (المحاذاة التكميلية) ويتم قصها بشدة.
نعم. منذ 0.6.x ، تعمل جميع خوارزميات BWA مع جينوم بطول إجمالي أكثر من 4 جيجابايت. ومع ذلك ، لا ينبغي أن يكون الكروموسوم الفردي أطول من 2 جيجابايت.
هذا صحيح. يتم تعيين جودة رسم الخرائط للقراءة الفردية ، وليس لزوج القراءة. من الممكن أن يتم تعيين قراءة واحدة بشكل لا لبس فيه ، لكن رفيقها يقع في تكرار ترادفي وبالتالي لا يمكن تحديد موضعه الدقيق.
BWA داخليًا يسلط جميع التسلسلات المرجعية إلى تسلسل طويل واحد. قد يتم تعيين قراءة إلى تقاطع تسلسلين مرجعيين مجاورة. في هذه الحالة ، ستشير BWA-Backtrack إلى القراءة على أنها غير محددة (0x4) ، لكنك سترى الموضع والسيجار وجميع العلامات. قد تحدث قضية مماثلة لمحاذاة BWA-SW أيضًا. BWA-MEM ليس لديها هذه المشكلة.
نعم ، منذ 0.7.11 ، تدعم BWA-MEM رسميًا التعيين إلى GRCH38+Alt. لا تدعم BWA-Backtrack و BWA-SW بشكل صحيح تعيين ALT حتى الآن. يرجى الاطلاع على readme-alt.md للحصول على التفاصيل. باختصار ، يوصى باستخدام Bwakit ، الإصدار الثنائي لـ BWA ، لتوليد الجينوم المرجعي والتعيين.
إذا لم تكن مهتمًا بالضربات لـ ALT Contigs ، فلا بأس في تشغيل BWA-MEM دون معالجة ما بعد المعالجة. المحاذاة المنتجة بهذه الطريقة قريبة جدًا من المحاذاة ضد GRCH38 دون alt contigs. ومع ذلك ، فإن تطبيق ما بعد المعالجة يساعد على تقليل التعيينات الخاطئة الناتجة عن قراءات من الجزء المتباعد من contigs ALT ويمكّن أيضًا كتابة HLA. يوصى بتشغيل البرنامج النصي بعد المعالجة.