DIA-NN - مجموعة برامج عالمية لمعالجة البيانات البروتينية المستقلة عن البيانات (DIA). تم إنشاء DIA-NN في جامعة كامبريدج، المملكة المتحدة، في مختبر كاثرين ليلي (مركز كامبريدج للبروتينات)، وفتح فصلًا جديدًا في علم البروتينات، حيث قدم عددًا من الخوارزميات التي مكنت من إجراء تجارب واسعة النطاق موثوقة وقوية ودقيقة كميًا باستخدام طرق الإنتاجية العالية. ويجري حاليا تطوير DIA-NN بشكل أكبر في مختبر فاديم ديميتشيف في شاريتيه (جامعة الطب في برلين، ألمانيا).
تم بناء DIA-NN على المبادئ التالية:
التنزيل : https://github.com/vdemichev/DiaNN/releases/tag/1.9.2 (يوصى باستخدام الإصدار الأحدث - DIA-NN 1.9.2)
يرجى الاستشهاد بما يلي:
DIA-NN: الشبكات العصبية وتصحيح التداخل
تمكين التغطية البروتينية العميقة بطرق الطبيعة عالية الإنتاجية ، 2020
استخدام DIA-NN لتحليل تعديلات ما بعد الترجمة (PTMs)، مثل الفسفرة أو الانتشار في كل مكان: يكشف تحديد ملفات تعريف التواجد في الجسم الحي بواسطة DIA-MS عن أهداف USP7 على نطاق واسع من البروتينات اتصالات الطبيعة، 2021
استخدام وحدة التنقل الأيوني الخاصة بـ DIA-NN لتحليل بيانات timsTOF أو استخدام DIA-NN بالاشتراك مع المكتبات الطيفية التي تم إنشاؤها بواسطة FragPipe: تحليل بيانات dia-PASEF باستخدام FragPipe وDIA-NN للبروتينات العميقة بكميات عينات منخفضة اتصالات الطبيعة، 2022
استخدام DIA-NN لتحليل العينات المتعددة الإرسال (SILAC، mTRAQ، إلخ): زيادة إنتاجية البروتينات الحساسة بواسطة تقنية plexDIA Nature Biotechnology، 2022
استخدام DIA-NN كجزء من سير عمل CysQuant: CysQuant: القياس الكمي المتزامن لأكسدة السيستين ووفرة البروتين باستخدام قياس الطيف الكتلي المعتمد على البيانات أو المستقل Redox Biology, 2023
استخدام وحدة QuantUMS الخاصة بـ DIA-NN للقياس الكمي: QuantUMS: تقليل عدم اليقين يتيح القياس الكمي الواثق في البروتينات الحيوية
استخدام DIA-NN لمعالجة بيانات Slice-PASEF: Slice-PASEF: تجزئة جميع الأيونات للحصول على أقصى قدر من الحساسية في البروتينات الحيوية
الأوراق الرئيسية الأخرى
حزمة R مع بعض الوظائف المفيدة للتعامل مع تقارير مخرجات DIA-NN: https://github.com/vdemichev/diann-rpackage
تصور مواقع الببتيد في البروتين: https://github.com/MannLabs/alphamap (AlphaMap بواسطة مختبر مان)
ملاحظات ومناقشات حول البروتينات بشكل عام واستخدام DIA-NN: https://github.com/vdemichev/DiaNN/discussions/categories/dia-proteomics-in-detail (سيتم توسيع هذا القسم بشكل أكبر).
تثبيت
ابدء
تنسيقات البيانات الخام
تنسيقات المكتبة الطيفية
الإخراج
بحث خالي من المكتبة
إنشاء المكتبات الطيفية
المباراة بين أشواط
تغيير الإعدادات الافتراضية
أداة سطر الأوامر
التصور
خطوط الأنابيب الآلية
PTMs والأشكال الببتيدية
تعدد الإرسال باستخدام plexDIA
مرجع إعدادات واجهة المستخدم الرسومية
مرجع سطر الأوامر
مرجع الإخراج الرئيسي
الأسئلة المتداولة (الأسئلة الشائعة)
يدعم
على نظام التشغيل Windows ، قم بتنزيل برنامج التثبيت .exe وتشغيله. تأكد من عدم تشغيل برنامج التثبيت من محرك أقراص الشبكة. يوصى بتثبيت DIA-NN في المجلد الافتراضي الذي اقترحه المثبت. وبدلاً من ذلك، ما عليك سوى فك ضغط أرشيف .binaries.zip إلى الموقع الذي تختاره.
في نظام التشغيل Linux ، قم بتنزيل ملف .Linux.zip وفك ضغطه. يتم إنشاء إصدار Linux من DIA-NN على Linux Mint 21.2، ويجب أن يحتوي النظام المستهدف على المكتبات القياسية الحديثة على الأقل. ومع ذلك، لا يوجد مثل هذا الشرط إذا قمت بإنشاء صورة حاوية Docker أو Apptainer/Singularity. لإنشاء أي من الحاوية، نوصي بالبدء بأحدث صورة لـ debian docker - في هذه الحالة تحتاج فقط إلى تثبيت sudo apt install libgomp1
قبل أن تتمكن من تشغيل DIA-NN فيها. يرجى أيضًا الاطلاع على الدليل التفصيلي الممتاز الذي أعده روجر أوليفيلا. للحصول على أفضل أداء، استخدم mimalloc مع التجاوز الديناميكي كما هو موضح هنا https://github.com/microsoft/mimalloc.
من الممكن أيضًا تشغيل DIA-NN على Linux باستخدام Wine 6.8 أو إصدار أحدث.
يمكن تحليل بيانات قياس الطيف الكتلي DIA بطريقتين: من خلال البحث في قاعدة بيانات تسلسلية (وضع خالٍ من المكتبة)، أو باستخدام "مكتبة طيفية" - مجموعة من الأطياف المعروفة وأوقات الاحتفاظ بالببتيدات المحددة. نناقش بالتفصيل متى يجب استخدام كل من هذه الأساليب في قسم البحث الخالي من المكتبة. بالنسبة لكلا النوعين من التحليلات، يعد استخدام DIA-NN أمرًا بسيطًا للغاية:
الآن، المعلومات المذكورة أعلاه كافية للبدء في استخدام DIA-NN، الأمر بهذه السهولة بالفعل! قد تكون بقية هذه الوثائق مفيدة، ولكنها ليست ضرورية لـ 99% من المشاريع.
ما ورد أعلاه هو كيفية تشغيل DIA-NN بالإعدادات الافتراضية، وهي تؤدي إلى الأداء الأمثل أو الأمثل تقريبًا لمعظم التجارب. ومع ذلك، في بعض الحالات، يكون من الأفضل ضبط الإعدادات، راجع تغيير الإعدادات الافتراضية لمزيد من التفاصيل.
توفر DIA-NN أيضًا خيارات ضبط قوية للتجارب الرائعة. يتم تطبيق DIA-NN كواجهة رسومية سهلة الاستخدام تستدعي أداة سطر الأوامر تلقائيًا. ولكن يمكن للمستخدم أيضًا تمرير الخيارات/الأوامر إلى أداة سطر الأوامر مباشرةً، عبر مربع نص الخيارات الإضافية في الواجهة. تبدأ كل هذه الخيارات بشرطة مزدوجة - متبوعة باسم الخيار، وإذا أمكن، بعض المعلمات التي سيتم تعيينها. لذلك، إذا رأيت بعض الخيارات/الأوامر مع -- في اسمها المذكور في هذه الوثائق، فهذا يعني أن هذا الأمر من المفترض كتابته في مربع نص الخيارات الإضافية .
التنسيقات المدعومة: Sciex .wiff، وBruker .d، وThermo .raw، و.mzML، و.dia (التنسيق المستخدم بواسطة DIA-NN لتخزين الأطياف). من الممكن التحويل من أي تنسيق مدعوم إلى .dia. عند التشغيل على Linux (الإصدارات الأصلية، وليس Wine)، يتم دعم بيانات .d و.mzML و.dia فقط.
للحصول على دعم .wiff، قم بتنزيل ProteoWizard وتثبيته - اختر الإصدار (64 بت) الذي يدعم "ملفات البائع"). ثم انسخ جميع الملفات التي تحمل اسم "Clearcore" أو "Sciex" (ستكون هذه ملفات .dll) من مجلد ProteoWizard إلى مجلد تثبيت DIA-NN (المجلد الذي يحتوي على diann.exe وDIA-NN.exe وملف مجموعة من الملفات الأخرى).
تتطلب قراءة ملفات Thermo .raw تثبيت برنامج Thermo MS File Reader. ومن الضروري استخدام الإصدار المحدد بالرابط أعلاه (3.0 SP3).
يجب أن تكون ملفات .mzML مركزية وتحتوي على بيانات كأطياف (مثل SWATH/DIA) وليس مخططات لونية.
يمكن تحويل العديد من تنسيقات المواصفات الجماعية، بما في ذلك التنسيقات القليلة التي لا يدعمها DIA-NN مباشرةً، إلى .mzML باستخدام تطبيق MSConvertGUI من ProteoWizard. يعمل هذا مع كافة التنسيقات المدعومة باستثناء Bruker .d وSCIEX Scanning SWATH - والتي يجب الوصول إليها بواسطة DIA-NN مباشرة. يجب استخدام إعدادات MSConvert التالية للتحويل:
يدعم DIA-NN الجداول المفصولة بفواصل (.csv)، أو المفصولة بعلامات جدولة (.tsv، أو .xls، أو .txt) أو جداول .parquet كمكتبات طيفية، بالإضافة إلى .speclib (التنسيق المضغوط الذي تستخدمه DIA-NN)، و.sptxt. (SpectraST، التجريبية) وملفات المكتبة .msp (NIST، التجريبية). هام: يجب ألا تحتوي المكتبة على أيونات سلائف غير مجزأة على أنها "أجزاء": يجب أن يتم إنتاج كل أيون جزء بالفعل بواسطة تجزئة العمود الفقري الببتيد.
يتم دعم المكتبات بتنسيق PeakView بالإضافة إلى المكتبات التي تنتجها FragPipe أو TargetedFileConverter (جزء من OpenMS) أو المصدرة من Spectronaut (Biognosys) بتنسيق .xls أو التي تم إنشاؤها بواسطة DIA-NN نفسها "كما هي".
بالنسبة لمكتبات .tsv/.xls/.txt التي تم إنشاؤها بوسائل أخرى، قد يتطلب DIA-NN تحديد أسماء الرؤوس (مفصولة بفواصل) (بالنسبة للأعمدة التي تتطلبها) باستخدام أمر --library-headers. استخدم الرمز * بدلاً من اسم الرأس للحفاظ على التعرف عليه تلقائيًا. انظر أدناه أوصاف الأعمدة المعنية (بالترتيب الذي يجب تحديد الرؤوس به).
الأعمدة المطلوبة:
يوصى بشدة أن تكون الأعمدة التي تحتوي على ما يلي موجودة أيضًا في المكتبة:
على سبيل المثال، يمكن أن يبدو الأمر --library-headers الذي يحدد جميع أسماء الأعمدة باستثناء العمود "Decoy" كما يلي:
--رؤوس المكتبة الببتيد المعدل، PrecursorCharge، PrecursorMz، Tr_recalibrated، ProductMz، LibraryIntensity، UniprotID، اسم البروتين، الجينات، النموذج الأولي، *، FragmentCharge، FragmentType، FragmentSeriesNumber، FragmentLossType، QValue، ExcludeFromAssay، IonMobility
استخدم --sptxt-acc لتعيين دقة كتلة تصفية الأجزاء (بالجزء في المليون) عند قراءة مكتبات .sptxt/.msp.
يمكن أيضًا استخدام MaxQuant msms.txt (تجريبيًا) كمكتبة طيفية في DIA-NN، على الرغم من أن التعديلات الثابتة قد لا تتم قراءتها بشكل صحيح.
يمكن لـ DIA-NN تحويل أي مكتبة يدعمها إلى تنسيق .parquet الخاص بها. للقيام بذلك، انقر فوق المكتبة الطيفية (جزء الإدخال )، وحدد المكتبة التي تريد تحويلها، وحدد اسم ملف مكتبة الإخراج (جزء الإخراج )، وانقر فوق تشغيل . إذا كنت تستخدم بعض تنسيقات المكتبة الغريبة، فمن الجيد تحويلها إلى .parquet الخاص بـ DIA-NN ثم فحص المكتبة الناتجة (باستخدام حزمة R 'arrow' أو حزمة Python 'pyarrow') لمعرفة ما إذا كانت المحتويات منطقية.
جميع مكتبات .tsv/.xls/.txt/.csv/.parquet هي مجرد جداول بسيطة تحتوي على بيانات يمكن للإنسان قراءتها، ويمكن استكشافها/تحريرها، إذا لزم الأمر، باستخدام Excel أو (بشكل مثالي) R/Python.
الأهم من ذلك، عندما يتم تحويل أي مكتبة إلى تنسيق مختلف، يمكن تقريب جميع الأرقام باستخدام دقة عشرية معينة، مما يعني أنها قد لا تكون هي نفسها تمامًا كما في المكتبة الأصلية (قد يكون هناك اختلاف بسيط). وبالتالي، على الرغم من أن الأداء عند التحليل باستخدام مكتبة محولة سيكون قابلاً للمقارنة، إلا أن النتائج لن تتطابق تمامًا.
يسمح جزء الإخراج بتحديد المكان الذي يجب حفظ الإخراج فيه بالإضافة إلى أسماء الملفات لتقرير الإخراج الرئيسي و(اختياريًا) المكتبة الطيفية للإخراج. يستخدم DIA-NN أسماء الملفات هذه لاشتقاق أسماء جميع ملفات الإخراج الخاصة به. يمكنك العثور أدناه على معلومات حول أنواع مختلفة من مخرجات DIA-NN. بالنسبة لمعظم سير العمل، يحتاج المرء فقط إلى التقرير الرئيسي (للتحليل في R أو Python - مستحسن) أو المصفوفات (الإخراج المبسط لبرنامج MS Excel). عند تمكين إنشاء مصفوفات الإخراج، تقوم DIA-NN أيضًا بإنتاج ملف .manifest.txt مع وصف مختصر لملفات الإخراج التي تم إنشاؤها.
جدول نصي يحتوي على معرفات السلائف والبروتينات، بالإضافة إلى الكثير من المعلومات المرتبطة بها. معظم أسماء الأعمدة تشرح نفسها بنفسها، ويمكن العثور على المرجع الكامل في مرجع الإخراج الرئيسي. يتم استخدام الكلمات الأساسية التالية عند تسمية الأعمدة:
ملاحظة: منذ الإصدار 1.9، تقوم DIA-NN بإنتاج تقرير بتنسيق Apache .parquet. هذا هو تنسيق جدول نصي مضغوط (تقليل الحجم بمقدار 10 أضعاف تقريبًا) يمكن تحميله في سطر واحد من التعليمات البرمجية باستخدام حزمة R 'arrow' أو حزمة Python 'pyarrow'. تنعكس معظم الوظائف الجديدة (المقدمة في DIA-NN 1.9) فقط في تقرير الباركيه، لذا يوصى باستخدامه بدلاً من تقرير .tsv القديم في جميع الحالات، بينما لا يزال يتم إنشاء تقرير .tsv فقط للتوافق مع سير عمل التحليل القديم. يمكن إيقاف إنشاء تقرير .tsv القديم باستخدام --no-main-report. بالإضافة إلى استخدام R أو Python، يمكنك أيضًا عرض ملفات .parquet باستخدام عارض TAD.
تحتوي هذه على كميات MaxLFQ الطبيعية لمجموعات البروتين ('pg_matrix')، ومجموعات الجينات ('gg_matrix')، والجينات الفريدة ('unique_genes_matrix'؛ أي الجينات التي تم تحديدها وقياسها باستخدام النمط البروتيني فقط، أي الببتيدات الخاصة بالجينات) بالإضافة إلى الجينات الطبيعية. كميات السلائف ('pr_matrix'). يتم تصفيتها عند 1% FDR، باستخدام قيم q العالمية لمجموعات البروتين وقيم q العالمية والخاصة بالتشغيل للسلائف. يتم تطبيق مرشح FDR إضافي بنسبة 5% على مستوى البروتين على مصفوفات البروتين، استخدم --matrix-spec-q لضبطه. في بعض الأحيان، يُبلغ DIA-NN عن الصفر كأفضل تقدير لكمية السلائف أو البروتين. يتم حذف هذه الكميات الصفرية من مصفوفات البروتين/الجينات. يتم إنشاء مصفوفات خاصة لتقدير كمية الفوسفوسيت (phosphosites_90 وphosphosites_99 .tsv) عندما يتم الإعلان عن الفسفرة (UniMod:21) كتعديل متغير، راجع PTMs والأشكال الببتيدو.
يتم إنشاء ملف .protein_description.tsv مع المصفوفات ويحتوي على معلومات البروتين الأساسية المعروفة لـ DIA-NN (معرفات التسلسل والأسماء وأسماء الجينات والوصف والتسلسل). ستتضمن الإصدارات المستقبلية من DIA-NN مزيدًا من المعلومات، على سبيل المثال، الوزن الجزيئي للبروتين.
يحتوي على عدد من مقاييس مراقبة الجودة التي يمكن استخدامها لتصفية البيانات، على سبيل المثال لاستبعاد عمليات التشغيل الفاشلة أو كقراءة لتحسين الطريقة. لاحظ أن عدد البروتينات المذكورة هنا يتوافق مع عدد البروتينات الفريدة (أي التي تم تحديدها باستخدام سلائف النمط البروتيني) في عملية معينة عند قيمة q للبروتين الفريد بنسبة 1%. يمكن إعادة إنتاج هذا الرقم من التقرير الرئيسي الذي تم إنشاؤه باستخدام عتبة FDR السليفة بنسبة 100% وتصفيته باستخدام Protein.Q.Value <= 0.01 & Proteotypic == 1. ما يتم احتسابه على أنه "بروتين" هنا يعتمد على إعداد "استدلال البروتين".
تصور لعدد من مقاييس مراقبة الجودة، بناءً على التقرير الرئيسي بالإضافة إلى تقرير الإحصائيات. يجب استخدام تقرير PDF فقط للتقييم الأولي السريع للبيانات ولا ينبغي استخدامه في المنشورات.
يسمح جزء الإخراج بالتحكم في كيفية التعامل مع "ملفات .quant". الآن، لشرح هذه العناصر، دعونا نفكر في كيفية معالجة DIA-NN للبيانات الأولية. يقوم أولاً بتنفيذ الجزء الذي يتطلب حسابيًا من المعالجة بشكل منفصل لكل فرد يتم تشغيله في التجربة، ويحفظ التعريفات والمعلومات الكمية في ملف .quant منفصل. بمجرد معالجة جميع عمليات التشغيل، فإنه يجمع المعلومات من جميع ملفات .quant وينفذ بعض خطوات التشغيل المتقاطع، مثل حساب قيمة q العالمية، واستدلال البروتين، وحساب الكميات النهائية والتطبيع. وهذا يسمح باستخدام DIA-NN بطريقة مرنة للغاية. على سبيل المثال، يمكنك إيقاف المعالجة في أي لحظة، ثم استئناف المعالجة بدءًا من التشغيل الذي توقفت عنده. أو يمكنك إزالة بعض عمليات التشغيل من التجربة، وإضافة بعض عمليات التشغيل الإضافية، وإعادة تشغيل التحليل بسرعة، دون الحاجة إلى إعادة تحليل عمليات التشغيل التي تمت معالجتها بالفعل. يتم تمكين كل هذا من خلال خيار استخدام ملفات .quant الموجودة عند توفرها . يتم حفظ ملفات .quant في/قراءتها من Temp/.dia dir (أو من نفس موقع الملفات الأولية، إذا لم يكن هناك مجلد مؤقت محدد). عند استخدام هذا الخيار، يجب على المستخدم التأكد من إنشاء ملفات .quant بنفس الإعدادات المطبقة في التحليل الحالي، باستثناء Precursor FDR (شريطة أن تكون <= 5%)، وThreads ، و Log Level ، MBR والتطبيع عبر التشغيل وإنشاء المكتبة - يمكن أن تكون هذه الإعدادات مختلفة. من الممكن بالفعل نقل ملفات .quant إلى كمبيوتر آخر وإعادة استخدامها هناك - دون نقل الملفات الأولية الأصلية. هام: يوصى بشدة بإعادة استخدام ملفات .quant فقط عندما تكون الدقة الجماعية ونافذة المسح ثابتة على بعض القيم (غير الصفر)، وإلا فإن DIA-NN سيقوم بتحسين هذه الملفات مرة أخرى باستخدام التشغيل الأول الذي يكون . لم يتم العثور على الملف الكمي. علاوة على ذلك، عند استخدام MBR أو إنشاء مكتبة طيفية من بيانات DIA مع تعيين إنشاء المكتبة على التوصيف الذكي أو الكامل، يجب إعادة استخدام الملفات .quant فقط إذا تم إنشاؤها بنفس الترتيب تمامًا مثل الترتيب الحالي للملفات الأولية، أي مع MBR DIA-NN لا يمكن حاليًا دمج عدة تحليلات منفصلة معًا.
ملحوظة: التقرير الرئيسي بتنسيق .parquet يوفر معلومات المخرجات الكاملة لأي نوع من المعالجة النهائية. جميع أنواع المخرجات الأخرى موجودة لتبسيط التحليل عند استخدام MS Excel أو برامج مشابهة. قد تظهر أعداد السلائف والبروتينات المبلغ عنها في أنواع مختلفة من ملفات الإخراج مختلفة بسبب التصفية المختلفة المستخدمة لإنشاء تلك الملفات، يرجى الاطلاع على الأوصاف أعلاه. يمكن إعادة إنتاج جميع "المصفوفات" من تقرير .parquet الرئيسي، إذا تم إنشاؤها باستخدام سلائف FDR مضبوطة على 5%، باستخدام R أو Python.
يحتوي DIA-NN على وحدة متقدمة جدًا خالية من المكتبات، وهي أفضل بالنسبة لأنواع معينة من التجارب من استخدام مكتبة طيفية عالية الجودة خاصة بالمشروع. بشكل عام، ما يلي يجعل البحث الخالي من المكتبات يعمل بشكل أفضل مقارنة بالمكتبات الطيفية (بينما يفضل العكس المكتبات الطيفية):
يرجى ملاحظة أنه في 99% من الحالات، من الضروري تمكين MBR لإجراء تحليل كمي خالٍ من المكتبات. يتم تنشيطه افتراضيًا عند استخدام واجهة المستخدم الرسومية DIA-NN.
بالنسبة لمعظم التجارب، من المنطقي بالفعل تجربة البحث بدون مكتبة. بالنسبة للتجارب المتوسطة والكبيرة الحجم، قد يكون من المنطقي أن نحاول أولاً تحليل مجموعة فرعية من البيانات بدون مكتبة، لمعرفة ما إذا كان الأداء جيدًا (على مجموعة البيانات بأكملها، سيكون عادةً أفضل كثيرًا، لذلك لا داعي للقلق) صارمة للغاية هنا). نحن أيضًا نقوم في كثير من الأحيان بإجراء تقييم أولي سريع لمراقبة الجودة للتجربة باستخدام بعض المكتبات العامة.
غالبًا ما يكون من المناسب إجراء تحليل خالٍ من المكتبة في خطوتين: أولاً عن طريق إنشاء مكتبة طيفية متوقعة بالسيليكو من قاعدة بيانات التسلسل ثم التحليل باستخدام هذه المكتبة. وهذه هي الإستراتيجية التي يجب استخدامها في جميع الحالات باستثناء التحليلات الأولية السريعة. لاحظ أن وظيفة خط الأنابيب في DIA-NN تسمح بجدولة تسلسل المهام بسهولة، مثل إنشاء مكتبة متوقعة متبوعة بتحليلات متعددة باستخدام هذه المكتبة.
لاحظ أنه كلما زادت مساحة البحث (العدد الإجمالي للسلائف التي تم النظر فيها)، كلما زاد صعوبة تحديد الببتيدات لبرنامج التحليل، وكلما زاد الوقت الذي يستغرقه البحث. DIA-NN جيد جدًا في التعامل مع مساحات بحث كبيرة جدًا، ولكن حتى DIA-NN لا يمكنه القيام بالسحر وتقديم نتائج جيدة بمساحة بحث تبلغ 100 مليون، كما هو الحال مع مساحة بحث تبلغ 2 مليون. لذلك يحتاج المرء إلى توخي الحذر بشأن تمكين جميع التعديلات المتغيرة الممكنة مرة واحدة. على سبيل المثال، قد لا يكون السماح بحد أقصى 5 تعديلات متغيرة، مع تمكين أكسدة الميثيونين والفوسفو وإزالة الأميد في وقت واحد، فكرة جيدة.
وهنا يكمن تمييز مهم بين تحليل بيانات DIA وDDA. في DDA، يعد السماح بجميع التعديلات المتغيرة المحتملة أمرًا منطقيًا أيضًا لأن محرك البحث يحتاج إلى مطابقة الطيف بشيء ما - وإذا لم يكن مطابقًا للببتيد المعدل الصحيح، فستتم مطابقته بشكل خاطئ. يختلف النهج في DIA اختلافًا جذريًا: حيث يوجد الطيف الأكثر تطابقًا في البيانات الخاصة بكل أيون سلائف يتم النظر فيه (وهذا عرض مبسط للغاية فقط لتوضيح المفهوم). لذا فإن عدم القدرة على تحديد طيف معين لا يمثل مشكلة على الإطلاق في DIA (في الواقع يتم مضاعفة إرسال معظم الأطياف بشكل كبير في DIA - والتي تنشأ من ببتيدات متعددة - ولا يمكن تحديد سوى جزء صغير منها). وبالتالي فمن المنطقي فقط تمكين تعديل متغير معين إذا كنت مهتمًا به على وجه التحديد أو إذا كان التعديل موجودًا في كل مكان بالفعل.
راجع PTMs والأشكال الببتيدية للحصول على معلومات حول التمييز بين الأشكال الببتيدية التي تحمل مجموعات مختلفة من التعديلات.
يمكن لـ DIA-NN إنشاء مكتبة طيفية من أي مجموعة بيانات DIA. يمكن القيام بذلك في كل من الوضعين المعتمد على المكتبة الطيفية والوضع الخالي من المكتبة: ما عليك سوى تحديد خيار إنشاء مكتبة طيفية في جزء الإخراج.
يمكن لـ DIA-NN أيضًا إنشاء مكتبة طيفية متنبأ بها من خلال قاعدة بيانات تسلسلية (تأكد من تمكين ملخص FASTA ) أو مكتبة طيفية أخرى (غالبًا ما تكون مفيدة للمكتبات العامة): ما عليك سوى تشغيل DIA-NN دون تحديد أي ملفات أولية و قم بتمكين خيار التنبؤ بالأطياف المستندة إلى التعلم العميق وRTs وIMs في جزء إنشاء أيونات السلائف . التعديلات التي يدعمها حاليًا متنبئ التعلم العميق هي: C(cam)، M(ox)، N-term acetyl، N/Q(dea)، S/T/Y(phos)، K(-GG)، nK( mTRAQ) وnK(TMT). تجدر الإشارة إلى أنه إذا لم تتعرف وحدة التوقع في DIA-NN على بعض التعديلات، فستستمر في تنفيذ التنبؤ مع تجاهلها فقط. لجعل DIA-NN يتجاهل بدلاً من ذلك أي ببتيدات ذات تعديلات غير معروفة للمتنبئ، استخدم --skip-unknown-mods.
يمكن أيضًا إنشاء المكتبات الطيفية من بيانات DDA، وفي الواقع كانت التجزئة غير المتصلة بالإنترنت + DDA هي الطريقة "المعيارية الذهبية" لإنشاء المكتبات منذ تقديم بروتينات SWATH/DIA. ولهذا نوصي باستخدام FragPipe، الذي يعتمد على محرك بحث MSFragger فائق السرعة والقوي. يمكن أيضًا استخدام FragPipe لإنشاء مكتبات متوافقة مع DIA-NN أيضًا من بيانات DIA، على غرار DIA-NN نفسها.
يعد MBR وضعًا قويًا في DIA-NN، وهو مفيد لمعظم التجارب الكمية، سواء مع المكتبة الطيفية أو في الوضع الخالي من المكتبة. عادةً ما يؤدي MBR إلى ارتفاع متوسط أرقام المعرفات، ولكن أيضًا إلى اكتمال بيانات أفضل بكثير، وهذا يعني قيمًا مفقودة أقل بكثير.
أثناء معالجة أي مجموعة بيانات، تجمع DIA-NN الكثير من المعلومات المفيدة التي كان من الممكن استخدامها لمعالجة البيانات بشكل أفضل. وهذا ما تم تمكينه بواسطة MBR. باستخدام MBR، تقوم DIA-NN أولاً بإنشاء مكتبة طيفية من بيانات DIA، ثم تعيد معالجة نفس مجموعة البيانات باستخدام هذه المكتبة الطيفية. يضمن الابتكار الخوارزمي المطبق في DIA-NN التحكم الصارم في FDR: تم التحقق من صحة MBR على مجموعات بيانات تتراوح من مرتين إلى أكثر من 1000 مرة.
يجب تمكين MBR لأي تجربة كمية، ما لم يكن لديك مكتبة طيفية عالية الجودة خاصة بالمشروع، والتي تعتقد (i) من المرجح أن توفر تغطية كاملة تقريبًا للببتيدات القابلة للاكتشاف، وهذا يعني أنه لا فائدة من تجربة المكتبة الخالية بحث + MBR، و(2) معظم الببتيدات الموجودة في المكتبة يمكن اكتشافها بالفعل في تجربة DIA. إذا كان (i) فقط صحيحًا، فقد يكون من المفيد تجربة MBR جنبًا إلى جنب مع تعيين إنشاء المكتبة على ملفات تعريف المعرفات .
لا ينبغي استخدام MBR للتجارب غير الكمية، أي عندما تريد فقط إنشاء مكتبة طيفية، والتي ستستخدمها بعد ذلك في بعض مجموعات البيانات الأخرى.
يمكن للمرء "تقليد" MBR يدويًا باستخدام نهج من خطوتين يؤدي إلى أداء مشابه. أولاً، قم بتشغيل DIA-NN لإنشاء مكتبة طيفية من عمليات تشغيل DIA (التجربة بأكملها أو مجموعتها الفرعية فقط، والتي يمكن أن تكون أسرع كثيرًا للتجارب واسعة النطاق أو التجارب بما في ذلك الفراغات/التشغيلات الفاشلة). ثم استخدم هذه المكتبة لتحليل التجربة بأكملها. في كلتا الحالتين، قم بتشغيل DIA-NN مع تعطيل MBR.
عند استخدام MBR (أو تقليده) والاعتماد على تقرير .parquet الرئيسي (الموصى به) بدلاً من المصفوفات الكمية، استخدم مرشحات القيمة q التالية:
يمكن استخدام DIA-NN بنجاح لمعالجة أي تجربة تقريبًا باستخدام الإعدادات الافتراضية. بشكل عام، يوصى بتغيير الإعدادات فقط عندما يُنصح بذلك على وجه التحديد في هذه الوثائق (كما هو موضح أدناه)، لنوع تجربة محدد، أو إذا كان هناك سبب منطقي واضح ومقنع للغاية للتغيير.
في كثير من الحالات، قد يرغب المرء في تغيير عدة معلمات في جزء الخوارزمية .
يرجى أيضًا الاطلاع على الإرشادات المتعلقة بالبحث الخالي من المكتبة، وPTMs، والأشكال الببتيدية، وتعدد الإرسال باستخدام plexDIA، إذا كانت ذات صلة بتجربتك.
لاحظ أنه بمجرد تحديد خيار معين في واجهة المستخدم الرسومية DIA-NN، قد يتم تنشيط بعض الإعدادات الأخرى تلقائيًا. على سبيل المثال، عندما تختار إجراء ملخص قاعدة بيانات FASTA في silico (للبحث بدون مكتبة)، أو مجرد إنشاء مكتبة طيفية من بيانات DIA، سيتم تحديد MBR تلقائيًا أيضًا - لأنه مفيد في 99% من الحالات.
يتم تطبيق DIA-NN كواجهة مستخدم رسومية (GUI)، والتي تستدعي أداة سطر الأوامر (diann.exe). يمكن أيضًا استخدام أداة سطر الأوامر بشكل منفصل، على سبيل المثال كجزء من مسارات المعالجة الآلية المخصصة. علاوة على ذلك، حتى عند استخدام واجهة المستخدم الرسومية، يمكن للمرء تمرير الخيارات/الأوامر إلى أداة سطر الأوامر، في مربع النص خيارات إضافية . تم ذكر بعض هذه الخيارات المفيدة في هذه الوثائق، ويتم توفير المرجع الكامل في مرجع سطر الأوامر.
عندما تقوم واجهة المستخدم الرسومية بتشغيل أداة سطر الأوامر، فإنها تطبع في نافذة السجل مجموعة الأوامر التي استخدمتها بالضبط. لذا، من أجل إعادة إنتاج السلوك الذي تمت ملاحظته عند استخدام واجهة المستخدم الرسومية (على سبيل المثال، إذا كنت تريد إجراء التحليل على مجموعة Linux)، يمكنك فقط تمرير نفس الأوامر تمامًا إلى أداة سطر الأوامر مباشرةً.
diann.exe [commands]
تتم معالجة الأوامر بالترتيب الذي وردت به، وفي معظم الأوامر يمكن أن يكون هذا الترتيب عشوائيًا.
في نظام Linux، الفاصلة المنقوطة ';' يتم التعامل مع الحرف كفاصل أوامر، لذلك ';' كجزء من أوامر DIA-NN (على سبيل المثال --channels) يجب استبدالها بـ ';' على Linux للسلوك الصحيح.
للراحة، وكذلك للتعامل مع التجارب التي تتكون من آلاف الملفات، يمكن تخزين بعض الخيارات/الأوامر في ملف التكوين. لهذا، قم بإنشاء ملف نصي بأي امتداد، على سبيل المثال، diann_config.cfg، واكتب أي أوامر يدعمها DIA-NN هناك، ثم قم بالإشارة إلى هذا الملف باستخدام --cfg diann_config.cfg (في مربع النص خيارات إضافية أو في الأمر المستخدم لاستدعاء أداة سطر الأوامر diann.exe).
يوفر DIA-NN خيارين للتصور.
أفق . لتصور اللوني/الأطياف في Skyline، قم بتحليل تجربتك باستخدام MBR وقاعدة بيانات FASTA المحددة ثم انقر فوق الزر "Skyline". ستقوم DIA-NN بتشغيل Skyline تلقائيًا (تأكد من تثبيت الإصدار اليومي 23.1.1.459 من Skyline/Skyline أو إصدار أحدث كـ "تثبيت المسؤول"). حاليًا، لا يدعم سير العمل هذا تعدد الإرسال ولن يعمل مع التعديلات بأي تنسيق آخر غير UniMod.
عارض ديا-إن . قم بتحليل تجربتك مع تحديد مربع الاختيار "XICs" وانقر فوق الزر "عارض". بشكل افتراضي ، سيجعل خيار "XICS" DIA-NN استخراج كروماتوجرامات لأيونات شظايا المكتبة فقط وفي غضون 10s من قمة الشطف. الاستخدام-سام [n] لتعيين نافذة وقت الاستبقاء على ثوانٍ (على سبيل المثال-60-سوف يستخرج اللوني في غضون دقيقة واحدة من القمة) و- النظرية السمكية لاستخراج جميع الشحنة 1 و 2 Y/B -شظايا ، بما في ذلك تلك ذات الخسائر المحايدة الشائعة. لاحظ أن استخدام النظرية السمكية ، وخاصة بالاشتراك مع نافذة زمنية الاحتفاظ الكبيرة ، قد يتطلب كمية كبيرة من مساحة القرص في مجلد الإخراج. ومع ذلك ، فإن التصور نفسه فوري بشكل فعال ، لأي حجم تجربة.
ملاحظة : يتم حفظ الكروماتوغرامات المستخرجة بـ "XICS" بتنسيق Apache .Parquet (تنتهي أسماء الملفات بـ ".xic.parquet") ويمكن الوصول إليها بسهولة باستخدام R أو Python. قد يكون ذلك مناسبًا أحيانًا لإعداد أرقام جاهزة للنشر (على الرغم من أنه يمكن القيام بذلك باستخدام Skyline أو DiA-NN Comeer أيضًا) ، أو حتى لإعداد مراقبة الجودة المخصصة التلقائية لأداء LC-MS.
يمكن تصور مواضع الببتيد والتعديل داخل البروتين باستخدام alphamap بواسطة Mann Lab https://github.com/mannlabs/alphamap.
تتيح نافذة خط الأنابيب داخل واجهة المستخدم الرسومية DIA-NN الجمع بين خطوات التحليل المتعددة في خطوط الأنابيب. كل خطوة خط أنابيب هي مجموعة من الإعدادات كما هو معروض من قبل واجهة المستخدم الرسومية. يمكن للمرء أن يضيف مثل هذه الخطوات إلى خط الأنابيب ، وتحديث الخطوات الحالية ، وإزالة الخطوات ، ونقل الخطوات لأعلى/لأسفل في خط الأنابيب ، وتعطيل/تمكين (عن طريق انقر فوق الماوس المزدوج) بعض الخطوات داخل خط الأنابيب وحفظ/تحميل خطوط الأنابيب. علاوة على ذلك ، يمكن نسخ خطوات خطوط الأنابيب الفردية بين علامات تبويب/Windows المختلفة (استخدم أزرار النسخ واللصق لهذا الغرض). نقوم دائمًا بتجميع جميع أشواط DIA-NN لمنشور معين في خط أنابيب. يمكن للمرء أيضًا استخدام خطوط أنابيب DIA-NN لتخزين قوالب تكوين.
يتميز DIA-NN GUI بتدفقات سير عمل مدمجة (جزء من أيون السلائف ) للكشف عن أكسدة الميثيونين ، أسيتيل البروتين N-terminal ، الفسفرة والانتشار (عن طريق اكتشاف ما تبقى من adducts adducts على lysines). يمكن الإعلان عن التعديل الآخر باستخدام-var-mod أو--8-mod في خيارات إضافية .
إن التمييز بين الببتيدوفورم الذي يحمل مجموعات مختلفة من التعديلات هو مشكلة غير تافهة في DIA: بدون تسجيل ببتيدوفورم خاص ، يمكن أن يكون FDR الفعال ببتيدوفورم في المدى 5-10 ٪ للتحليلات الخالية من المكتبات. تنفذ DIA-NN نهجًا إحصائيًا للهدف المستهدف لتسجيل الببتيدوفورم ، والذي يتم تمكينه بواسطة خيار ببتيدوفورم (جزء الخوارزمية ) ويتم تنشيطه تلقائيًا كلما تم الإعلان عن تعديل متغير ، عبر إعدادات واجهة المستخدم الرسومية أو-أمر-VAR-MOD. تعكس القيم الببتيدوفورم الناتجة عن ثقة DIA-NN في صحة مجموعة التعديلات المبلغ عنها للببتيد وكذلك صحة تسلسل الأحماض الأمينية المحددة. ومع ذلك ، فإن هذه القيم Q لا تضمن عدم وجود تحولات منخفضة الكتلة بسبب بعض بدائل الأحماض الأمينية أو التعديلات مثل deamidation (لاحظ أن DDA لا يضمن ذلك أيضًا).
علاوة على ذلك ، يتميز DIA-NN بخوارزمية تقارير تقديرات ثقة توطين PTM (كاحتمالات خلفية للتوطين الصحيحة لجميع مواقع PTM المتغيرة على الببتيد وكذلك الدرجات للمواقع الفردية) ، المدرجة في تقرير إخراج .parquet. تحتوي ملفات الفوسفوزيت_90 و phosphosites_99. على كميات خاصة بالفوسفوسيت ، محسوبة باستخدام الطريقة الأولى 1 (التجريبية) ، وهي أعلى كثافة بين السلائف مع الموقع المترجمة مع الثقة المحددة (0.9 أو 0.99 ، على التوالي). الكمية في المدى المحدد. يتم استخدام الخوارزمية "Top 1" هنا لأنها على الأرجح أقوى القيم المتطرفة وأخطاء الخاطئة. ومع ذلك ، ما إذا كان هذا هو بالفعل الخيار الأفضل في الواقع ، والذي يمثل تحديًا حاليًا بسبب عدم وجود معايير مع الحقيقة البرية المعروفة.
بشكل عام ، عند البحث عن PTMS ، نوصي بما يلي:
أساسي: يجب تحديد التعديلات المتغيرة التي تبحث عنها كمتغير (عبر مربعات الاختيار واجهة المستخدم الرسومية أو الخيارات الإضافية ) عند إنشاء مكتبة متوقعة في السيليكو وأيضًا عند تحليل البيانات الأولية باستخدام أي مكتبة متوقعة أو تجريبية
إعدادات الفسفرة: التعديلات المتغيرة MAX 3 ، MAX 1 ، الانقسام المفقود ، الفسفرة هو التعديل المتغير الوحيد المحدد ، نطاق شحن السلائف 2-3 ؛ لتقليل استخدام ذاكرة الوصول العشوائي ، تأكد من أن نطاق كتلة السلائف المحدد (عند إنشاء مكتبة متوقعة) ليس أوسع من نطاق كتلة السلائف المحدد ل MS/MS بواسطة طريقة DIA ؛ لتسريع المعالجة عند استخدام مكتبة متوقعة ، قم أولاً بإنشاء مكتبة تعتمد على DIA من مجموعة فرعية من عمليات التجريب (على سبيل المثال أفضل 10 عمليات تشغيل) ثم تحليل مجموعة البيانات بأكملها باستخدام هذه المكتبة المستندة إلى DIA مع تعطيل MBR مع تعطيل MBR
عندما ينجح ما ورد أعلاه ، جرب أيضًا انقسامات Max 2 Max 2
عند البحث عن PTMs بخلاف الفسفرة ، في 95 ٪ من الحالات الأفضل لاستخدام التعديلات المتغيرة من 1 إلى 3 MAX و MAX 1 الفائتة
عندما لا تبحث عن PTMS ، أي عندما يكون الهدف هو القياس الكمي للبروتين النسبي ، فإن تمكين التعديلات المتغيرة عادة لا تسفر عن عمق بروتيني أعلى. على الرغم من أنه عادة لا يضر أيضًا ، إلا أنه سيجعل المعالجة أبطأ.
على حد علمنا ، لا يوجد أي التحقق المنشور من ثقة تحديد الهوية للكشف عن الببتيدات المتذمر (والتي من السهل الخلط بينها إلى النظيرية الأثقل ، ما لم يكن لمواصفات الكتلة بدقة عالية للغاية ودقة ضيقة/إعداد كتلة. يستخدم من قبل محرك البحث) ، حتى بالنسبة إلى DDA. تتمثل إحدى الطرق لاكتساب الثقة في تحديد الببتيدات المتخلفة إذا تم تحديد أي شيء إذا تم إعلان أن دلتا الكتلة من أجل deamidation هي 1.022694 ، بدلاً من القيمة الصحيحة 0.984016. تقوم DIA-NN باختيار هذا الاختبار بنجاح على العديد من مجموعات البيانات (لا يتم الإبلاغ عن معرفات عند تحديد "كتلة تعديل الشرك" هذه) ، لكننا نوصي أيضًا بمحاولة البحث "كتلة تعديل الشرك" على عدة أشواط من التجربة المراد تحليلها ، إذا كانت تبحث عن الببتيدات المتخلفة. في كل حالة (صحيحة أو كتلة شرك) ، يجب استخدام-PTM-QValues لتمكين تسجيل PTM الخاص بالذنب ، بالإضافة إلى تسجيل الببتيدوفورم ، وإما ptm.q.value أو Global.Q.Value/lib. Q. القيمة المستخدمة للتصفية.
تجدر الإشارة إلى أنه عندما يكون الهدف النهائي هو تحديد البروتينات ، يكون غير ذي صلة إلى حد كبير إذا تم التعرف على الببتيد المعدل ، من خلال مطابقة طيف ناشئ عن ببتيدوفورم مختلف. لذلك ، إذا كان الغرض من التجربة هو تحديد/تحديد PTMs محددة ، أو بدائل الأحماض الأمينية أو تمييز البروتينات ذات هوية تسلسل عالية ، يوصى بخيار تسجيل الببتيدوفورم . في جميع الحالات الأخرى ، يكون تسجيل الببتيدوفورم على ما يرام عادةً للاستخدام ولكن ليس ضروريًا ، وعادة ما يؤدي إلى معالجة أبطأ إلى حد ما وانخفاض طفيف في أرقام التعريف عند استخدام MBR.
بشكل عام ، نعم. ومع ذلك ، فإن معظم مهام سير العمل ستعمل دون الحاجة إلى التعرف على التعديلات. على الرغم من أنه إذا تم اكتشاف تعديلات غير معروفة في المكتبة ، فإن DIA-NN ستقوم بطباعة قائمة تحذير لها ، ويوصى بشدة بإعلانها باستخدامها. لاحظ أن DIA-NN تتعرف بالفعل على العديد من التعديلات الشائعة ويمكنها أيضًا تحميل قاعدة بيانات Unimod بأكملها ، راجع خيار -الونيمود.
بالتعاون مع مختبر Slavov ، قمنا بتطوير Plexdia بناءً على DIA-NN ، وهي تقنية تسمح بالاستفادة من الإرسال غير الإيزجي (MTRAQ ، Dimethyl ، SILAC) مع DIA. لتحليل تجربة Plexdia ، يحتاج المرء إلى مكتبة طيفية متوقعة أو تجريبية. ثم يجب تزويد DIA-NN بالمجموعات التالية من الأوامر ، اعتمادًا على سيناريو التحليل.
سيناريو 1 . المكتبة هي مكتبة عادية خالية من الملصقات (تجريبية أو متوقعة) ، ويتم تحقيق تعدد الإرسال بحتلا مع وضع العلامات النظرية ، أي دون وضع العلامات الكيميائية مع علامات مثل MTRQ أو Dimethyl. يحتاج Dia-NN بعد ذلك إلى الخيارات التالية لإضافتها إلى خيارات إضافية :
مثال على ملصقات L/H Silac على K و R:
--fixed-mod SILAC,0.0,KR,label
--lib-fixed-mod SILAC
--channels SILAC,L,KR,0:0; SILAC,H,KR,8.014199:10.008269
--original-mods
لاحظ أنه في ما أعلاه ، تم الإعلان عن SILAC كعلامة ، أي ليس من المفترض أن يغير وقت الاحتفاظ بالببتيد. إنها أيضًا تسمية ذات كتلة صفرية هنا ، حيث إنها تعمل فقط على تعيين الأحماض الأمينية التي سيتم تصنيفها. ما يفعله مزيج-الثدي المُثبّن و--lib-fixed هنا هو ببساطة (silac) بعد كل k أو r في تسلسل معرف السلائف ، في تمثيل المكتبة الداخلية المستخدمة من قبل DIA-NN. -تقوم القنوات بعد ذلك بتقسيم كل إدخال مكتبة إلى اثنين ، واحدة مع الجماهير 0 (ك) و 0 (ص) المضافة عند كل حدوث k (silac) أو r (silac) في التسلسل ، على التوالي ، وآخر مع 8.014199 (ك (ك ) و 10.008269 (ص).
السيناريو 2 . المكتبة هي مكتبة عادية خالية من الملصقات (تجريبية أو متوقعة) ، ويتم تحقيق تعدد الإرسال عن طريق العلامات الكيميائية مع MTRAQ.
السيناريو 2: الخطوة 1. قم بتسمية المكتبة في السيليكو مع MTRAQ وقم بتشغيل تنبؤ التعلم العميق لضبط الأطياف/RTS/IMS. لهذا ، قم بتشغيل DIA-NN باستخدام مكتبة الإدخال في حقل المكتبة الطيفية ، وهي مكتبة مخرجات محددة ، وأطياف عميقة تعليمية ، و RTS و IMS ممكّنة ، وقائمة ملفات البيانات الخام فارغة والخيارات التالية في خيارات إضافية :
--fixed-mod mTRAQ,140.0949630177,nK
--lib-fixed-mod mTRAQ
--channels mTRAQ,0,nK,0:0; mTRAQ,4,nK,4.0070994:4.0070994;mTRAQ,8,nK,8.0141988132:8.0141988132
--original-mods
استخدم ملف .predicated.speclib مع الاسم المقابل لمكتبة الإخراج كمكتبة طيفية للخطوة التالية.
السيناريو 2: الخطوة 2. قم بتشغيل dia-nn مع الخيارات التالية:
--fixed-mod mTRAQ,140.0949630177,nK
--channels mTRAQ,0,nK,0:0; mTRAQ,4,nK,4.0070994:4.0070994;mTRAQ,8,nK,8.0141988132:8.0141988132
--original-mods
لاحظ أن--LIB-Fixed-MOD لم يعد ضروريًا لأن المكتبة التي تم إنشاؤها في الخطوة 1 تحتوي بالفعل على (MTRAQ) في الطرف N و Lysines من كل الببتيد.
السيناريو 3 . المكتبة هي مكتبة عادية خالية من الملصقات (تجريبية أو متوقعة) ، ويتم تحقيق تعدد الإرسال من خلال وضع العلامات الكيميائية مع ملصق غير MTRQ. السبب في أن هذا السيناريو يعامل بشكل مختلف عن السيناريو 2 هو أن DIA-NN في تنبؤ السيليكو لم يتم تدريبه على وجه التحديد على الملصقات غير MTRAQ ، وبالتالي فإن خطوة إضافية لتوليد التنبؤات ليست ضرورية. ما عليك سوى تشغيل dia-nn كما ستفعل في السيناريو 1 ، باستثناء إعلان-الإثبات سيكون له كتلة غير صفرية في هذه الحالة ولن يكون علامة. على سبيل المثال ، بالنسبة إلى ثنائي ميثيل 5 قنوات كما وصفه Thielert et al:
‐‐fixed‐mod Dimethyl, 28.0313, nK
--lib-fixed-mod Dimethyl
‐‐channels Dimethyl,0,nK,0:0; Dimethyl,2,nK,2.0126:2.0126; Dimethyl,4,nK,4.0251:4.0251; Dimethyl,6,nK,6.0377:6.0377; Dimethyl,8,nK,8.0444:8.0444
--original-mods
السيناريو 4 . المكتبة هي مكتبة DIA التجريبية التي تم إنشاؤها بواسطة DIA-NN من مجموعة بيانات DIA المتعددة. على سبيل المثال ، يمكن أن تكون هذه مكتبة تم إنشاؤها بواسطة DIA-NN في الممر الأول من MBR (وترغب في إعادة استخدامها لتحليل نفس أو بعض أشواط أخرى). ستكون الخيارات الإضافية هي نفسها كما في السيناريو 1 أو السيناريو 2: الخطوة 2 أو السيناريو 3 ، باستثناء (المهم!)-يجب عدم توفير (المهم)--lib-fixed.
في جميع السيناريوهات أعلاه ، يجب تضمين خيار إضافي يحدد استراتيجية التطبيع في خيارات إضافية . يمكن أن يكون هذا إما-نطاقات القنوات (SILAC النبضية ، دوران البروتين) أو-قناة-مواصفات (تعدد العينات من العينات المستقلة).
الإخراج . نوصي باستخدام التقرير الرئيسي بتنسيق .Parquet لجميع تحليلات المصب. لاحظ أن pg.q.value و gg.q.value في التقرير الرئيسي هما خاصان بالقناة ، عند استخدام تعدد الإرسال. الكميات pg.maxlfq و genes.maxlfq و genes.maxlfq.unique هي فقط خاصة بالقناة إذا تم استخدام (i) الكم و (ii) إما أن التقرير يتوافق مع الممر الثاني من MBR أو MBR. بدلاً من ذلك ، يمكن للمرء استخدام المصفوفات (غير الموصى بها) ، فهذه هي على مستوى السلائف فقط. عند استخدام المصفوفات ، من الضروري تحديد-Matrix-Ch-QValue ، مع عتبات معقولة من 0.01 إلى 0.5. لن يؤثر هذا الإعداد على مصفوفة MS1 المستخرجة ، والتي ببساطة تقارير إشارات MS1 المقابلة لكل قناة ، كلما تم تحديد مقدمة في أي من القنوات - باستخدام هذه المصفوفة عادة لا ينصح بها. لا يتم إنتاج مصفوفات البروتين عند تحليل البيانات المتعددة.
جزء الإدخال
جزء الجيل السلائف أيون
جزء الإخراج
جزء الخوارزمية
لاحظ أن بعض الخيارات أدناه تضر بشدة بالأداء وهي موجودة فقط لأغراض القياس. لذلك تتمثل التوصية في استخدام الخيارات التي من المتوقع أن تكون مفيدة لتجربة معينة (على سبيل المثال تلك الموصى بها في الوثائق الحالية) بناءً على بعض الأساس المنطقي الواضح.