يقع هذا المستودع ضمن مبادرة NIH STRIDES. تهدف STRIDES إلى تسخير قوة السحابة لتسريع الاكتشافات الطبية الحيوية. لمعرفة المزيد، قم بزيارة https://cloud.nih.gov.
هدف NIH Cloud Lab هو جعل السحابة سهلة الاستخدام ويمكن الوصول إليها، بحيث يمكنك قضاء وقت أقل في المهام الإدارية والتركيز بشكل أكبر على البحث.
استخدم هذا المستودع للتعرف على كيفية استخدام Azure من خلال استكشاف الموارد المرتبطة ومتابعة البرامج التعليمية. إذا كنت مبتدئًا، نقترح عليك البدء بقسم Jumpstart على موقع Cloud Lab قبل العودة إلى هنا.
التعلم الآلي هو مجال فرعي من الذكاء الاصطناعي يركز على تطوير الخوارزميات والنماذج التي تمكن أجهزة الكمبيوتر من التعلم من البيانات واتخاذ التنبؤات أو القرارات بناءً عليها، دون برمجتها بشكل صريح. يتم تطبيق الذكاء الاصطناعي وخوارزميات التعلم الآلي على مجموعة متنوعة من الأسئلة البحثية الطبية الحيوية، بدءًا من تصنيف الصور إلى استدعاء المتغيرات الجينومية. تقدم Azure خدمات الذكاء الاصطناعي من خلال Azure AI Studio وAzure Machine Learning.
اطلع على مجموعة البرامج التعليمية الخاصة بنا لمعرفة المزيد حول Gen AI على Azure التي تسلط الضوء على منتجات Azure مثل Azure AI Studio وAzure OpenAI وAzure AI Search والأدوات الخارجية مثل Langchain. ترشدك دفاتر الملاحظات هذه إلى كيفية نشر النماذج وتدريبها والاستعلام عنها، بالإضافة إلى كيفية تنفيذ تقنيات مثل إنشاء الاسترجاع المعزز (RAG). إذا كنت مهتمًا بتكوين نموذج للعمل مع البيانات المنظمة مثل ملفات csv أو json، فقد أنشأنا برامج تعليمية ترشدك عبر كيفية فهرسة ملف csv الخاص بك باستخدام Azure UI والاستعلام عن قاعدة البيانات الخاصة بك باستخدام دفتر ملاحظات داخل Azure ML. لدينا أيضًا برنامج تعليمي آخر يقوم بتشغيل جميع الخطوات الضرورية مباشرة من دفتر الملاحظات.
Azure Health Data Services عبارة عن مجموعة من الخدمات التي تمكنك من تخزين البيانات الطبية ومعالجتها وتحليلها في Azure. تم تصميم هذه الخدمات لمساعدة المؤسسات على الاتصال بسرعة بمصادر وتنسيقات البيانات الصحية المختلفة، مثل البيانات المنظمة وبيانات التصوير والبيانات الخاصة بالجهاز، وتطبيعها لتظل ثابتة في السحابة. في جوهرها، تتمتع Azure Health Data Services بالقدرة على تحويل البيانات واستيعابها إلى تنسيق FHIR (موارد التشغيل البيني السريع للرعاية الصحية). يتيح لك ذلك تحويل البيانات الصحية من التنسيقات القديمة، مثل HL7v2 أو CDA، أو من بيانات إنترنت الأشياء عالية التردد في التنسيقات الخاصة بالجهاز إلى FHIR. وهذا يجعل من السهل ربط البيانات المخزنة في Azure Health Data Services بالخدمات عبر نظام Azure البيئي، مثل Azure Synapse Analytics وAzure Machine Learning (Azure ML).
تتضمن Azure Health Data Services دعمًا لمعايير البيانات الصحية المتعددة لتبادل البيانات المنظمة، والقدرة على نشر مثيلات متعددة لأنواع مختلفة من الخدمات (FHIR، وDICOM، وMedTech) التي تعمل بسلاسة مع بعضها البعض. تشترك الخدمات المنشورة داخل مساحة العمل أيضًا في حدود التوافق وإعدادات التكوين العامة. يتوسع المنتج تلقائيًا لتلبية المتطلبات المتنوعة لأعباء العمل لديك، بحيث تقضي وقتًا أقل في إدارة البنية الأساسية ووقتًا أطول في إنشاء رؤى من البيانات الصحية.
يتيح نسخ بيانات الرعاية الصحية المخزنة في Azure FHIR Server إلى Synapse Analytics للباحثين الاستفادة من أداة تحليل وتخزين البيانات على مستوى السحابة لاستخراج الرؤى من بياناتهم بالإضافة إلى إنشاء خطوط أنابيب بحثية قابلة للتطوير. للحصول على معلومات حول كيفية إجراء هذا التصدير والتحليلات النهائية، يرجى زيارة هذا المستودع.
يمكنك أيضًا الاطلاع على أمثلة عملية لاستخدام FHIR على Azure، ولكن لاحظ أنك ستحتاج إلى توفير ملفات VCF الخاصة بك حيث أنها غير متوفرة مع محتوى البرنامج التعليمي.
يتطلب تحليل التصوير الطبي تحليل ملفات الصور الكبيرة وغالبًا ما يتطلب تخزينًا مرنًا وحوسبة سريعة. توفر Microsoft Azure إمكانات تحليل التصوير الطبي المستندة إلى السحابة من خلال واجهات برمجة تطبيقات Azure Healthcare وحلول Azure Medical Imaging. تسمح خدمة DICOM من Azure بالتخزين الآمن للصور الطبية وإدارتها ومعالجتها في السحابة، باستخدام تنسيق DICOM (التصوير الرقمي والاتصالات في الطب) القياسي في الصناعة. توفر خدمة DICOM ميزات مثل التوفر العالي والتعافي من الكوارث وخيارات التخزين القابلة للتطوير، مما يجعلها حلاً مثاليًا لخطوط الأنابيب التي تحتاج إلى تخزين وإدارة وتحليل كميات كبيرة من بيانات التصوير الطبي. بالإضافة إلى ذلك، يتكامل الخادم مع خدمات Azure الأخرى مثل Azure ML، مما يسهل استخدام خوارزميات التعلم الآلي المتقدمة لمهام تحليل الصور مثل اكتشاف الكائنات وتقسيمها وتصنيفها. اقرأ عن كيفية نشر الخدمة هنا.
لدى Microsoft العديد من دفاتر الملاحظات الخاصة بالتصوير الطبي والتي تعرض حالات استخدام مختلفة للتصوير الطبي على Azure Machine Learning. توضح دفاتر الملاحظات هذه تقنيات علم البيانات المختلفة مثل تطوير النماذج اليدوية باستخدام PyTorch، والتعلم الآلي الآلي، والأمثلة المستندة إلى MLOPS لأتمتة دورة حياة التعلم الآلي في حالات الاستخدام الطبي، بما في ذلك إعادة التدريب. هذه الدفاتر متوفرة هنا. تأكد من تحديد نواة تتضمن Pytorch وإلا فإن تثبيت التبعيات قد يكون أمرًا صعبًا. لاحظ أيضًا أنك تحتاج إلى استخدام GPU VM لمعظم خلايا الكمبيوتر الدفتري، ولكن يمكنك إنشاء العديد من بيئات الحوسبة والتبديل بينها حسب الحاجة. تأكد من إغلاقها عند الانتهاء.
بالنسبة لمستخدمي Cloud Lab المهتمين بالمعلوماتية السريرية متعددة الوسائط، يوفر DICOMcast القدرة على مزامنة البيانات من خدمة DICOM إلى خدمة FHIR، مما يسمح للمستخدمين بدمج البيانات السريرية وبيانات التصوير. يعمل DICOMcast على توسيع حالات استخدام البيانات الصحية من خلال دعم العرض المبسط لبيانات المرضى الطولية والقدرة على إنشاء مجموعات بشكل فعال للدراسات الطبية والتحليلات والتعلم الآلي. لمزيد من المعلومات حول كيفية استخدام DICOMcast، يرجى زيارة وثائق Microsoft أو مستودع GitHub مفتوح المصدر.
بالنسبة للمستخدمين الذين يأملون في تدريب نماذج التعلم العميق على بيانات التصوير، فإن InnerEye-DeepLearning (IE-DL) عبارة عن مجموعة أدوات طورتها Microsoft لتدريب نماذج التعلم العميق بسهولة على الصور الطبية ثلاثية الأبعاد. من السهل تشغيله محليًا وفي السحابة باستخدام Azure Machine Learning، فهو يسمح للمستخدمين بتدريب وتشغيل الاستدلال على ما يلي: • نماذج التجزئة • نماذج التصنيف والانحدار • أي نموذج PyTorch Lightning، عبر إعداد إحضار النموذج الخاص بك هذا المشروع موجود في مستودع GitHub منفصل.
لدى Microsoft العديد من العروض المتعلقة بالجينوم والتي ستكون مفيدة للعديد من مستخدمي Cloud Lab. للحصول على نظرة عامة واسعة، قم بزيارة موقع مجتمع Microsoft Genomics. يمكنك أيضًا الحصول على نظرة عامة على خيارات التنفيذ المختلفة من هذه المدونة، وتحليل تفصيلي لـ Nextflow مع AWS Batch على هذه المدونة. نسلط الضوء هنا على بعض الخدمات الرئيسية:
دراسات الارتباط على مستوى الجينوم (GWAS) هي تحقيقات واسعة النطاق تحلل جينومات العديد من الأفراد لتحديد المتغيرات الجينية الشائعة المرتبطة بالسمات أو الأمراض أو الأنماط الظاهرية الأخرى.
NCBI BLAST (أداة البحث عن المحاذاة المحلية الأساسية) هو برنامج معلوماتية حيوية يستخدم على نطاق واسع ويقدمه المركز الوطني لمعلومات التكنولوجيا الحيوية (NCBI) الذي يقارن تسلسلات النيوكليوتيدات أو البروتين مع قاعدة بيانات كبيرة لتحديد تسلسلات مماثلة واستنتاج العلاقات التطورية والشروح الوظيفية والهيكلية. معلومة.
يعد تحليل RNA-seq طريقة تسلسل عالية الإنتاجية تسمح بقياس وتوصيف مستويات التعبير الجيني وديناميكيات النسخ. عادةً ما يتم تشغيل عمليات سير العمل باستخدام مديري سير العمل، وغالبًا ما يمكن تصور النتائج النهائية في دفاتر الملاحظات.
تسلسل الحمض النووي الريبي أحادي الخلية (scRNA-seq) هو تقنية تتيح تحليل التعبير الجيني على مستوى الخلية الفردية، مما يوفر نظرة ثاقبة حول عدم التجانس الخلوي، وتحديد أنواع الخلايا النادرة، والكشف عن الديناميكيات الخلوية والحالات الوظيفية داخل الأنظمة البيولوجية المعقدة.
يتضمن تحليل تسلسل الحمض النووي للقراءة الطويلة تحليل قراءات التسلسل التي يزيد طولها عادة عن 10 آلاف زوج أساسي، مقارنة بتسلسل القراءة القصيرة حيث يبلغ طول القراءات حوالي 150 زوجًا أساسيًا. لدى Oxford Nanopore عرضًا كاملاً جدًا من البرامج التعليمية للكمبيوتر الدفتري للتعامل مع البيانات المقروءة لفترة طويلة للقيام بمجموعة متنوعة من الأشياء بما في ذلك الاتصال المتغير وتحليل RNAseq وSars-Cov-2 وغير ذلك الكثير. قم بالوصول إلى دفاتر الملاحظات هنا وعلى GitHub. تتوقع هذه الدفاتر أنك تعمل محليًا وتصل إلى خادم epi2me الدفتري. لتشغيلها في Cloud Lab، تخطى الخلية الأولى التي تتصل بالخادم ومن ثم يجب أن يعمل باقي دفتر الملاحظات بشكل صحيح، مع بعض التعديلات. يقدم Oxford Nanopore أيضًا مجموعة من مسارات عمل Nextflow التي ستسمح لك بتشغيل مجموعة متنوعة من مسارات القراءة الطويلة.
يمكن لمجموعات البيانات المتاحة للعامة أن توفر لك الوقت الذي تقضيه في اكتشاف البيانات وإعدادها من خلال تنظيمها وجاهزيتها للاستخدام في سير عملك.