พื้นที่เก็บข้อมูลนี้อยู่ภายใต้โครงการริเริ่ม NIH STRIDES STRIDES มุ่งหวังที่จะควบคุมพลังของคลาวด์เพื่อเร่งการค้นพบทางชีวการแพทย์ หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่ https://cloud.nih.gov
เป้าหมายของ NIH Cloud Lab คือการทำให้ Cloud ง่ายและเข้าถึงได้สำหรับคุณ เพื่อให้คุณสามารถใช้เวลาในงานธุรการน้อยลงและมุ่งเน้นไปที่การวิจัยมากขึ้น
ใช้พื้นที่เก็บข้อมูลนี้เพื่อเรียนรู้เกี่ยวกับวิธีใช้ Azure โดยการสำรวจแหล่งข้อมูลที่เชื่อมโยงและศึกษาบทช่วยสอน หากคุณเป็นมือใหม่ เราขอแนะนำให้คุณเริ่มต้นด้วยส่วน Jumpstart บนเว็บไซต์ Cloud Lab ก่อนที่จะกลับมาที่นี่
การเรียนรู้ของเครื่องเป็นสาขาย่อยของปัญญาประดิษฐ์ที่มุ่งเน้นการพัฒนาอัลกอริธึมและแบบจำลองที่ช่วยให้คอมพิวเตอร์เรียนรู้และคาดการณ์หรือตัดสินใจตามข้อมูลโดยไม่ต้องตั้งโปรแกรมไว้อย่างชัดเจน อัลกอริธึมปัญญาประดิษฐ์และการเรียนรู้ของเครื่องถูกนำไปใช้กับคำถามการวิจัยทางชีวการแพทย์ที่หลากหลาย ตั้งแต่การจำแนกภาพไปจนถึงการเรียกตัวแปรจีโนม Azure นำเสนอบริการ AI ผ่าน Azure AI Studio และ Azure Machine Learning
ดูชุดบทช่วยสอนของเราเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับ Gen AI บน Azure ที่เน้นผลิตภัณฑ์ Azure เช่น Azure AI Studio, Azure OpenAI และ Azure AI Search และเครื่องมือภายนอก เช่น Langchain สมุดบันทึกเหล่านี้จะอธิบายวิธีการปรับใช้ ฝึกอบรม และสืบค้นแบบจำลอง ตลอดจนวิธีใช้เทคนิคต่างๆ เช่น การดึงข้อมูล-Augmented Generation (RAG) หากคุณสนใจในการกำหนดค่าโมเดลเพื่อทำงานกับข้อมูลที่มีโครงสร้าง เช่น ไฟล์ csv หรือ json เราได้สร้างบทช่วยสอนที่จะแนะนำวิธีสร้างดัชนี csv ของคุณโดยใช้ Azure UI และสืบค้นฐานข้อมูลของคุณโดยใช้สมุดบันทึกภายใน Azure ML เรายังมีบทช่วยสอนอื่นที่ดำเนินขั้นตอนที่จำเป็นทั้งหมดได้โดยตรงจากโน้ตบุ๊ก
Azure Health Data Services คือชุดบริการที่ช่วยให้คุณสามารถจัดเก็บ ประมวลผล และวิเคราะห์ข้อมูลทางการแพทย์ใน Azure บริการเหล่านี้ได้รับการออกแบบมาเพื่อช่วยให้องค์กรสามารถเชื่อมต่อแหล่งข้อมูลและรูปแบบด้านสุขภาพที่แตกต่างกันได้อย่างรวดเร็ว เช่น ข้อมูลที่มีโครงสร้าง รูปภาพ และอุปกรณ์ และปรับให้เป็นมาตรฐานเพื่อให้คงอยู่ในระบบคลาวด์ โดยแก่นแท้แล้ว Azure Health Data Services มีความสามารถในการแปลงและนำเข้าข้อมูลเป็นรูปแบบ FHIR (Fast Healthcare Interoperability Resources) ซึ่งช่วยให้คุณสามารถแปลงข้อมูลสุขภาพจากรูปแบบเดิม เช่น HL7v2 หรือ CDA หรือจากข้อมูล IoT ความถี่สูงในรูปแบบที่เป็นกรรมสิทธิ์ของอุปกรณ์เป็น FHIR ช่วยให้เชื่อมต่อข้อมูลที่จัดเก็บไว้ใน Azure Health Data Services กับบริการต่างๆ ทั่วทั้งระบบนิเวศ Azure ได้ง่ายขึ้น เช่น Azure Synapse Analytics และ Azure Machine Learning (Azure ML)
Azure Health Data Services รวมถึงการสนับสนุนมาตรฐานข้อมูลด้านสุขภาพหลายมาตรฐานสำหรับการแลกเปลี่ยนข้อมูลที่มีโครงสร้าง และความสามารถในการปรับใช้อินสแตนซ์หลายอินสแตนซ์ของบริการประเภทต่างๆ (FHIR, DICOM และ MedTech) ที่ทำงานร่วมกันได้อย่างราบรื่น บริการที่ใช้งานภายในพื้นที่ทำงานยังมีขอบเขตการปฏิบัติตามข้อกำหนดและการตั้งค่าการกำหนดค่าทั่วไปร่วมกัน ผลิตภัณฑ์จะปรับขนาดโดยอัตโนมัติเพื่อตอบสนองความต้องการที่แตกต่างกันของปริมาณงานของคุณ คุณจึงใช้เวลาในการจัดการโครงสร้างพื้นฐานน้อยลง และมีเวลามากขึ้นในการสร้างข้อมูลเชิงลึกจากข้อมูลด้านสุขภาพ
การคัดลอกข้อมูลด้านการดูแลสุขภาพที่จัดเก็บไว้ใน Azure FHIR Server ไปยัง Synapse Analytics ช่วยให้นักวิจัยสามารถใช้ประโยชน์จากคลังข้อมูลและเครื่องมือวิเคราะห์ระดับคลาวด์เพื่อดึงข้อมูลเชิงลึกจากข้อมูลของพวกเขา ตลอดจนสร้างไปป์ไลน์การวิจัยที่ปรับขนาดได้ สำหรับข้อมูลเกี่ยวกับวิธีการส่งออกและการวิเคราะห์ดาวน์สตรีม โปรดไปที่พื้นที่เก็บข้อมูลนี้
คุณยังสามารถดูตัวอย่างการใช้งาน FHIR บน Azure ได้โดยตรง แต่โปรดทราบว่าคุณจะต้องจัดหาไฟล์ VCF ของคุณเอง เนื่องจากไฟล์เหล่านี้ไม่ได้มาพร้อมกับเนื้อหาบทช่วยสอน
การวิเคราะห์ภาพทางการแพทย์จำเป็นต้องมีการวิเคราะห์ไฟล์ภาพขนาดใหญ่ และมักต้องใช้พื้นที่จัดเก็บที่ยืดหยุ่นและการประมวลผลที่รวดเร็ว Microsoft Azure นำเสนอความสามารถในการวิเคราะห์ภาพทางการแพทย์บนคลาวด์ผ่านทาง Azure Healthcare API และโซลูชัน Azure Medical Imaging บริการ DICOM ของ Azure ช่วยให้สามารถจัดเก็บ การจัดการ และการประมวลผลภาพทางการแพทย์ในระบบคลาวด์ได้อย่างปลอดภัย โดยใช้รูปแบบ DICOM (ภาพดิจิทัลและการสื่อสารในทางการแพทย์) มาตรฐานอุตสาหกรรม บริการ DICOM นำเสนอคุณสมบัติต่างๆ เช่น ความพร้อมใช้งานสูง การกู้คืนความเสียหาย และพื้นที่เก็บข้อมูลที่ปรับขนาดได้ ทำให้เป็นโซลูชันที่สมบูรณ์แบบสำหรับไปป์ไลน์ที่ต้องจัดเก็บ จัดการ และวิเคราะห์ข้อมูลภาพทางการแพทย์จำนวนมาก นอกจากนี้ เซิร์ฟเวอร์ยังทำงานร่วมกับบริการ Azure อื่นๆ เช่น Azure ML ซึ่งอำนวยความสะดวกในการใช้อัลกอริธึมการเรียนรู้ของเครื่องขั้นสูงสำหรับงานวิเคราะห์ภาพ เช่น การตรวจจับวัตถุ การแบ่งส่วน และการจัดหมวดหมู่ อ่านเกี่ยวกับวิธีการปรับใช้บริการได้ที่นี่
Microsoft มีสมุดบันทึกเกี่ยวกับภาพทางการแพทย์หลายเครื่องที่แสดงกรณีการใช้งานเกี่ยวกับภาพทางการแพทย์ที่แตกต่างกันบน Azure Machine Learning สมุดบันทึกเหล่านี้สาธิตเทคนิควิทยาศาสตร์ข้อมูลต่างๆ เช่น การพัฒนาโมเดลด้วยตนเองด้วย PyTorch การเรียนรู้ของเครื่องแบบอัตโนมัติ และตัวอย่างที่ใช้ MLOPS สำหรับการทำให้วงจรการเรียนรู้ของเครื่องเป็นแบบอัตโนมัติในกรณีการใช้งานทางการแพทย์ รวมถึงการฝึกอบรมใหม่ สมุดบันทึกเหล่านี้มีจำหน่ายที่นี่ ตรวจสอบให้แน่ใจว่าคุณเลือกเคอร์เนลที่มี Pytorch มิฉะนั้นการติดตั้งการพึ่งพาอาจเป็นเรื่องที่ท้าทาย โปรดทราบว่าคุณต้องใช้ GPU VM สำหรับเซลล์โน้ตบุ๊กส่วนใหญ่ แต่คุณสามารถสร้างสภาพแวดล้อมการประมวลผลได้หลายแบบและสลับระหว่างสภาพแวดล้อมเหล่านั้นได้ตามต้องการ อย่าลืมปิดมันเมื่อคุณทำเสร็จแล้ว
สำหรับผู้ใช้ Cloud Lab ที่สนใจข้อมูลทางคลินิกหลายรูปแบบ DICOMcast ให้ความสามารถในการซิงโครไนซ์ข้อมูลจากบริการ DICOM ไปยังบริการ FHIR ทำให้ผู้ใช้สามารถผสานรวมข้อมูลทางคลินิกและภาพได้ DICOMcast ขยายกรณีการใช้งานสำหรับข้อมูลด้านสุขภาพโดยสนับสนุนทั้งมุมมองข้อมูลผู้ป่วยระยะยาวที่มีประสิทธิภาพ และความสามารถในการสร้างกลุ่มร่วมรุ่นสำหรับการศึกษาทางการแพทย์ การวิเคราะห์ และการเรียนรู้ของเครื่องอย่างมีประสิทธิภาพ สำหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีใช้ DICOMcast โปรดไปที่เอกสารประกอบของ Microsoft หรือพื้นที่เก็บข้อมูล GitHub แบบโอเพ่นซอร์ส
สำหรับผู้ใช้ที่หวังจะฝึกโมเดลการเรียนรู้เชิงลึกเกี่ยวกับข้อมูลภาพ InnerEye-DeepLearning (IE-DL) คือกล่องเครื่องมือที่ Microsoft พัฒนาขึ้นเพื่อฝึกฝนโมเดลการเรียนรู้เชิงลึกเกี่ยวกับภาพทางการแพทย์ 3 มิติได้อย่างง่ายดาย ใช้งานง่ายทั้งในพื้นที่และบนคลาวด์ด้วย Azure Machine Learning ช่วยให้ผู้ใช้สามารถฝึกอบรมและดำเนินการอนุมานในเรื่องต่อไปนี้: • โมเดลการแบ่งส่วน • โมเดลการจำแนกประเภทและการถดถอย • โมเดล PyTorch Lightning ใด ๆ ผ่านการตั้งค่าโมเดลที่คุณนำมาเอง โปรเจ็กต์นี้มีอยู่ในที่เก็บ GitHub แยกต่างหาก
Microsoft มีข้อเสนอที่เกี่ยวข้องกับจีโนมิกส์หลายประการซึ่งจะเป็นประโยชน์กับผู้ใช้ Cloud Lab จำนวนมาก สำหรับภาพรวมโดยกว้าง โปรดไปที่ไซต์ Microsoft Genomics Community คุณยังดูภาพรวมของตัวเลือกการดำเนินการต่างๆ ได้จากบล็อกนี้ และการวิเคราะห์โดยละเอียดสำหรับ Nextflow ด้วย AWS Batch ได้ที่บล็อกนี้ เราเน้นบริการสำคัญบางประการที่นี่:
การศึกษาความสัมพันธ์ทั่วทั้งจีโนม (GWAS) เป็นการตรวจสอบในวงกว้างที่วิเคราะห์จีโนมของบุคคลจำนวนมาก เพื่อระบุความแปรปรวนทางพันธุกรรมทั่วไปที่เกี่ยวข้องกับลักษณะ โรค หรือฟีโนไทป์อื่นๆ
NCBI BLAST (เครื่องมือค้นหาการจัดแนวท้องถิ่นขั้นพื้นฐาน) เป็นโปรแกรมชีวสารสนเทศที่ใช้กันอย่างแพร่หลายโดยศูนย์ข้อมูลเทคโนโลยีชีวภาพแห่งชาติ (NCBI) ซึ่งเปรียบเทียบลำดับนิวคลีโอไทด์หรือโปรตีนกับฐานข้อมูลขนาดใหญ่เพื่อระบุลำดับที่คล้ายกันและอนุมานความสัมพันธ์เชิงวิวัฒนาการ คำอธิบายประกอบเชิงฟังก์ชัน และโครงสร้าง ข้อมูล.
การวิเคราะห์ RNA-seq เป็นวิธีการจัดลำดับปริมาณงานสูงที่ช่วยให้สามารถวัดและจำแนกลักษณะของระดับการแสดงออกของยีนและไดนามิกของการถอดเสียง โดยทั่วไปเวิร์กโฟลว์จะทำงานโดยใช้ตัวจัดการเวิร์กโฟลว์ และผลลัพธ์สุดท้ายมักจะแสดงเป็นภาพในสมุดบันทึก
การจัดลำดับ RNA เซลล์เดี่ยว (scRNA-seq) เป็นเทคนิคที่ช่วยให้สามารถวิเคราะห์การแสดงออกของยีนในระดับเซลล์แต่ละเซลล์ โดยให้ข้อมูลเชิงลึกเกี่ยวกับความหลากหลายของเซลล์ การระบุประเภทเซลล์ที่หายาก และเผยให้เห็นพลวัตของเซลล์และสถานะการทำงานของภายในระบบทางชีววิทยาที่ซับซ้อน
การวิเคราะห์ลำดับดีเอ็นเอที่อ่านแบบยาวเกี่ยวข้องกับการวิเคราะห์การอ่านลำดับซึ่งโดยทั่วไปจะมีความยาวมากกว่า 10,000 คู่เบส (bp) เมื่อเทียบกับลำดับการอ่านแบบสั้นที่การอ่านจะมีความยาวประมาณ 150 bp Oxford Nanopore มีบทเรียนสอนการใช้งานโน้ตบุ๊กที่ค่อนข้างครบถ้วนสำหรับการจัดการข้อมูลที่อ่านมานานเพื่อทำสิ่งต่างๆ รวมถึงการเรียกตัวแปร, RNAseq, การวิเคราะห์ Sars-Cov-2 และอื่นๆ อีกมากมาย เข้าถึงสมุดบันทึกได้ที่นี่และบน GitHub สมุดบันทึกเหล่านี้คาดหวังให้คุณใช้งานภายในเครื่องและเข้าถึงเซิร์ฟเวอร์สมุดบันทึก epi2me หากต้องการเรียกใช้ใน Cloud Lab ให้ข้ามเซลล์แรกที่เชื่อมต่อกับเซิร์ฟเวอร์ จากนั้นโน้ตบุ๊กที่เหลือจะทำงานได้อย่างถูกต้อง โดยมีการปรับแต่งเล็กน้อย Oxford Nanopore ยังมีโฮสต์ของเวิร์กโฟลว์ Nextflow ที่จะช่วยให้คุณเรียกใช้ไปป์ไลน์การอ่านแบบยาวได้หลากหลาย
ชุดข้อมูลที่เปิดเผยต่อสาธารณะเหล่านี้สามารถช่วยคุณประหยัดเวลาในการค้นหาและจัดเตรียมข้อมูลโดยได้รับการดูแลจัดการและพร้อมใช้งานในเวิร์กโฟลว์ของคุณ