นักวิจัยจากมหาวิทยาลัยโมฮาเหม็ด บิน ซาเยด ได้พัฒนาโมเดลปัญญาประดิษฐ์ที่ก้าวล้ำที่เรียกว่า BiMediX2 ซึ่งสามารถทำความเข้าใจและตีความภาพทางการแพทย์แบบสองภาษาในภาษาอังกฤษและภาษาอาหรับ ผลการวิจัยครั้งนี้ถือเป็นหลักชัยในด้านการวิเคราะห์ภาพทางการแพทย์ โดยเฉพาะอย่างยิ่งในการประมวลผลภาพทางการแพทย์ของชาวอาหรับ ซึ่งแสดงให้เห็นถึงข้อได้เปรียบที่สำคัญ และความแม่นยำของภาพยังเหนือกว่าเทคโนโลยีที่มีอยู่มาก BiMediX2 ไม่เพียงแต่สามารถประมวลผลภาพทางการแพทย์ได้หลายประเภท เช่น ภาพเอ็กซ์เรย์ ภาพสแกน MRI และภาพกล้องจุลทรรศน์ และให้คำอธิบายโดยละเอียด แต่ยังสามารถตอบคำถามต่างๆ เกี่ยวกับเนื้อหาภาพ ซึ่งให้การสนับสนุนอย่างมากสำหรับการวินิจฉัยทางการแพทย์และ วิจัย.
การศึกษาที่นำโดยนักวิจัยจากมหาวิทยาลัย Mohamed bin Zayed ได้เปิดตัวโมเดลปัญญาประดิษฐ์ที่เรียกว่า BiMediX2 ซึ่งเป็นระบบที่สามารถเข้าใจและตีความข้อมูลในภาพทางการแพทย์ และสนับสนุนการวิเคราะห์สองภาษาทั้งภาษาอังกฤษและภาษาอาหรับ ซึ่งทำงานได้ดีเป็นพิเศษเมื่อประมวลผลเนื้อหาภาษาอาหรับ
BiMediX2 เป็นระบบปัญญาประดิษฐ์ระบบแรกที่สามารถวิเคราะห์และอธิบายภาพทางการแพทย์เป็นภาษาอังกฤษและอารบิก ระบบสามารถประมวลผลภาพทางการแพทย์ได้หลากหลาย รวมถึงภาพเอ็กซ์เรย์ ภาพสแกน MRI และภาพกล้องจุลทรรศน์ และให้คำอธิบายโดยละเอียดพร้อมตอบคำถามเกี่ยวกับเนื้อหาของภาพ แบบจำลองนี้ไม่เพียงแต่ปรับปรุงความแม่นยำในการแปลในการทำความเข้าใจภาพทางการแพทย์เท่านั้น แต่ยังเพิ่มความสามารถในการประมวลผลภาษาอาหรับอีกด้วย
ตามรายงานทางเทคนิค BiMediX2 ทำงานได้ดีในการทดสอบเปรียบเทียบกับเทคโนโลยีที่มีอยู่ โดยปรับปรุงผลการแปลเนื้อหาภาษาอังกฤษ 9% และผลการแปลเนื้อหาภาษาอาหรับ 20% เบื้องหลังความสำเร็จนี้คือการฝึกอบรมครั้งใหญ่ของทีมเกี่ยวกับข้อความทางการแพทย์และข้อมูลรูปภาพจำนวน 1.6 ล้านชิ้น ซึ่งรับประกันการแปลงระหว่างสองภาษาอย่างแม่นยำ
ประสิทธิภาพที่ยอดเยี่ยมของ BiMediX2 เกิดจากนวัตกรรมของสถาปัตยกรรมพื้นฐาน ระบบนี้ใช้สถาปัตยกรรม Llama3.1 และ GPT-4o และได้รับการปรับแต่งเป็นพิเศษสำหรับวงการแพทย์ ด้วยการใช้งานร่วมกับ Vision Encoder และ Meta Llama3.1 ทำให้ BiMediX2 ช่วยให้การวิเคราะห์ภาพทางการแพทย์สองภาษาเป็นไปอย่างราบรื่น ในการทดสอบ มีประสิทธิภาพเหนือกว่า GPT-4o ในการระบุข้อมูลทางการแพทย์ที่ไม่ถูกต้อง
แม้ว่าประสิทธิภาพของ BiMediX2 จะเป็นที่น่าพอใจ แต่นักวิจัยเน้นย้ำว่าระบบยังคงจำกัดอยู่เพียงการใช้ในการวิจัย และยังไม่ได้เข้าสู่การใช้งานทางคลินิก เช่นเดียวกับระบบปัญญาประดิษฐ์อื่นๆ BiMediX2 อาจสร้างข้อผิดพลาดหรือสร้างข้อมูลที่ไม่ถูกต้อง ดังนั้นทีมวิจัยจึงได้เปิดตัวโมเดล Hugging Face และเปิดตัวเกณฑ์มาตรฐานสองภาษาที่เรียกว่า BiMed-MBench เพื่อทดสอบประสิทธิภาพของระบบที่คล้ายคลึงกัน
BiMediX2 เป็นนวัตกรรมที่สำคัญในด้านการวิเคราะห์ภาพทางการแพทย์ โดยเฉพาะอย่างยิ่งในการประมวลผลภาพทางการแพทย์สองภาษาและการแปล แม้ว่าจะยังไม่ได้นำไปใช้ทางคลินิก แต่ผลการวิจัยของระบบนี้นำโอกาสในการประยุกต์ปัญญาประดิษฐ์ที่มีประสิทธิภาพและแม่นยำยิ่งขึ้นมาสู่อุตสาหกรรมการแพทย์
การเกิดขึ้นของ BiMediX2 ถือเป็นก้าวสำคัญในด้านการวิเคราะห์ภาพทางการแพทย์ และคาดว่าความสามารถแบบสองภาษาและความแม่นยำสูงจะปรับปรุงการวินิจฉัยทางการแพทย์และการสื่อสารทางการแพทย์ข้ามวัฒนธรรมได้อย่างมีนัยสำคัญ แม้ว่าจะยังอยู่ในขั้นตอนการวิจัย แต่แนวโน้มการใช้งานในอนาคตนั้นกว้างไกล และคุ้มค่าที่จะรอคอยการพัฒนาและปรับปรุงเพิ่มเติมในการปฏิบัติงานทางคลินิก