نجح باحثون في جامعة محمد بن زايد في تطوير نموذج ذكاء اصطناعي متطور يسمى BiMediX2 قادر على فهم وتفسير الصور الطبية باللغتين الإنجليزية والعربية. وتعتبر نتيجة البحث هذه علامة فارقة في مجال تحليل الصور الطبية، وخاصة في معالجة الصور الطبية العربية، حيث تظهر مزايا كبيرة، ودقتها تفوق التقنيات الموجودة بكثير. BiMediX2 ليس فقط قادرًا على معالجة أنواع متعددة من الصور الطبية، مثل الأشعة السينية وفحوصات التصوير بالرنين المغناطيسي والصور المجهرية، وتقديم أوصاف تفصيلية، ولكنه يمكنه أيضًا الإجابة على أسئلة مختلفة حول محتوى الصورة، مما يوفر دعمًا قويًا للتشخيص الطبي و بحث.
أطلقت دراسة أجراها باحثون في جامعة محمد بن زايد نموذجاً للذكاء الاصطناعي يسمى BiMediX2، وهو نظام يمكنه فهم وتفسير المعلومات في الصور الطبية ويدعم التحليل ثنائي اللغة باللغتين الإنجليزية والعربية، والذي يؤدي أداءً جيداً بشكل خاص عند معالجة المحتوى العربي.
BiMediX2 هو أول نظام ذكاء اصطناعي قادر على تحليل ووصف الصور الطبية باللغتين الإنجليزية والعربية. يمكن للنظام معالجة مجموعة متنوعة من الصور الطبية، بما في ذلك الأشعة السينية وفحوصات التصوير بالرنين المغناطيسي والصور المجهرية، وتقديم أوصاف تفصيلية أثناء الإجابة على الأسئلة حول محتوى الصورة. ولا يعمل هذا النموذج على تحسين دقة الترجمة في فهم الصور الطبية فحسب، بل يعزز أيضًا بشكل كبير قدرات المعالجة باللغة العربية.
وفقًا للتقرير الفني، كان أداء BiMediX2 جيدًا في اختبارات المقارنة مع التقنيات الحالية، مما أدى إلى تحسين تأثير ترجمة المحتوى الإنجليزي بنسبة 9% وتأثير ترجمة المحتوى العربي بنسبة 20%. ويكمن وراء هذا الإنجاز التدريب المكثف الذي أجراه الفريق على 1.6 مليون قطعة من النصوص الطبية وبيانات الصور، مما يضمن التحويل الدقيق بين اللغتين.
يرجع الأداء الممتاز لـ BiMediX2 إلى ابتكار بنيته الأساسية. يعتمد النظام على بنية Llama3.1 وGPT-4o، وهو مُحسّن بشكل خاص للمجال الطبي. من خلال الدمج مع Vision Encoder وMeta Llama3.1، يتيح BiMediX2 تحليلًا سلسًا للصور الطبية ثنائي اللغة. وفي الاختبارات، تفوق على GPT-4o في تحديد المعلومات الطبية غير الصحيحة.
وعلى الرغم من أن أداء BiMediX2 مشجع، إلا أن الباحثين يؤكدون أن النظام لا يزال يقتصر على الاستخدام البحثي ولم يدخل بعد في التطبيق السريري. مثل جميع أنظمة الذكاء الاصطناعي، قد يرتكب BiMediX2 أخطاء أو يولد معلومات غير دقيقة. لذلك، أصدر فريق البحث النموذج على Hugging Face وأطلق معيارًا ثنائي اللغة يسمى BiMed-MBench لاختبار أداء الأنظمة المماثلة.
يعد BiMediX2 ابتكارًا مهمًا في مجال تحليل الصور الطبية، خاصة في معالجة الصور الطبية ثنائية اللغة وترجمتها. على الرغم من أنه لم يتم تطبيقه سريريًا بعد، إلا أن نتائج الأبحاث لهذا النظام توفر آفاقًا أكثر كفاءة ودقة لتطبيق الذكاء الاصطناعي في الصناعة الطبية.
يمثل ظهور BiMediX2 خطوة كبيرة إلى الأمام في مجال تحليل الصور الطبية، ومن المتوقع أن تؤدي قدراته ثنائية اللغة ودقته العالية إلى تحسين التشخيص الطبي والتواصل الطبي بين الثقافات بشكل كبير. على الرغم من أنه لا يزال في مرحلة البحث، إلا أن آفاق تطبيقه المستقبلي واسعة، ويستحق التطلع إلى مزيد من التطوير والتحسين في الممارسة السريرية.