Para peneliti di Universitas Mohamed bin Zayed telah mengembangkan terobosan model kecerdasan buatan yang disebut BiMediX2 yang mampu memahami dan menafsirkan gambar medis secara bilingual dalam bahasa Inggris dan Arab. Hasil penelitian ini merupakan sebuah tonggak sejarah dalam bidang analisis citra medis, khususnya dalam pengolahan citra medis berbahasa Arab, menunjukkan keunggulan yang signifikan, dan akurasinya jauh melebihi teknologi yang ada. BiMediX2 tidak hanya mampu memproses berbagai jenis gambar medis, seperti sinar-X, pemindaian MRI, dan gambar mikroskop, serta memberikan deskripsi mendetail, namun juga dapat menjawab berbagai pertanyaan tentang konten gambar, memberikan dukungan kuat untuk diagnosis medis dan riset.
Sebuah studi yang dipimpin oleh para peneliti di Universitas Mohamed bin Zayed telah meluncurkan model kecerdasan buatan yang disebut BiMediX2, sebuah sistem yang dapat memahami dan menafsirkan informasi dalam gambar medis dan mendukung Analisis bilingual Bahasa Inggris dan Arab, yang bekerja sangat baik saat memproses konten berbahasa Arab.
BiMediX2 adalah sistem kecerdasan buatan pertama yang mampu menganalisis dan mendeskripsikan gambar medis dalam bahasa Inggris dan Arab. Sistem dapat memproses berbagai gambar medis, termasuk sinar-X, pemindaian MRI, dan gambar mikroskop, serta memberikan deskripsi mendetail sambil menjawab pertanyaan tentang konten gambar. Model ini tidak hanya meningkatkan keakuratan terjemahan dalam memahami gambar medis, tetapi juga secara signifikan meningkatkan kemampuan pemrosesan bahasa Arab.
Menurut laporan teknis, BiMediX2 berkinerja baik dalam uji perbandingan dengan teknologi yang ada, meningkatkan efek terjemahan konten berbahasa Inggris sebesar 9% dan efek terjemahan konten berbahasa Arab sebesar 20%. Di balik pencapaian ini adalah pelatihan besar-besaran yang dilakukan tim terhadap 1,6 juta teks medis dan data gambar, yang memastikan konversi akurat antara kedua bahasa.
Kinerja BiMediX2 yang luar biasa disebabkan oleh inovasi arsitektur yang mendasarinya. Sistem ini didasarkan pada arsitektur Llama3.1 dan GPT-4o, dan dioptimalkan secara khusus untuk bidang medis. Dengan menggabungkan Vision Encoder dan Meta Llama3.1, BiMediX2 memungkinkan analisis gambar medis bilingual tanpa hambatan. Dalam pengujian, kinerjanya mengungguli GPT-4o dalam mengidentifikasi informasi medis yang salah.
Meski kinerja BiMediX2 menggembirakan, para peneliti menekankan bahwa sistem tersebut masih sebatas penggunaan penelitian dan belum memasuki penerapan klinis. Seperti semua sistem kecerdasan buatan, BiMediX2 mungkin membuat kesalahan atau menghasilkan informasi yang tidak akurat. Oleh karena itu, tim peneliti telah merilis model Hugging Face dan meluncurkan benchmark bilingual yang disebut BiMed-MBench untuk menguji kinerja sistem serupa.
BiMediX2 merupakan inovasi penting dalam bidang analisis citra medis, khususnya dalam pengolahan citra medis bilingual dan terjemahannya. Meski belum diterapkan secara klinis, hasil penelitian sistem ini membawa prospek penerapan kecerdasan buatan yang lebih efisien dan akurat pada industri medis.
Kemunculan BiMediX2 menandai langkah maju yang besar dalam bidang analisis citra medis, dan kemampuan bilingual serta akurasinya yang tinggi diharapkan dapat meningkatkan diagnosis medis dan komunikasi medis lintas budaya secara signifikan. Meskipun masih dalam tahap penelitian, prospek penerapannya di masa depan sangat luas, dan pengembangan dan peningkatan lebih lanjut dalam praktik klinis patut dinantikan.