Investigadores de la Universidad Mohamed bin Zayed han desarrollado un innovador modelo de inteligencia artificial llamado BiMediX2 que es capaz de comprender e interpretar imágenes médicas de forma bilingüe en inglés y árabe. El resultado de esta investigación es un hito en el campo del análisis de imágenes médicas, especialmente en el procesamiento de imágenes médicas árabes, y muestra ventajas significativas y su precisión supera con creces las tecnologías existentes. BiMediX2 no solo es capaz de procesar múltiples tipos de imágenes médicas, como rayos X, exploraciones por resonancia magnética e imágenes de microscopía, y proporcionar descripciones detalladas, sino que también puede responder varias preguntas sobre el contenido de la imagen, brindando un fuerte apoyo para el diagnóstico médico y investigación.
Un estudio dirigido por investigadores de la Universidad Mohamed bin Zayed ha lanzado un modelo de inteligencia artificial llamado BiMediX2, un sistema que puede comprender e interpretar información en imágenes médicas y admite análisis bilingües en inglés y árabe, que funciona particularmente bien al procesar contenido árabe.
BiMediX2 es el primer sistema de inteligencia artificial capaz de analizar y describir imágenes médicas en inglés y árabe. El sistema puede procesar una variedad de imágenes médicas, incluidas radiografías, exploraciones por resonancia magnética e imágenes de microscopía, y proporciona descripciones detalladas mientras responde preguntas sobre el contenido de la imagen. Este modelo no sólo mejora la precisión de la traducción en la comprensión de imágenes médicas, sino que también mejora significativamente las capacidades de procesamiento del árabe.
Según el informe técnico, BiMediX2 obtuvo buenos resultados en pruebas comparativas con tecnologías existentes, mejorando el efecto de traducción del contenido en inglés en un 9% y el efecto de traducción del contenido en árabe en un 20%. Detrás de este logro se encuentra la capacitación masiva del equipo en 1,6 millones de datos de imágenes y textos médicos, lo que garantiza una conversión precisa entre los dos idiomas.
El excelente rendimiento de BiMediX2 se debe a la innovación de su arquitectura subyacente. El sistema está basado en la arquitectura Llama3.1 y GPT-4o, y está especialmente optimizado para el ámbito médico. Al combinarse con Vision Encoder y Meta Llama3.1, BiMediX2 permite un análisis de imágenes médicas bilingüe sin interrupciones. En las pruebas, superó al GPT-4o en la identificación de información médica incorrecta.
Aunque el rendimiento de BiMediX2 es alentador, los investigadores enfatizan que el sistema todavía está limitado al uso en investigación y aún no ha entrado en aplicación clínica. Como todos los sistemas de inteligencia artificial, BiMediX2 puede cometer errores o generar información inexacta. Por lo tanto, el equipo de investigación lanzó el modelo en Hugging Face y lanzó un punto de referencia bilingüe llamado BiMed-MBench para probar el rendimiento de sistemas similares.
BiMediX2 es una innovación importante en el campo del análisis de imágenes médicas, especialmente en el procesamiento y traducción de imágenes médicas bilingües. Aunque todavía no se ha aplicado clínicamente, los resultados de la investigación de este sistema brindan perspectivas de aplicación de inteligencia artificial más eficientes y precisas a la industria médica.
La aparición de BiMediX2 marca un importante paso adelante en el campo del análisis de imágenes médicas, y se espera que sus capacidades bilingües y su alta precisión mejoren significativamente el diagnóstico médico y la comunicación médica intercultural. Aunque todavía se encuentra en la etapa de investigación, sus perspectivas de aplicación futura son amplias y vale la pena esperar su mayor desarrollo y mejora en la práctica clínica.