Des chercheurs de l’Université Mohamed ben Zayed ont développé un modèle d’intelligence artificielle révolutionnaire appelé BiMediX2, capable de comprendre et d’interpréter des images médicales de manière bilingue en anglais et en arabe. Ce résultat de recherche constitue une étape importante dans le domaine de l'analyse d'images médicales, en particulier dans le traitement des images médicales arabes, montrant des avantages significatifs et sa précision dépasse de loin les technologies existantes. BiMediX2 est non seulement capable de traiter plusieurs types d'images médicales, telles que les radiographies, les examens IRM et les images de microscopie, et de fournir des descriptions détaillées, mais il peut également répondre à diverses questions sur le contenu de l'image, fournissant ainsi un soutien solide au diagnostic médical et recherche.
Une étude menée par des chercheurs de l'Université Mohamed ben Zayed a lancé un modèle d'intelligence artificielle appelé BiMediX2, un système capable de comprendre et d'interpréter les informations contenues dans les images médicales et prenant en charge l'analyse bilingue anglais et arabe, qui fonctionne particulièrement bien lors du traitement du contenu arabe.
BiMediX2 est le premier système d'intelligence artificielle capable d'analyser et de décrire des images médicales en anglais et en arabe. Le système peut traiter une variété d'images médicales, notamment des radiographies, des images d'IRM et de microscopie, et fournir des descriptions détaillées tout en répondant aux questions sur le contenu de l'image. Ce modèle améliore non seulement la précision de la traduction dans la compréhension des images médicales, mais améliore également considérablement les capacités de traitement de l'arabe.
Selon le rapport technique, BiMediX2 a obtenu de bons résultats lors des tests comparatifs avec les technologies existantes, améliorant l'effet de traduction du contenu anglais de 9 % et l'effet de traduction du contenu arabe de 20 %. Derrière cette réussite se cache la formation massive de l’équipe sur 1,6 million de données de textes et d’images médicales, garantissant une conversion précise entre les deux langues.
Les excellentes performances de BiMediX2 sont dues à l’innovation de son architecture sous-jacente. Le système est basé sur l'architecture Llama3.1 et GPT-4o, et est spécialement optimisé pour le domaine médical. En combinant avec Vision Encoder et Meta Llama3.1, BiMediX2 permet une analyse transparente et bilingue des images médicales. Lors des tests, il a surpassé le GPT-4o pour identifier les informations médicales incorrectes.
Bien que les performances de BiMediX2 soient encourageantes, les chercheurs soulignent que le système est encore limité à une utilisation en recherche et n'est pas encore entré en application clinique. Comme tous les systèmes d’intelligence artificielle, BiMediX2 peut commettre des erreurs ou générer des informations inexactes. Par conséquent, l’équipe de recherche a publié le modèle sur Hugging Face et a lancé un benchmark bilingue appelé BiMed-MBench pour tester les performances de systèmes similaires.
BiMediX2 est une innovation importante dans le domaine de l’analyse d’images médicales, notamment dans le traitement et la traduction d’images médicales bilingues. Bien qu’il n’ait pas encore été appliqué en clinique, les résultats de recherche de ce système ouvrent des perspectives d’application de l’intelligence artificielle plus efficaces et plus précises à l’industrie médicale.
L'émergence de BiMediX2 marque une avancée majeure dans le domaine de l'analyse d'images médicales, et ses capacités bilingues et sa grande précision devraient améliorer considérablement le diagnostic médical et la communication médicale interculturelle. Bien qu'il soit encore au stade de la recherche, ses perspectives d'application futures sont larges et il vaut la peine d'attendre avec impatience son développement ultérieur et son amélioration dans la pratique clinique.