Исследователи из Университета Мохамеда бен Заида разработали революционную модель искусственного интеллекта под названием BiMediX2, которая способна понимать и интерпретировать медицинские изображения на двух языках: английском и арабском. Этот результат исследования является важной вехой в области анализа медицинских изображений, особенно в обработке арабских медицинских изображений, демонстрируя значительные преимущества, а его точность намного превосходит существующие технологии. BiMediX2 не только способен обрабатывать несколько типов медицинских изображений, таких как рентгеновские снимки, снимки МРТ и микроскопии, и предоставлять подробные описания, но также может отвечать на различные вопросы о содержании изображений, обеспечивая надежную поддержку для медицинской диагностики и исследовать.
Исследование, проведенное исследователями из Университета Мохамеда бен Заида, запустило модель искусственного интеллекта под названием BiMediX2, систему, которая может понимать и интерпретировать информацию в медицинских изображениях и поддерживает двуязычный анализ на английском и арабском языках, который особенно хорошо работает при обработке контента на арабском языке.
BiMediX2 — первая система искусственного интеллекта, способная анализировать и описывать медицинские изображения на английском и арабском языках. Система может обрабатывать различные медицинские изображения, включая рентгеновские снимки, снимки МРТ и микроскопические изображения, а также предоставлять подробные описания, отвечая на вопросы о содержании изображения. Эта модель не только повышает точность перевода при понимании медицинских изображений, но и значительно расширяет возможности обработки арабского языка.
Согласно техническому отчету, BiMediX2 показал хорошие результаты в сравнительных тестах с существующими технологиями, улучшив эффект перевода английского контента на 9% и эффект перевода арабского контента на 20%. За этим достижением стоит масштабное обучение команды на 1,6 миллионах медицинских текстовых и графических данных, что обеспечивает точное преобразование между двумя языками.
Превосходная производительность BiMediX2 обусловлена инновационной архитектурой, лежащей в ее основе. Система основана на архитектуре Llama3.1 и GPT-4o и специально оптимизирована для медицинской сферы. В сочетании с Vision Encoder и Meta Llama3.1 BiMediX2 обеспечивает беспрепятственный двуязычный анализ медицинских изображений. В ходе испытаний он превзошел GPT-4o в выявлении неверной медицинской информации.
Хотя производительность BiMediX2 обнадеживает, исследователи подчеркивают, что система все еще ограничена исследовательским использованием и еще не вступила в клиническое применение. Как и все системы искусственного интеллекта, BiMediX2 может допускать ошибки или генерировать неточную информацию. Поэтому исследовательская группа опубликовала модель Hugging Face и запустила двуязычный тест под названием BiMed-MBench для проверки производительности аналогичных систем.
BiMediX2 — важная инновация в области анализа медицинских изображений, особенно в области обработки двуязычных медицинских изображений и перевода. Хотя она еще не применялась клинически, результаты исследований этой системы открывают более эффективные и точные перспективы применения искусственного интеллекта в медицинской промышленности.
Появление BiMediX2 знаменует собой важный шаг вперед в области анализа медицинских изображений, и ожидается, что его двуязычные возможности и высокая точность значительно улучшат медицинскую диагностику и межкультурное медицинское общение. Хотя он все еще находится на стадии исследования, перспективы его дальнейшего применения широки, и стоит рассчитывать на его дальнейшее развитие и совершенствование в клинической практике.