Pesquisadores da Universidade Mohamed bin Zayed desenvolveram um modelo inovador de inteligência artificial chamado BiMediX2, que é capaz de compreender e interpretar imagens médicas bilínguemente em inglês e árabe. O resultado desta pesquisa é um marco no campo da análise de imagens médicas, especialmente no processamento de imagens médicas árabes, apresentando vantagens significativas e sua precisão excede em muito as tecnologias existentes. BiMediX2 não só é capaz de processar vários tipos de imagens médicas, como raios X, ressonância magnética e imagens de microscopia, e fornecer descrições detalhadas, mas também pode responder a várias perguntas sobre o conteúdo da imagem, fornecendo forte suporte para diagnóstico médico e pesquisar.
Um estudo liderado por pesquisadores da Universidade Mohamed bin Zayed lançou um modelo de inteligência artificial chamado BiMediX2, um sistema que pode compreender e interpretar informações em imagens médicas e suporta análise bilíngue em inglês e árabe, que funciona particularmente bem no processamento de conteúdo em árabe.
BiMediX2 é o primeiro sistema de inteligência artificial capaz de analisar e descrever imagens médicas em inglês e árabe. O sistema pode processar uma variedade de imagens médicas, incluindo raios X, ressonância magnética e imagens de microscopia, e fornecer descrições detalhadas enquanto responde a perguntas sobre o conteúdo da imagem. Este modelo não só melhora a precisão da tradução na compreensão de imagens médicas, mas também melhora significativamente as capacidades de processamento do árabe.
De acordo com o relatório técnico, o BiMediX2 teve um bom desempenho em testes comparativos com as tecnologias existentes, melhorando o efeito de tradução do conteúdo em inglês em 9% e o efeito de tradução do conteúdo em árabe em 20%. Por trás dessa conquista está o treinamento massivo da equipe em 1,6 milhão de textos médicos e dados de imagens, garantindo uma conversão precisa entre os dois idiomas.
O excelente desempenho do BiMediX2 se deve à inovação de sua arquitetura subjacente. O sistema é baseado na arquitetura Llama3.1 e GPT-4o, e é especialmente otimizado para a área médica. Ao combinar com Vision Encoder e Meta Llama3.1, o BiMediX2 permite uma análise bilíngue perfeita de imagens médicas. Nos testes, superou o GPT-4o na identificação de informações médicas incorretas.
Embora o desempenho do BiMediX2 seja encorajador, os pesquisadores enfatizam que o sistema ainda está limitado ao uso em pesquisa e ainda não entrou em aplicação clínica. Como todos os sistemas de inteligência artificial, o BiMediX2 pode cometer erros ou gerar informações imprecisas. Portanto, a equipe de pesquisa lançou o modelo no Hugging Face e lançou um benchmark bilíngue chamado BiMed-MBench para testar o desempenho de sistemas semelhantes.
BiMediX2 é uma inovação importante na área de análise de imagens médicas, especialmente no processamento e tradução de imagens médicas bilíngues. Embora ainda não tenha sido aplicado clinicamente, os resultados da pesquisa deste sistema trazem perspectivas de aplicação de inteligência artificial mais eficientes e precisas para a indústria médica.
O surgimento do BiMediX2 marca um grande avanço no campo da análise de imagens médicas, e espera-se que suas capacidades bilíngues e alta precisão melhorem significativamente o diagnóstico médico e a comunicação médica intercultural. Embora ainda esteja em fase de pesquisa, suas perspectivas de aplicação futura são amplas, e vale a pena aguardar seu maior desenvolvimento e aprimoramento na prática clínica.