A Alibaba lançou recentemente duas versões de seus grandes modelos multimodais Qwen-VL-Plus e Qwen-VL-Max. Ambas as versões alcançaram avanços significativos em tarefas de imagem de texto e raciocínio visual, superando o atual GPT-4V e Gemini, líderes da indústria, em desempenho. Esta mudança marca uma nova etapa na competição tecnológica no domínio dos grandes modelos multimodais. A Alibaba demonstrou forte força técnica e capacidades de inovação neste campo, proporcionando novas possibilidades para o desenvolvimento de futuras aplicações de IA.
Alibaba lançou as versões Qwen-VL-Plus e Qwen-VL-Max, que fizeram progressos significativos em tarefas de texto-imagem e raciocínio visual, respectivamente, superando GPT-4V e Gemini. Isto marca uma nova rodada de atualizações tecnológicas no campo dos modelos multimodais.
O lançamento do Qwen-VL-Plus e do Qwen-VL-Max anuncia a aplicação mais ampla da tecnologia de IA multimodal, trazendo mais oportunidades de inovação e melhoria de eficiência para todas as esferas da vida. Vale a pena esperar pelo investimento contínuo e pelos avanços tecnológicos da Alibaba no campo da inteligência artificial. No futuro, veremos o surgimento de aplicações mais inovadoras baseadas nos modelos da série Qwen-VL.