Alibaba a récemment publié deux versions de son grand modèle multimodal Qwen-VL-Plus et Qwen-VL-Max. Les deux versions ont réalisé des percées significatives dans les tâches texte-image et le raisonnement visuel, surpassant en termes de performances les actuels GPT-4V et Gemini, leaders du secteur. Cette décision marque une nouvelle étape dans la concurrence technologique dans le domaine des grands modèles multimodaux. Alibaba a démontré une forte force technique et des capacités d'innovation dans ce domaine, offrant de nouvelles possibilités pour le développement de futures applications d'IA.
Alibaba a lancé les versions Qwen-VL-Plus et Qwen-VL-Max, qui ont respectivement fait des progrès significatifs dans les tâches texte-image et le raisonnement visuel, dépassant GPT-4V et Gemini. Cela marque une nouvelle série de mises à niveau technologiques dans le domaine des modèles multimodaux.
La sortie de Qwen-VL-Plus et Qwen-VL-Max annonce une application plus large de la technologie d'IA multimodale, offrant davantage d'opportunités d'innovation et d'amélioration de l'efficacité dans tous les domaines. Les investissements continus d’Alibaba et les percées technologiques dans le domaine de l’intelligence artificielle méritent d’être attendus. À l'avenir, nous verrons émerger davantage d'applications innovantes basées sur les modèles de la série Qwen-VL.