Alibaba lanzó recientemente dos versiones de su modelo grande multimodal Qwen-VL-Plus y Qwen-VL-Max. Ambas versiones han logrado avances significativos en tareas de texto-imagen y razonamiento visual, superando en rendimiento a los actuales líderes de la industria GPT-4V y Gemini. Este movimiento marca una nueva etapa en la competencia tecnológica en el campo de los grandes modelos multimodales. Alibaba ha demostrado una gran fortaleza técnica y capacidades de innovación en este campo, brindando nuevas posibilidades para el desarrollo de futuras aplicaciones de IA.
Alibaba lanzó las versiones Qwen-VL-Plus y Qwen-VL-Max, que han logrado avances significativos en tareas de texto-imagen y razonamiento visual respectivamente, superando a GPT-4V y Gemini. Esto marca una nueva ronda de actualizaciones tecnológicas en el campo de los modelos multimodales.
El lanzamiento de Qwen-VL-Plus y Qwen-VL-Max anuncia la aplicación más amplia de la tecnología de IA multimodal, brindando más oportunidades de innovación y mejora de la eficiencia en todos los ámbitos de la vida. Vale la pena esperar con ansias la inversión continua y los avances tecnológicos de Alibaba en el campo de la inteligencia artificial. En el futuro, veremos surgir más aplicaciones innovadoras basadas en los modelos de la serie Qwen-VL.