ByteDance ha lanzado un nuevo modelo de puf 1.5Pro, superando a GPT-4o y Claude3.5Sonnet en múltiples pruebas comparativas, lo que marca su significativo progreso en el campo de la inteligencia artificial. Este modelo utiliza una innovadora arquitectura MoE dispersa para lograr un rendimiento equivalente al modelo denso de 7 parámetros con menos parámetros de activación, y la eficiencia aumenta aproximadamente 3 veces. Además de la actualización del modelo central, se lanzaron simultáneamente el modelo de comprensión visual de Doubao y el modelo de voz en tiempo real, mejorando aún más las capacidades de procesamiento multimodal y la experiencia de interacción de voz.
ByteDance lanzó oficialmente su último modelo Doubao 1.5Pro (Doubao-1.5-pro). Este nuevo modelo tiene un buen desempeño en capacidades integrales en múltiples campos, superando con éxito a los conocidos GPT-4o y Claude3.5Sonnet. El lanzamiento de este modelo marca otro importante paso adelante para ByteDance en el campo de la inteligencia artificial.
Doubao 1.5Pro adopta una nueva arquitectura dispersa MoE (Mixed Expert) y utiliza parámetros de activación más pequeños para el entrenamiento previo. La innovación de este diseño es que puede proporcionar un rendimiento de modelo denso equivalente a 7 veces los parámetros de activación, lo que lo hace mucho más eficiente que la arquitectura MoE convencional de la industria, lo que genera una mejora de eficiencia tres veces mayor. Este diseño hace que el modelo Doubao obtenga una puntuación aún mejor en múltiples puntos de referencia de evaluación, como conocimiento, código, razonamiento y chino.
Además de la actualización del modelo principal, ByteDance también lanzó el modelo de comprensión visual Doubao-1.5-vision-pro y el modelo de voz en tiempo real Doubao-1.5-realtime-voice-pro. El nuevo modelo de comprensión visual ha experimentado mejoras técnicas integrales en procesamiento de datos multimodal, resolución dinámica y comprensión de información detallada, mejorando aún más sus capacidades en razonamiento visual y comprensión de texto. Al mismo tiempo, el lanzamiento del modelo de voz en tiempo real permite a la aplicación Doubao lograr una experiencia de conversación de voz más fluida, con baja latencia y la capacidad de interrumpir en cualquier momento durante la conversación.
ByteDance declaró oficialmente que el modelo Doubao no utilizó ningún dato generado por modelos externos durante el proceso de capacitación, lo que garantiza la independencia y confiabilidad del modelo. Además, los precios de todos los productos nuevos permanecerán sin cambios y los usuarios podrán experimentar directamente las nuevas funciones en la aplicación Doubao.
Esta conferencia no solo demostró las capacidades de innovación continua de ByteDance en el campo de la IA, sino que también brindó a los desarrolladores un fuerte soporte de API, promoviendo aún más la popularización y aplicación de la tecnología de inteligencia artificial.
El lanzamiento del modelo grande 1.5Pro de Doubao, así como los modelos visuales y de voz de soporte, demuestran la gran fortaleza y la innovación tecnológica de ByteDance en el campo de la IA. Su alta eficiencia, alto rendimiento y énfasis en la experiencia del usuario indican que las aplicaciones de IA serán más convenientes y poderosas en el futuro.