Beijing Zhipu Huazhang Technology Co., Ltd. lanzó su modelo base de nueva generación y servicios de aplicaciones el 29 de agosto de 2024 y lo demostró en detalle en la conferencia KDD2024. Esta actualización cubre múltiples modalidades, como lenguaje, imágenes y videos, y lanza una nueva aplicación para usuarios finales de C, lo que marca que Zhipu ha logrado avances significativos en el campo de la inteligencia artificial y que su solidez técnica y capacidades de innovación se han mejorado aún más. . A continuación se muestra una explicación detallada de esta actualización.
En la conferencia KDD2024, Zhipu lanzó una nueva generación de modelos base, incluido el modelo de lenguaje GLM-4-Plus, el modelo de gráfico Vincent CogView-3-Plus, el modelo de comprensión de imagen/video GLM-4V-Plus y el modelo de generación de video. CogVideoX. Estos modelos han alcanzado niveles de liderazgo internacional en sus respectivos campos. El rendimiento del modelo GLM-4-Plus se ha mejorado ampliamente en términos de comprensión del lenguaje, seguimiento de instrucciones y procesamiento de textos largos, y está a la par con modelos de primer nivel como GPT-4o. El modelo CogView-3-Plus utiliza la arquitectura Transformer para reemplazar la arquitectura UNet tradicional, que optimiza el efecto del modelo, y su rendimiento se acerca al de modelos de primera línea como MJ-V6 y FLUX. El modelo GLM-4V-Plus tiene capacidades de comprensión de imágenes y video de alta calidad, convirtiéndose en el primer modelo API nacional de comprensión de video general. Después del lanzamiento de la versión 2B, el modelo CogVideoX abrió aún más la versión 5B, con un rendimiento mejorado, convirtiéndose en el líder entre los modelos actuales de generación de vídeo de código abierto. Además, Zhipu lanzó el primer servicio de videollamadas de China para usuarios finales C en la "Aplicación Qingyan". Este servicio abarca modos de texto, audio y video y tiene capacidades de razonamiento en tiempo real, lo que brinda a los usuarios una experiencia interactiva fluida. Zhipu también anunció el uso gratuito de la API GLM-4-Flash, que tiene ventajas en velocidad y rendimiento, permitiendo a los usuarios crear modelos y aplicaciones exclusivos de forma rápida y gratuita. Al mismo tiempo, para satisfacer las necesidades de diferentes usuarios, Zhipu proporciona funciones de ajuste del modelo. Zhipu afirmó que seguirá avanzando, haciendo que las máquinas piensen como humanos y ofreciendo tecnologías y servicios más avanzados a los usuarios.
Además, Zhipu lanzó el primer servicio de videollamadas de China para usuarios finales C en la "Aplicación Qingyan". Este servicio abarca modos de texto, audio y video y tiene capacidades de razonamiento en tiempo real, lo que brinda a los usuarios una experiencia interactiva fluida.
Zhipu también anunció el uso gratuito de la API GLM-4-Flash, que tiene ventajas en velocidad y rendimiento, permitiendo a los usuarios crear modelos y aplicaciones exclusivos de forma rápida y gratuita. Al mismo tiempo, para satisfacer las necesidades de diferentes usuarios, Zhipu proporciona funciones de ajuste del modelo.
Zhipu afirmó que seguirá avanzando, haciendo que las máquinas piensen como humanos y ofreciendo tecnologías y servicios más avanzados a los usuarios.
Actualizaciones importantes:
Modelo base de lenguaje GLM-4-Plus: Su rendimiento se ha mejorado integralmente en términos de comprensión del lenguaje, seguimiento de instrucciones y procesamiento de textos largos, manteniendo el nivel líder internacional.
Modelo base de diagrama Vincent CogView-3-Plus: tiene un rendimiento cercano a los mejores modelos actuales como MJ-V6 y FLUX.
Modelo básico de comprensión de imagen/video GLM-4V-Plus: Tiene excelentes capacidades de comprensión de imagen y tiene capacidades de comprensión de video basadas en la percepción del tiempo. El modelo se lanzará en la plataforma abierta (bigmodel.cn) y se convertirá en la primera API de modelo de comprensión general de video en China.
Modelo base de generación de video CogVideoX: después del lanzamiento de la versión 2B y de código abierto, la versión 5B también fue oficialmente de código abierto. Su rendimiento se ha mejorado aún más y es la mejor opción entre los modelos actuales de generación de video de código abierto.
"Qingyan APP" lanzó videollamadas: el primer servicio de videollamadas nacional abierto a usuarios finales C. La función de videollamada de "Qingyan APP" abarca modos de texto, audio y video, y tiene capacidades de razonamiento en tiempo real.
API GLM-4-Flash: el servicio de inferencia es completamente gratuito y proporciona servicios de ajuste.
Enlace de aplicación del servicio de videollamada:
https://zhipu-ai.feishu.cn/share/base/form/shrcnqpIx9q5ILEFeT2cPNhyuSf
Con todo, la actualización tecnológica de Zhipu Huazhang demuestra su gran fortaleza y su capacidad de innovación continua en el campo de la inteligencia artificial, brinda tecnologías y servicios más avanzados a los usuarios e inyecta nueva vitalidad al desarrollo de la industria de la inteligencia artificial.