Beijing Zhipu Huazhang Technology Co., Ltd. lançou seu modelo básico de nova geração e serviços de aplicativo em 29 de agosto de 2024 e os demonstrou em detalhes na conferência KDD2024. Esta atualização cobre múltiplas modalidades, como linguagem, imagens e vídeos, e lança um novo aplicativo para usuários finais C, marcando que Zhipu fez progressos significativos no campo da inteligência artificial e que sua força técnica e capacidades de inovação foram melhoradas ainda mais . Abaixo está uma explicação detalhada desta atualização.
Na conferência KDD2024, Zhipu lançou uma nova geração de modelos básicos, incluindo o modelo de linguagem GLM-4-Plus, o modelo gráfico Vincent CogView-3-Plus, o modelo de compreensão de imagem/vídeo GLM-4V-Plus e o modelo de geração de vídeo CogVideoX. Esses modelos alcançaram níveis de liderança internacional em seus respectivos campos. O desempenho do modelo GLM-4-Plus foi amplamente aprimorado em termos de compreensão do idioma, seguimento de instruções e processamento de textos longos, e está no mesmo nível dos modelos de primeiro nível, como o GPT-4o. O modelo CogView-3-Plus utiliza a arquitetura Transformer em substituição à arquitetura UNet tradicional, o que otimiza o efeito do modelo, e seu desempenho se aproxima dos modelos de primeira linha como MJ-V6 e FLUX. O modelo GLM-4V-Plus possui recursos de compreensão de imagem e vídeo de alta qualidade, tornando-se a primeira API de modelo de compreensão de vídeo geral doméstica. Após o lançamento da versão 2B, o modelo CogVideoX abriu ainda mais a versão 5B, com desempenho aprimorado, tornando-se líder entre os atuais modelos de geração de vídeo de código aberto. Além disso, a Zhipu lançou o primeiro serviço de videochamada da China para usuários finais C no "APP Qingyan". Este serviço abrange modos de texto, áudio e vídeo e possui recursos de raciocínio em tempo real, proporcionando aos usuários uma experiência interativa tranquila. Zhipu também anunciou o uso gratuito da API GLM-4-Flash, que apresenta vantagens em velocidade e desempenho, permitindo aos usuários construir modelos e aplicativos exclusivos de forma rápida e gratuita. Ao mesmo tempo, para atender às necessidades de diferentes usuários, a Zhipu oferece funções de ajuste fino do modelo. Zhipu disse que continuará avançando, fazendo com que as máquinas pensem como humanos e trazendo tecnologias e serviços mais avançados aos usuários.
Além disso, a Zhipu lançou o primeiro serviço de videochamada da China para usuários finais C no "APP Qingyan". Este serviço abrange modos de texto, áudio e vídeo e possui recursos de raciocínio em tempo real, proporcionando aos usuários uma experiência interativa tranquila.
Zhipu também anunciou o uso gratuito da API GLM-4-Flash, que apresenta vantagens em velocidade e desempenho, permitindo aos usuários construir modelos e aplicativos exclusivos de forma rápida e gratuita. Ao mesmo tempo, para atender às necessidades de diferentes usuários, a Zhipu oferece funções de ajuste fino do modelo.
Zhipu disse que continuará avançando, fazendo com que as máquinas pensem como humanos e trazendo tecnologias e serviços mais avançados aos usuários.
Principais atualizações:
Modelo de base de idioma GLM-4-Plus: Seu desempenho foi amplamente aprimorado em termos de compreensão do idioma, acompanhamento de instruções e processamento de textos longos, mantendo o nível de liderança internacional.
Modelo base do diagrama Vincent CogView-3-Plus: possui desempenho próximo aos melhores modelos atuais como MJ-V6 e FLUX.
Modelo básico de compreensão de imagem/vídeo GLM-4V-Plus: Possui excelentes capacidades de compreensão de imagem e possui capacidades de compreensão de vídeo com base na percepção do tempo. O modelo será lançado na plataforma aberta (bigmodel.cn) e se tornará a primeira API de modelo geral de compreensão de vídeo na China.
Modelo básico de geração de vídeo CogVideoX: Depois que a versão 2B foi lançada e de código aberto, a versão 5B também foi oficialmente de código aberto. Seu desempenho foi aprimorado ainda mais e é a melhor escolha entre os atuais modelos de geração de vídeo de código aberto.
"Qingyan APP" lançou videochamada: o primeiro serviço doméstico de videochamada aberto para usuários finais C. A função de videochamada do "Qingyan APP" abrange modos de texto, áudio e vídeo e possui recursos de raciocínio em tempo real.
API GLM-4-Flash: O serviço de inferência é totalmente gratuito e fornece serviços de ajuste fino.
Link do aplicativo de serviço de videochamada:
https://zhipu-ai.feishu.cn/share/base/form/shrcnqpIx9q5ILEFeT2cPNhyuSf
Em suma, a atualização tecnológica da Zhipu Huazhang demonstra a sua forte força e capacidades de inovação contínua no campo da inteligência artificial, traz tecnologias e serviços mais avançados aos utilizadores e injeta nova vitalidade no desenvolvimento da indústria de inteligência artificial.