Zhipu lança modelos GLM-4-Air e GLM-4V-Plus e estabelece modelos gratuitos de modo completo de Flash - artigo AI

Autor：Eve Cole Data da Última Atualização：2025-01-28 23:00:02

lançou uma série de atualizações importantes em 16 de janeiro de 2025, incluindo o novo modelo ponta a ponta GLM-Realtime e versões atualizadas de GLM-4-Air, GLM-4V-Plus e outros modelos. Todos Todos os modelos foram lançados na plataforma bigmodel.cn. Esta atualização cobre múltiplas modalidades, como linguagem, voz, imagem e vídeo, demonstrando a profunda acumulação e capacidade de inovação da Zhipu no campo da tecnologia multimodal de grandes modelos, e lançou especialmente um modelo Flash totalmente modal gratuito, com o objetivo de reduzir o limite para aplicação de grandes modelos e promover o desenvolvimento inclusivo de tecnologia de grandes modelos.

Beijing Zhipu Huazhang Technology Co., Ltd. anunciou o lançamento de uma série de novos modelos em 16 de janeiro de 2025 e os lançou em bigmodel.cn. Após o lançamento do "Zhipu Qingyan" em agosto, a empresa fez uma exploração aprofundada nas áreas de compreensão e geração de linguagem, fala, imagem e vídeo, e lançou modelos multimodais como GLM-Voice, GLM-4V, CogView e CogVideoX.

O novo modelo ponta a ponta GLM-Realtime lançado desta vez realiza compreensão de vídeo e interação de voz de baixa latência, integra uma função cappella e suporta até 2 minutos de memória e funções de chamada de função. A empresa também atualizou simultaneamente os modelos GLM-4-Air e GLM-4V-Plus e está comprometida em fornecer o desempenho mais forte e soluções de modelo de linguagem econômicas do setor. Zhipu sempre se comprometeu a retribuir à sociedade com tecnologia avançada de modelos grandes e configurou especialmente modelos gratuitos de modo completo em Flash, cobrindo vários cenários, como idioma, imagens de texto, vídeos de texto e compreensão de imagens, para ajudar os desenvolvedores a alcançar facilmente inovação em aplicações.

微信截图_20250116150923.png

O GLM-Realtime tem capacidade de memória de conteúdo de 2 minutos para chamadas de vídeo e implementa de forma inovadora uma função de canto a cappella na interação por voz, permitindo que modelos grandes cantem em conversas. A empresa integra API em tempo real em óculos inteligentes e bonecos de companhia para que os usuários possam experimentar interação quase em tempo real com assistentes inteligentes. O Realtime oferece suporte adicional à função Function Call, que pode contar com seu próprio conhecimento e capacidades para chamar com flexibilidade conhecimentos e ferramentas externas para expandir para uma gama mais ampla de cenários de negócios. A API GLM-Realtime foi lançada na plataforma aberta bigmodel.cn e atualmente é gratuita.

GLM-4-Air tem sido popular entre os desenvolvedores por seu desempenho de alto custo desde o seu lançamento. Desta vez, foi totalmente atualizado para GLM-4-Air-0111. Ao otimizar dados e processos de treinamento, seu desempenho em algumas dimensões está próximo. o do GLM-4-Plus maior, ao mesmo tempo, o preço do modelo é reduzido para 50% do preço original, diminuindo o limite para aplicação de modelos grandes. O modelo de compreensão visual GLM-4V-Plus também foi totalmente atualizado. A nova versão melhorou significativamente o desempenho em múltiplas listas públicas. Suporta função de resolução variável, adapta-se à entrada de imagens de diferentes tamanhos, reduz significativamente o consumo de tokens em cenários de imagens pequenas. e suporta reconhecimento 4K ultra nítido de imagens e imagens com proporções extremas, com recursos de compreensão de vídeo de até 2 horas, fornecendo soluções eficientes e precisas para compreensão e análise de vídeos longos.

A Zhipu está comprometida com a inclusão de grandes modelos. Para ajudar os desenvolvedores a inovar, ela criou especialmente uma API de modelo inclusivo da série Flash que é gratuita e aberta a toda a sociedade. Como o primeiro modelo de série livre totalmente modal da indústria, os desenvolvedores podem chamar funções de linguagem, compreensão multimodal e geração multimodal gratuitamente. Num futuro próximo, a série Flash será totalmente atualizada, incluindo o modelo de linguagem GLM-4-Flash, o modelo de compreensão de imagem GLM-4V-Flash, o modelo de geração de imagem CogView-3-Flash e o modelo de geração de vídeo CogVideoX-Flash.

As atualizações e novos modelos lançados pela Zhipu Huazhang não apenas demonstram sua forte força técnica no campo da inteligência artificial, mas também refletem sua determinação em promover a universalização da tecnologia de grandes modelos, fornecendo aos desenvolvedores e usuários uma IA mais conveniente e mais poderosa. ferramentas, vale a pena esperar o surgimento de aplicações mais inovadoras no futuro.