Modelos da série GLM-4-9B de código aberto Zhipu: capacidades superam de forma abrangente o LLaMA 3 8B

Autor：Eve Cole Data da Última Atualização：2025-01-03 20:32:01

A Zhipu AI lançou os modelos da série GLM-4-9B, desencadeando uma nova onda no campo da inteligência artificial. Esta série inclui modelos básicos, modelos de bate-papo com diferentes comprimentos de contexto e modelos visuais. Seu desempenho supera de forma abrangente o LLaMA38B e mostra excelente desempenho em múltiplas avaliações, como semântica, matemática, raciocínio, código e conhecimento. . O que é ainda mais digno de nota é que os modelos da série GLM-4-9B foram de código aberto no Github, fornecendo recursos valiosos para desenvolvedores e pesquisadores em todo o mundo e promovendo fortemente o desenvolvimento e a aplicação de tecnologia de inteligência artificial.

Zhipu anunciou o lançamento da série de modelos GLM-4-9B, incluindo modelos básicos, modelos de bate-papo com diferentes comprimentos de contexto e modelos visuais, com capacidades que superam o LLaMA38B em todos os aspectos. É relatado que os modelos da série GLM-4-9B foram de código aberto no Github, atraindo a atenção de um grande número de desenvolvedores e pesquisadores. O lançamento desta série de modelos é considerado mais um avanço importante para a Zhipu Company no campo da inteligência artificial.

GLM-4-9B é a versão de código aberto do modelo de pré-treinamento de última geração da série GLM-4 lançado pela Zhipu AI. Na avaliação de vários conjuntos de dados, como semântica, matemática, raciocínio, código e conhecimento, o GLM-4-9B e sua versão alinhada à preferência humana, GLM-4-9B-Chat, mostraram excelente desempenho além do Llama-3-8B.

Além de ser capaz de conduzir várias rodadas de conversas, o GLM-4-9B-Chat também possui funções avançadas, como navegação na web, execução de código, chamada de ferramenta personalizada (chamada de função) e raciocínio de texto longo (suportando contexto de até 128K) .

Este modelo de geração adiciona suporte multilíngue, suportando 26 idiomas, incluindo japonês, coreano e alemão. Também lançamos o modelo GLM-4-9B-Chat-1M que suporta comprimento de contexto de 1M (cerca de 2 milhões de caracteres chineses) e o modelo multimodal GLM-4V-9B baseado em GLM-4-9B.

O GLM-4V-9B é capaz de diálogo multiturno bilíngue em chinês e inglês em alta resolução de 1120*1120 na avaliação multimodal de habilidades abrangentes em chinês e inglês, raciocínio perceptivo, reconhecimento de texto, compreensão de diagramas e outros aspectos. , GLM-4V-9B classificado em primeiro lugar. Ele mostra excelente desempenho além de GPT-4-turbo-2024-04-09, Gemini1.0Pro, Qwen-VL-Max e Claude3Opus.

Os internautas expressaram a esperança de que os modelos da série GLM-4-9B possam trazer um novo impulso ao desenvolvimento da tecnologia de inteligência artificial e esperam ver o advento de produtos mais inteligentes. Ao mesmo tempo, também expressaram o seu apreço pela força técnica e capacidade de inovação da Zhipu.

Endereço de código aberto: https://github.com/THUDM/GLM-4

Endereço de experiência do modelo: https://modelscope.cn/studios/dash-infer/GLM-4-Chat-DashInfer-Demo/summary

O código aberto dos modelos da série GLM-4-9B promoverá ainda mais o compartilhamento aberto e o desenvolvimento de tecnologia de inteligência artificial. Esperamos ver o surgimento de mais aplicações inovadoras baseadas neste modelo. Os avanços contínuos da Zhipu AI injetaram, sem dúvida, uma nova vitalidade no campo da inteligência artificial.