A IBM anunciou o lançamento de seu modelo de linguagem grande de código aberto de nova geração Granite3.1, com o objetivo de liderar o campo da IA de nível empresarial. Granite3.1 tem muitos destaques, incluindo comprimento de contexto estendido para 128K, modelos de incorporação eficientes, recursos integrados de detecção de alucinações e desempenho geral significativamente melhorado. De acordo com a IBM, seu modelo Granite8B Instruct tem melhor desempenho entre modelos de código aberto da mesma escala, superando concorrentes como Llama3.1 da Meta, Qwen2.5 e Gemma2 do Google. O lançamento deste novo modelo segue o lançamento do Granite 3.0 em outubro, refletindo a rápida iteração e o investimento contínuo da IBM no campo da IA generativa, com receitas de negócios relacionadas atingindo US$ 2 bilhões.
A IBM lançou oficialmente sua nova geração de modelo de linguagem grande de código aberto Granite3.1, esforçando-se para ocupar uma posição de liderança no campo da IA de nível empresarial. Esta série de modelos apresenta comprimento de contexto estendido de 128K, modelos incorporados, recursos integrados de detecção de alucinações e melhorias significativas de desempenho.
A IBM afirma que o modelo Granite8B Instruct tem melhor desempenho entre concorrentes de código aberto do mesmo tamanho, incluindo Llama3.1 da Meta, Qwen2.5 e Gemma2 do Google.
O lançamento do modelo Granite3.1 tem como pano de fundo a rápida iteração da série Granite3.0 da IBM, lançada já em outubro. A IBM revelou que sua receita comercial relacionada à geração de IA atingiu US$ 2 bilhões. A ideia central da nova versão é integrar mais funcionalidades em um modelo menor para que possa ser executado de forma mais fácil e econômica para os usuários corporativos.
David Cox, vice-presidente da IBM Research, disse que o modelo Granite é amplamente utilizado em produtos internos, serviços de consultoria e atendimento ao cliente da IBM, e também é lançado em formato de código aberto, por isso precisa atingir um alto nível em todos os aspectos. A avaliação de desempenho do modelo depende não apenas da velocidade, mas também da eficiência, ajudando os usuários a economizar tempo na obtenção dos resultados.
Em termos de duração do contexto, a melhoria do Granite3.1 é particularmente óbvia, estendendo-se da primeira versão de 4K a 128K, o que é particularmente importante para usuários corporativos de IA, especialmente em termos de geração aprimorada de recuperação (RAG) e IA de agente inteligente. O comprimento de contexto estendido permite que o modelo processe documentos, logs e conversas mais longos, permitindo compreender e responder melhor a consultas complexas.
A IBM também lançou uma série de modelos de incorporação para acelerar o processo de conversão de dados em vetores. Entre eles, o tempo de consulta do modelo Granite-Embedding-30M-English é de 0,16 segundos, o que é mais rápido que os produtos concorrentes. Para alcançar a melhoria de desempenho do Granite3.1, a IBM inovou no processo de treinamento em vários estágios e no uso de dados de treinamento de alta qualidade.
Em termos de detecção de alucinações, o modelo Granite3.1 integra proteção contra alucinações ao modelo, que pode autodetectar e reduzir saídas falsas. Essa detecção integrada otimiza a eficiência geral e reduz o número de chamadas de inferência.
Atualmente, o modelo Granite3.1 está aberto gratuitamente a usuários corporativos e é fornecido por meio do serviço corporativo de IA Watsonx da IBM. No futuro, a IBM planeja manter um ritmo rápido de atualizações, e o Granite 3.2 lançará funcionalidade multimodal no início de 2025.
Blog oficial: https://www.ibm.com/new/announcements/ibm-granite-3-1-powerful-performance-long-context-and-more
Destaque:
A IBM lançou o modelo Granite3.1, com o objetivo de assumir uma posição de liderança no mercado de grandes modelos de linguagem de código aberto.
O novo modelo suporta comprimento de contexto de 128K, melhorando significativamente a capacidade e a eficiência do processamento.
Os recursos de detecção de ilusões são integrados ao modelo, otimizando o desempenho geral e a precisão.
Em suma, o lançamento do Granite3.1 marca outro grande progresso para a IBM no campo de modelos de grande linguagem de código aberto. Seu desempenho poderoso e funções ricas trarão uma experiência de IA mais conveniente e eficiente para os usuários corporativos. Vale a pena esperar por futuras iterações.