A startup francesa de IA Les Ministraux lançou dois modelos leves de IA, Ministral3B e Ministral8B, com parâmetros de 3 bilhões e 8 bilhões respectivamente, projetados para dispositivos de ponta. Esses dois modelos tiveram um desempenho excelente no teste de instrução após benchmark, superando especialmente modelos do mesmo nível em termos de conhecimento, bom senso, raciocínio e eficiência. Eles até superaram modelos com parâmetros maiores em alguns aspectos, estabelecendo um novo benchmark para baixo desempenho. modelos de parâmetros. O editor de Downcodes fornecerá uma explicação detalhada do desempenho, recursos e empresas por trás desses dois modelos.
A startup francesa de IA Les Ministraux lançou dois novos modelos leves, Ministral3B e Ministral8B, especialmente projetados para dispositivos de ponta, com parâmetros de 3 bilhões e 8 bilhões, respectivamente. Os dois modelos tiveram um bom desempenho no benchmark de instrução, com o Ministral3B superando o Llama38B e o Mistral7B, enquanto o Ministral8B superou esses dois modelos em todos os aspectos, exceto nas capacidades de código.
Os resultados dos testes mostram que o desempenho do Minitral3B e Minitral8B é comparável ao de modelos de código aberto como Gemma2 e Llama3.1. Ambos os modelos suportam até 128 mil contextos e estabelecem novos padrões de referência para modelos de parâmetros abaixo de 10B em termos de conhecimento, bom senso, raciocínio, chamadas de função e eficiência. O Ministral8B também está equipado com um mecanismo de atenção de janela deslizante para inferência na memória mais rápida e eficiente. Eles podem ser ajustados para uma variedade de casos de uso, como o gerenciamento de fluxos de trabalho complexos de agentes de IA ou a criação de assistentes de tarefas especializados.
Os investigadores realizaram vários testes de referência no modelo Les Ministraux, abrangendo aspectos como conhecimento e bom senso, codificação, matemática e multilinguismo. Na etapa do modelo pré-treinamento, o Minitral3B obteve os melhores resultados em comparação com Gema22B e Llama3.23B. Em comparação com Llama3.18B e Mistral7B, o Mistral8B teve melhor desempenho em todos os aspectos, exceto nas capacidades de codificação. Na fase de modelo de instrução após o ajuste fino, o Minitral3B obteve os melhores resultados em diferentes testes de benchmark, e o Minitral8B foi apenas ligeiramente inferior ao Gema29B na bancada Wild.
O lançamento do modelo Les Ministraux fornece aos usuários uma solução altamente eficiente em termos computacionais e de baixa latência que atende às necessidades de um número crescente de usuários para inferência local para aplicações críticas. Os usuários podem aplicar esses modelos a cenários como tradução no dispositivo, assistentes inteligentes que não requerem conexão com a Internet e robôs autônomos. O preço de entrada e saída do Ministral8B é de US$ 0,1 por milhão de tokens, e o do Ministral3B é de US$ 0,04 por milhão de tokens.
É importante notar que Mistral já abriu o código-fonte de vários modelos por meio de links magnéticos e foi reconhecido pela comunidade de IA. No entanto, a empresa esteve envolvida em polêmica este ano, pois não é mais tão aberta como antes. Há notícias de que a Microsoft irá adquirir parte das ações da Mistral e investir nela, o que significa que os modelos da Mistral serão hospedados no Azure AI. Os internautas do Reddit descobriram que Mistral havia removido seu compromisso com o código aberto de seu site oficial. Alguns modelos da empresa também começaram a cobrar, incluindo o Ministral3B e o Ministral8B lançados desta vez.
Detalhes: https://mistral.ai/news/ministraux/
Em suma, o surgimento do Minitral3B e do Minitral8B oferece uma forte escolha para aplicações de IA de computação de ponta, e seu desempenho eficiente e baixo preço proporcionam-lhes vantagens competitivas significativas. Mas a mudança na estratégia da Mistral também desencadeou o pensamento da indústria sobre o equilíbrio entre os modelos de código aberto e a comercialização. No futuro, continuaremos a prestar atenção à aplicação e ao desenvolvimento do modelo Les Ministraux.