OpenAI lança GPT-4o mini, preço da API reduzido em 60%! "Homem acessível" no campo da inteligência

Autor：Eve Cole Data da Última Atualização：2024-12-13 09:16:01

OpenAI lançou um novo modelo econômico de IA GPT-4o mini. Seu custo foi significativamente reduzido, mas seu desempenho não é inferior. Este artigo irá aprofundar as vantagens de desempenho, segurança e preço do GPT-4o mini, bem como seu impacto no desenvolvimento futuro da IA.

OpenAI deu outro grande passo! Seu mais recente mini GPT-4o é considerado o modelo pequeno “mais acessível”. Esta não é apenas uma atualização de modelo, mas o início de uma revolução inteligente. Hoje, vamos desvendar o mistério do GPT-4o mini e ver como ele pode tornar a inteligência mais “fundamentada”.

Seja mais inteligente e economize dinheiro

A visão da OpenAI é disponibilizar inteligência em todos os lugares, e o GPT-4o mini é a implementação mais recente dessa visão. Este modelo não é apenas significativamente mais baixo em custo, mas também em termos de desempenho. Custando apenas 15 centavos por milhão de tokens de entrada e 60 centavos por milhão de tokens de saída, é uma ordem de magnitude mais barata que os modelos de ponta anteriores e mais de 60% mais barato que o GPT-3.5 Turbo.

Pequena estatura, grande sabedoria

O GPT-4o mini supera o GPT-3.5 Turbo e outros modelos pequenos em benchmarks acadêmicos, tanto em inteligência de texto quanto em raciocínio multimodal. Ele também suporta a mesma faixa de linguagem do GPT-4o e se destaca em chamadas de função, o que permite aos desenvolvedores construir aplicativos que podem obter dados ou realizar operações com sistemas externos e melhora em comparação com o GPT-3.5 Turbo Melhor desempenho de contexto longo.

Nos principais benchmarks, o GPT-4o mini teve o seguinte desempenho:

Tarefas de raciocínio: Em tarefas de raciocínio envolvendo texto e visão, o GPT-4o mini obteve 82,0%, em comparação com 77,9% do Gemini Flash e 73,8% do Claude Haiku.
Capacidade de matemática e codificação: GPT-4o mini também teve um bom desempenho em raciocínio matemático e tarefas de codificação. No teste MGSM (raciocínio matemático), obteve 87,0%, contra 75,5% do Gemini Flash e 71,7% do Claude Haiku. No teste HumanEval (desempenho de codificação), obteve 87,2%, em comparação com 71,5% do Gemini Flash e 75,9% do Claude Haiku.
Raciocínio Multimodal: No MMMU (Avaliação de Raciocínio Multimodal), GPT-4o mini pontuou 59,4%, enquanto Gemini Flash pontuou 56,1% e Claude Haiku pontuou 50,2%.

Medidas de segurança integradas

A segurança está sempre no centro do desenvolvimento do modelo openAI. Durante a fase de pré-treinamento, a openAI filtra informações que não deseja que o modelo aprenda ou produza, como discurso de ódio, conteúdo adulto, sites que agregam principalmente informações pessoais e spam. Após o treinamento, a openAI usa técnicas como aprendizagem por reforço e feedback humano (RLHF) para alinhar o comportamento do modelo com as políticas da openAI e melhorar a precisão e confiabilidade da resposta do modelo.

O GPT-4o mini tem as mesmas mitigações de segurança incorporadas ao GPT-4o, que a openAI avaliou cuidadosamente por meio de avaliação automatizada e humana com base na estrutura de prontidão original e em compromissos voluntários. Mais de 70 especialistas externos em áreas como psicologia social e desinformação testaram o GPT-4o para identificar riscos potenciais, que a openAI agora abordou e planeja incluir nos próximos detalhes do Cartão do Sistema GPT-4o e do Cartão de Pontuação de Prontidão. Os insights dessas avaliações de especialistas ajudaram a melhorar a segurança do GPT-4o e do GPT-4o mini.

Disponibilidade e preços

GPT-4o mini agora está disponível na API Assistant, API de conclusão de bate-papo e API de lote como modelos de texto e visuais. Os desenvolvedores pagam 15 centavos por 1 milhão de tokens de entrada e 60 centavos por 1 milhão de tokens de saída (aproximadamente equivalente a 2.500 páginas em um livro padrão). Planejamos lançar recursos de ajuste fino para o GPT-4o mini nos próximos dias.

No ChatGPT, usuários Free, Plus e Team poderão acessar o GPT-4o mini a partir de hoje, substituindo o GPT-3.5. Os usuários corporativos também terão acesso a partir da próxima semana, em linha com a missão da openAI de disponibilizar os benefícios da IA para todos.

perspectivas futuras

A equipe OpenAI disse: “Nos últimos anos, testemunhamos avanços significativos na inteligência de IA e, ao mesmo tempo, reduzimos drasticamente os custos. Por exemplo, desde o lançamento do modelo text-davinci-003 menos poderoso em 2022, o custo por GPT-4o mini. token caiu 99%. Estamos comprometidos em continuar a reduzir custos e, ao mesmo tempo, aprimorar os recursos do modelo."

“Vislumbramos um futuro onde os modelos sejam perfeitamente integrados em cada aplicativo e em cada site. O GPT-4o mini abre caminho para que os desenvolvedores construam e dimensionem aplicativos de IA poderosos de forma mais eficiente e acessível. incorporado em nossas experiências digitais diárias e estamos entusiasmados em continuar a liderar esse processo.”

Em suma, o GPT-4o mini fornece uma base sólida para a popularização de aplicações de IA com o seu excelente desempenho, preço económico e fortes medidas de segurança, indicando que a tecnologia de IA será mais amplamente integrada nas nossas vidas.