A concorrência no domínio da inteligência artificial é feroz e a ascensão dos modelos de código aberto está a desafiar o domínio dos gigantes da tecnologia. Recentemente, a startup de hardware de inteligência artificial Groq lançou dois modelos de linguagem de código aberto - Llama-3-Groq-70B-Tool-Use e Llama3Groq Tool Use 8B, e alcançou resultados impressionantes no Berkeley Function Call Ranking (BFCL). versão superou os modelos proprietários da OpenAI, Google, Anthropic e outras empresas. O sucesso destes modelos reside não apenas no seu poderoso desempenho, mas também na utilização de dados sintéticos gerados eticamente durante o processo de formação, o que resolve eficazmente problemas como privacidade de dados e sobreajuste, e proporciona novas oportunidades para o desenvolvimento sustentável do campo. exemplo de inteligência artificial.
A startup de hardware de inteligência artificial Groq lançou dois modelos de linguagem de código aberto que superam os gigantes da tecnologia em sua capacidade de usar ferramentas especializadas. O novo modelo Llama-3-Groq-70B-Tool-Use conquistou o primeiro lugar no Berkeley Function Call Ranking (BFCL), superando produtos proprietários de empresas como OpenAI, Google e Anthropic.
O líder do projeto Groq, Rick Lamers, anunciou a inovação em um artigo do X.com. Ele disse: “Tenho orgulho de anunciar os modelos Llama3Groq Tool Use 8B e 70B. Esta é uma versão totalmente ajustada da ferramenta de código aberto do Llama3 que alcançou a posição número 1 no BFCL, superando todos os outros modelos, incluindo modelos proprietários. Como Claude Sonnet3.5, GPT-4Turbo, GPT-4o e Gemini1.5Pro.”
Dados sintéticos e IA ética: um novo paradigma no treinamento de modelos
A versão maior do parâmetro 70B alcançou uma precisão geral de 90,76% no BFCL, enquanto o modelo menor 8B obteve 89,06%, ficando em terceiro lugar geral. Estes resultados mostram que os modelos de código aberto podem igualar ou até exceder o desempenho de alternativas de código fechado em tarefas específicas.
Groq desenvolveu os modelos em parceria com a empresa de pesquisa de inteligência artificial Glaive, usando ajuste fino completo e otimização de preferência direta (DPO) no modelo básico Llama-3 da Meta. A equipe enfatiza que eles usam apenas dados sintéticos gerados eticamente para treinamento, abordando preocupações comuns sobre privacidade de dados e sobreajuste.
Esses modelos agora estão disponíveis através da API Groq e da plataforma Hugging Face. Essa acessibilidade pode acelerar a inovação em áreas que exigem uso complexo de ferramentas e chamadas de funções, como codificação automatizada, análise de dados e assistentes interativos de IA.
Groq também lançou uma demonstração pública no Hugging Face Spaces, permitindo aos usuários interagir com o modelo e testar suas capacidades de ferramentas em primeira mão. Assim como a Gradio, que a Hugging Face adquiriu em dezembro de 2021, muitas das demos do Hugging Face Spaces são criadas dessa forma. A comunidade de IA respondeu com entusiasmo, com muitos pesquisadores e desenvolvedores ansiosos para explorar as capacidades desses modelos.
Destaques:
⭐ O modelo de IA de código aberto lançado pela Groq supera os modelos proprietários da gigante da tecnologia em tarefas específicas
⭐ Ao usar dados sintéticos para treinamento, Groq desafia problemas comuns de privacidade de dados e overfitting no desenvolvimento de modelos de IA
⭐ O lançamento de modelos de código aberto pode mudar o caminho de desenvolvimento do campo da IA e promover uma acessibilidade mais ampla à IA e o cultivo de ecossistemas inovadores
O sucesso do modelo de código aberto Groq injetou nova vitalidade no desenvolvimento do campo da inteligência artificial e também indica que os modelos de código aberto desempenharão um papel cada vez mais importante no futuro. Sua aplicação de dados sintéticos fornece novas ideias na solução de questões como privacidade de dados e preconceito de modelo, o que merece estudo aprofundado e referência pela indústria. Esperamos ansiosamente o surgimento de modelos de código aberto mais excelentes no futuro para promover o progresso contínuo da tecnologia de inteligência artificial.