Google AI lança Gemini 2.0 Flash: duas vezes mais rápido que Gemini 1.5 Pro

Autor：Eve Cole Data da Última Atualização：2024-12-20 16:48:02

O Google lançou recentemente uma grande atualização para o modelo Gemini AI – Gemini 2.0 Flash. O modelo oferece melhorias significativas em velocidade e capacidades multimodais, com o dobro da velocidade de processamento de seu antecessor e suporte para processamento em tempo real de fluxos de áudio e vídeo, bem como geração de imagens nativas. Esta atualização marca outro marco importante na exploração contínua do Google no campo da IA, trazendo ferramentas de IA mais poderosas para usuários e desenvolvedores.

O departamento de pesquisa de IA do gigante da tecnologia Google lançou recentemente a mais recente iteração do modelo Gemini AI – Gemini2.0Flash. Este novo modelo oferece melhorias significativas no desempenho, especialmente em termos de velocidade de processamento e expansão de recursos multimodais.

Autoridades dizem que os usuários do Gemini em todo o mundo podem acessar a versão otimizada para bate-papo selecionando a versão experimental 2.0 Flash na lista suspensa de modelos no desktop e na web móvel, e ela estará disponível no aplicativo móvel Gemini em breve. No início do próximo ano, o Gemini2.0 será expandido para mais produtos do Google.

Um desenvolvimento importante no Gemini 2.0 Flash é sua velocidade de processamento aprimorada. O Google afirma que o novo modelo roda duas vezes mais rápido que a geração anterior Gemini 1.5 Pro, ao mesmo tempo que apresenta melhor desempenho em vários testes de benchmark. Este aumento de velocidade significa que os usuários desfrutarão de um poder de processamento mais eficiente e tempos de resposta mais rápidos.

Além disso, o Gemini2.0Flash também foi expandido no processamento de diversos tipos de dados. O modelo agora inclui uma API multimodal em tempo real capaz de processar fluxos de áudio e vídeo em tempo real. Isso permite que os desenvolvedores criem aplicativos que aproveitem a entrada dinâmica de áudio e visual. Ao mesmo tempo, o modelo também integra recursos nativos de geração de imagens, permitindo aos usuários criar e modificar imagens por meio de prompts de texto conversacionais.

Além desses avanços principais, o Gemini 2.0 Flash também inclui vários outros aprimoramentos. A saída de áudio multilíngue nativa agora suporta oito vozes diferentes, expandindo a acessibilidade global do modelo. As melhorias no suporte a ferramentas e agentes permitem que os modelos interajam de forma mais eficiente com ferramentas e sistemas externos para concluir tarefas mais complexas.

Em termos de tarefas de engenharia de software, o Gemini2.0 Flash alcançou uma pontuação de 51,8% no benchmark SWE-bench Verified, que é projetado para avaliar a proficiência em codificação. Este resultado demonstra o potencial do modelo para auxiliar os desenvolvedores no processo de geração, depuração e otimização de código.

O Google está integrando o Gemini2.0 Flash em suas próprias ferramentas de desenvolvimento. Jules, um novo agente de código com tecnologia de IA, utiliza o Gemini 2.0 Flash para ajudar os desenvolvedores no Google Colaboratory. Esta integração demonstra a aplicação prática do modelo em um ambiente de desenvolvimento.

Gemini2.0 Flash também inclui recursos relacionados ao desenvolvimento responsável de IA. O suporte para 109 idiomas amplia a acessibilidade global do modelo. Todas as saídas de imagem e áudio geradas possuem marcas d'água SynthID integradas, fornecendo um mecanismo para rastrear fontes e resolver possíveis problemas relacionados ao conteúdo gerado por IA.

O lançamento do Gemini2.0 Flash representa mais um passo no desenvolvimento dos modelos de IA do Google. O foco no aumento da velocidade, na expansão das capacidades multimodais e na melhoria da interação das ferramentas contribui para sistemas de IA mais versáteis e poderosos.

À medida que o Google continua a desenvolver a família de modelos Gemini, são esperados mais refinamentos e expansões de capacidade. Gemini2.0Flash contribui para o avanço contínuo da tecnologia de IA e suas aplicações potenciais em vários campos.

Introdução oficial: https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#gemini-2-0-flash

Destaques:

? Gemini2.0 Flash é duas vezes mais rápido que a geração anterior e seu desempenho foi significativamente melhorado.

?️ O modelo adiciona uma API multimodal em tempo real para suportar processamento em tempo real de fluxos de áudio e vídeo.

?️ Função integrada de geração de imagens nativas, crie e modifique imagens por meio de prompts de texto.

O lançamento do Gemini 2.0 Flash anuncia um novo avanço na velocidade e na aplicação multimodal da tecnologia de IA. Seu potencial de aplicação em vários campos também merece atenção.