O grande lançamento do Gemini 2.0 do Google marca um passo importante para a inteligência artificial entrar na era dos agentes. Esta atualização não só melhora significativamente o desempenho, mas também alcança avanços em capacidades multimodais e no uso de ferramentas nativas. Gemini 2.0 suporta múltiplas formas de entrada, como texto, imagem, vídeo, áudio, etc., e suporta pela primeira vez funções de saída multimodais, como geração de imagem nativa e conversão de texto em fala, com o objetivo de tornar as informações mais úteis. O Google planeja integrar rapidamente o Gemini 2.0 em seu ecossistema de produtos, como o Google Search e o recém-lançado recurso “Deep Research”, para aprimorar ainda mais a experiência do usuário.
O Google anunciou hoje o lançamento de seu modelo de inteligência artificial de última geração Gemini 2.0, o modelo de IA mais poderoso da empresa até o momento. Esta grande atualização não apenas melhora significativamente o desempenho, mas também marca um passo importante para a inteligência artificial entrar na era dos agentes.
De acordo com Sundar Pichai, CEO do Google e da Alphabet, o Gemini 2.0 alcançou avanços tanto nas capacidades multimodais quanto no uso de ferramentas nativas. O novo modelo não só pode compreender e processar múltiplas formas de entrada, como texto, imagens, vídeos e áudio, mas também suporta pela primeira vez funções de saída multimodais, como geração de imagens nativas e conversão de texto em voz.
“Se o Gemini 1.0 tratava de organizar e compreender informações, o Gemini 2.0 tratava de tornar a informação mais útil”, disse Pichai. Atualmente, o modelo está aberto a desenvolvedores e testadores confiáveis.
Inovação tecnológica e melhoria de desempenhoDemis Hassabis, CEO do Google DeepMind, revelou que o primeiro lote de lançamentos é a versão experimental do Gemini 2.0 Flash. Esta versão melhorou significativamente o desempenho, mantendo a baixa latência. Notavelmente, o Flash 2.0 superou até mesmo o 1.5 Pro nos principais benchmarks, sendo duas vezes mais responsivo.
O novo modelo é executado na plataforma de hardware TPU Trillium de sexta geração do Google, que também é a infraestrutura que suporta 100% de treinamento e inferência do Gemini2.0. Atualmente, esta plataforma está aberta aos clientes.
Aplicações práticas e integração de produtosO Google planeja integrar rapidamente o Gemini 2.0 ao seu ecossistema de produtos. A partir de agora, os usuários do Gemini em todo o mundo podem optar por usar a versão experimental do Flash 2.0 através da versão web, e a versão do aplicativo móvel também será lançada em breve. Além disso, o recurso de visão geral de IA da Pesquisa Google também integrará os recursos avançados de raciocínio do 2.0 para resolver tópicos mais complexos e problemas de várias etapas.
Vale destacar que o Google também lançou um novo recurso chamado “Deep Research”, que estará disponível no Gemini Advanced e pode atuar como assistente de pesquisa para explorar temas complexos e gerar relatórios automaticamente.
Explore o futuro dos agentes de IANeste lançamento, o Google também demonstrou vários projetos de protótipos de pesquisa construídos no Gemini 2.0:
Projeto Astra: Este é um protótipo universal de assistente de IA com recursos de conversação em vários idiomas, capacidade de usar ferramentas como pesquisa do Google, Lens e Maps e função de memória de conversa de até 10 minutos. Projeto Mariner: Este é um protótipo de interação com o navegador que pode compreender e raciocinar sobre vários tipos de informações na web e auxiliar os usuários na conclusão de tarefas por meio de uma extensão do Chrome. No benchmark WebVoyager obteve 83,5% dos melhores resultados. Jules: Este é um agente de código de IA para desenvolvedores que pode ser integrado diretamente aos fluxos de trabalho do GitHub para auxiliar na resolução de problemas e execução de tarefas. Segurança e Desenvolvimento ResponsávelAo impulsionar estas inovações, o Google dá ênfase especial à importância da segurança e do desenvolvimento responsável. A empresa tomou diversas medidas para garantir o uso seguro de agentes de IA:
Trabalhar com o Comitê de Responsabilidade e Segurança (RSC) para identificar e compreender riscos potenciais Melhorar os métodos da equipe vermelha assistidos por IA para aprimorar a avaliação de riscos e capacidades de mitigação Estabelecer avaliação de segurança e mecanismos de treinamento para entrada e saída multimodais Adicionar proteção contra comandos maliciosos no Projeto Perspectivas futuras do Mecanismo MarinerO lançamento do Gemini 2.0 é considerado um marco importante no desenvolvimento da IA. Ao combinar recursos multimodais avançados com recursos de agente, o Google demonstra suas ambições no avanço da tecnologia de IA. À medida que esses novos recursos são gradualmente integrados em vários produtos, os usuários poderão experimentar serviços de assistente de IA mais inteligentes e práticos.
No entanto, o Google também admitiu que a tecnologia do agente de IA ainda está em seus estágios iniciais e precisa continuar a coletar feedback através da cooperação com testadores confiáveis para melhorar e melhorar continuamente a tecnologia. A empresa está empenhada em continuar a avançar no desenvolvimento da tecnologia de IA de forma responsável, garantindo padrões éticos e de segurança enquanto explora novas possibilidades.
Para obter mais informações, consulte: https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ai-game-agents
Em suma, o lançamento do Gemini 2.0 demonstra a forte força do Google no campo da inteligência artificial e a sua visão para o desenvolvimento futuro. Também indica que a tecnologia de inteligência artificial penetrará ainda mais na vida das pessoas e trará às pessoas serviços mais convenientes e inteligentes. Mas, ao mesmo tempo, as questões éticas e de segurança ainda requerem atenção e resolução contínuas.