2024 está chegando ao fim e a guerra de IA entre Google e OpenAI está a todo vapor. O discurso da conferência anual de estratégia do CEO do Google, Pichai, indica que 2025 se tornará um ponto de viragem fundamental no campo da IA. Diante da forte ascensão do OpenAI e da enorme influência do ChatGPT, o Google está reagindo ativamente e tentando recuperar sua posição de liderança em IA com sua série de produtos Gemini. Este discurso não é apenas um resumo da competição nos últimos dois anos, mas também um plano claro para o desenvolvimento futuro. É digno de atenção como o Google responderá aos desafios e se poderá contra-atacar com sucesso.
2025 ainda não chegou e a guerra da IA no Vale do Silício já foi iniciada. O CEO do Google, Pichai, fez um apelo inspirador a todos os funcionários na reunião anual de estratégia: 2025 será um ano crucial. Ele enfatizou que o Google deve avançar a uma velocidade sem precedentes, porque esta não é apenas uma competição tecnológica, mas também uma competição tecnológica! Um momento disruptivo relacionado ao futuro cenário da IA.
Esta afirmação é sem dúvida uma resposta à competição acirrada entre Google e OpenAI. Desde o advento do ChatGPT, a liderança do Google no campo da IA tem sido desafiada sem precedentes. Nos últimos dois anos, a OpenAI ofuscou quase todos os esforços do Google. No entanto, em dezembro de 2023, o Google fez um forte contra-ataque com uma série de produtos de grande sucesso, como Gemini2.0 Flash e Veo2, mostrando potencial para superar o modelo líder. O ponto de viragem nesta competição de IA parece ter chegado.
Na reunião, Pichai mostrou um grande gráfico de comparação de modelos. O desempenho do Gemini 1.5 estava claramente à frente dos concorrentes, incluindo o OpenAI. Quando questionado sobre como o ChatGPT se tornou sinônimo de IA, Pichai disse que o Google nem sempre precisa ser o primeiro, mas deve ser o melhor em sua categoria. O significado de 2025 é que o Google deve consolidar a sua posição de primeiro nível no campo da IA. Logan Kilpatrick, chefe de relações com desenvolvedores do Google, também sugeriu várias vezes que o Google fará todos os esforços no próximo ano e deverá lançar oficialmente a versão completa do Gemini 2.0 em janeiro. Hassabis, CEO do Google DeepMind, chegou a dizer sem rodeios que isso é apenas o aperitivo e que a diversão começará em 2025.
Alguns analistas prevêem que o Google poderá abrir modelos mais poderosos gratuitamente no próximo ano e lançar modelos competitivos que desafiem diretamente o GPT-3. Para ocupar o comando nesta revolução da IA, o Google está fazendo tudo para fora.
Gemini: a próxima aposta do Google em 500 milhões de aplicativos
Para o Google, um desafio mais sério vem da canibalização do negócio de buscas pela OpenAI. Embora o Google ainda domine o mercado de buscas, a IA generativa está oferecendo às pessoas novas maneiras de acessar informações online. OpenAI está sendo considerado por cada vez mais pessoas como sinônimo de IA, assim como a posição do Google no campo de busca.
O Google está sob enorme pressão e investiu pesadamente no desenvolvimento do Gemini para consolidar sua liderança no campo da IA. O aplicativo Gemini permite que os usuários acessem uma variedade de ferramentas, incluindo chatbots. Pichai enfatizou que “construir novos grandes negócios” é uma prioridade máxima. O Google tem atualmente 15 aplicativos com mais de 500 milhões de usuários, e os executivos geralmente acreditam que o Gemini será o próximo. Embora Pichai veja um “forte impulso” nas candidaturas Gemini, ele reconhece que ainda há muito trabalho a ser feito em 2025 para colmatar a lacuna e estabelecer liderança. “O maior foco no próximo ano será expandir o Gemini no lado do consumidor”, acrescentou.
Além disso, o Google enfrenta diversas ações legais nos Estados Unidos, incluindo acusações de monopolizar a pesquisa e dominar ilegalmente a tecnologia de publicidade online. Os reguladores britânicos também determinaram inicialmente que as práticas tecnológicas publicitárias do Google afectavam a competitividade do país. A este respeito, Pichai disse que este é um desafio trazido pela escala e sucesso do Google, e deve garantir que não se distraia.
Google: Será que os “retardatários” conseguirão alcançá-los?
Dados do OpenRouterAI mostram que a participação de mercado do Google Gemini entre os desenvolvedores disparou de cerca de 5% em setembro para mais de 50%, muito à frente, e elevou o preço das ações em 14%. Neste momento, já se passaram dois anos desde que a OpenAI lançou o ChatGPT.
Já em 2017, Sam Altman considerava o Google DeepMind o oponente mais poderoso na competição AGI. No entanto, o Google, uma vez reconhecido como um gigante da IA, parecia um tanto "impotente" após o lançamento do ChatGPT. O Google não apenas cometeu erros frequentes no lançamento de produtos, mas o preço de suas ações também caiu.
O que é intrigante é que o Google tem o melhor hardware, mais dados de treinamento e os melhores talentos do mundo. Por que está ficando atrás do OpenAI na competição de IA, e até mesmo startups como a Anthropic têm dificuldade em igualá-lo? analistas acreditam que o "navio do Google está prestes a virar". Devido a considerações de segurança, o Google precisa de mais tempo para realizar inspeções de conformidade. No início de 2023, o Google lançou Bard às pressas, mas o preço de suas ações despencou devido a respostas erradas. Além disso, por ser uma grande empresa, o Google também está sujeito a mais restrições legais, como questões de direitos autorais sobre dados de usuários.
No entanto, o Google está ressurgindo como rei. Seu objetivo futuro é continuar a liderar o desenvolvimento de “agentes inteligentes” e integrá-los em navegadores e telefones celulares para automatizar as tarefas dos usuários.
Os grandes eventos de IA do Google em 2024
2024 é o ano em que a IA do Google se “fortalecerá”. Muitos produtos conhecidos foram lançados este ano, como várias versões do Gemini, NotebookLM e os recursos de IA dos telefones Pixel.
O Google afirma “60 grandes lançamentos de IA” em 2024, incluindo:
Modelo Gemini: o Google lançou seu primeiro modelo multimodal nativo Gemini1.0 em dezembro do ano passado e, desde então, lançou as versões Gemini1.5 e Gemini2.0 Flash. Esses modelos melhoraram significativamente em termos de capacidades de processamento multimodal, janelas de contexto e desempenho de raciocínio. Gemini2.0 integra recursos de uso de ferramentas multimodais e nativas, marcando a entrada oficial de grandes modelos na era do "agente inteligente".
NotebookLM: Este assistente de pesquisa e redação científica orientado por IA pode ajudar melhor os usuários a compreender e explorar materiais complexos depois que o modelo subjacente for mudado para Gemini1.5Pro. Seu principal recurso, Visão Geral de Áudio, também pode gerar áudio de dois hosts de IA discutindo entre si, auxiliando os usuários no resumo e nas discussões aprofundadas dos materiais.
AlphaFold3: O AlphaFold3 do Google melhorou seu desempenho em pelo menos 50% na previsão de interações entre proteínas e outros tipos moleculares, trazendo mais possibilidades para o campo das ciências biológicas.
Terminal móvel Pixel: o Google fornece uma série de funções de IA baseadas em Gemini e Imagen2 para a nova série Galaxy S24 e telefones celulares Pixel9, incluindo recursos de resumo, edição generativa de fotos e planejamento de viagens, etc., com o objetivo de fornecer aos usuários informações mais inteligentes e convenientes serviços por meio da experiência de IA.
O Google está dando tudo de si e espera trazer mais surpresas aos usuários no próximo ano.
Em suma, a concorrência do Google no campo da IA não tem sido tranquila, mas a sua forte força técnica e a acumulação de recursos deram-lhe uma forte competitividade. Em 2025, vamos esperar para ver se o Google conseguirá ultrapassar com sucesso sua série de produtos Gemini e outras inovações, e quem vencerá no final.