O mais recente sistema de IA do Google DeepMind, Alpageometria2, fez um progresso significativo na solução de problemas geométricos, superando o medalhista de ouro médio na competição International Mathematics Olympics (IMO). Essa conquista inovadora não apenas demonstra o potencial da IA no campo da matemática, mas também fornece uma nova direção para o desenvolvimento da IA geral.
O Alphageometria2, o mais recente sistema de IA lançado pelo Google DeepMind Research Lab, destacou -se na solução de problemas geométricos, superando o medalhista de ouro médio no concurso International Mathematics Olympics (IMO). O sistema é considerado uma versão aprimorada da alfagometria, e os pesquisadores dizem que o alfageometria2 pode resolver 84% dos problemas geométricos na IMO nos últimos 25 anos.
Por que o DeepMind se concentra nessas competições de matemática do ensino médio? Provando por que os teoremas matemáticos ou os teoremas de explicação (como o teorema do pitagórico) requer raciocínio lógico e a capacidade de selecionar várias etapas possíveis. Se a teoria de DeepMind for verdadeira, essas capacidades de solução de problemas serão muito importantes para os futuros modelos gerais de IA.
Neste verão, o DeepMind demonstrou um sistema que combina alfageometria2 com o modelo de raciocínio matemático Alphaproof, que resolveu quatro dos seis problemas da IMO de 2024. Além dos problemas geométricos, essa abordagem pode ser estendida a outros campos matemáticos e científicos, como cálculos complexos de engenharia.
Os componentes principais do alfageometria2 incluem um modelo de idioma da série Google Gemini e um "mecanismo de símbolo". O modelo Gemini ajuda o motor simbólico a deduzir soluções viáveis a problemas por meio de regras matemáticas. Os problemas geométricos com IMO geralmente são baseados em números que precisam ser adicionados com "construídos", como pontos, linhas ou círculos. O modelo Gemini do Alpageometria2 pode prever quais construções podem ser úteis na solução de problemas.
Vale a pena notar que, ao resolver o problema da IMO, o alfageometria2 usa mais de 300 milhões de teoremas e dados sintéticos de prova gerados pelo próprio DeepMind para o treinamento. A equipe de pesquisa selecionou 45 problemas geométricos para a IMO nos últimos 25 anos e os expandiu para formar um conjunto de 50 problemas. Alpageometria2 resolveu com sucesso 42 deles, superando a pontuação média do medalhista de ouro.
No entanto, o alfageometria2 ainda tem algumas limitações, como não pode resolver problemas com pontos de números variáveis, equações não lineares e desigualdade. No entanto, este estudo provocou uma discussão sobre se os sistemas de IA devem se basear em operações simbólicas ou redes neurais. O alfageometria2 adota uma abordagem híbrida que combina redes neurais e motores simbólicos baseados em regras.
O sucesso do alfageometria2 fornece uma nova direção para o desenvolvimento futuro da IA de uso geral. Embora ainda não seja totalmente auto-suficiente, a pesquisa da equipe DeepMind mostra que os modelos de IA mais auto-suficientes podem estar disponíveis no futuro.
Entrada de papel: https://arxiv.org/pdf/2502.03544
Pontos -chave:
O alfageometria2 é capaz de resolver 84% dos problemas geométricos na IMO nos últimos 25 anos, superando a pontuação média de medalhistas de ouro.
O sistema combina redes neurais e mecanismos de símbolos para resolver problemas matemáticos complexos usando uma abordagem híbrida.
O DeepMind espera promover o progresso da pesquisa sobre a IA geral mais poderosa, resolvendo problemas geométricos.
O sucesso de alfageometria2 não apenas demonstra o potencial da IA no campo da matemática, mas também fornece uma nova direção para o desenvolvimento da IA geral. No futuro, com o avanço contínuo da tecnologia, a IA mostrará fortes capacidades em mais campos.