A aplicação da inteligência artificial no campo da matemática fez outro avanço. Essa conquista não apenas demonstra o potencial da IA na solução de problemas geométricos complexos, mas também fornece novas idéias para o desenvolvimento futuro dos modelos gerais de IA.
Recentemente, um sistema de IA desenvolvido pelo Google DeepMind, Alphageometria2, superou com sucesso o nível médio dos medalhistas de ouro da International Mathematics Olympics (IMO) e teve um bom desempenho em questões de geometria. O Alphageometria2 é uma versão atualizada do sistema de alfageometria lançado pela DeepMind no ano passado.
Então, por que o DeepMind se concentraria em uma competição de matemática do ensino médio? Provar teoremas matemáticos requer habilidades de raciocínio e capacidade de escolher soluções apropriadas, e o DeepMind acredita que essas habilidades de solução de problemas podem ser cruciais para o desenvolvimento futuro dos modelos gerais de IA.
Neste verão, o DeepMind também mostrou um sistema que combina alfageometria2 com o AlphaProof, um modelo de IA para o raciocínio matemático formal, que resolveu quatro das seis questões nas eliminatórias de 2024 IMO. Além dos problemas geométricos, essa abordagem também pode se estender a outras áreas da matemática e da ciência e pode até ajudar com cálculos complexos de engenharia.
O núcleo do alfageometria2 inclui um modelo de idioma da família Google Gemini e um "mecanismo de símbolo". O modelo Gemini ajuda o motor simbólico a derivar soluções para o problema usando regras matemáticas. O fluxo de trabalho é: o modelo Gemini prevê que constrói (como pontos, linhas, círculos) pode ser útil na solução de problemas, e o mecanismo simbólico executa o raciocínio lógico com base nessas construções. Após uma série de pesquisas complexas, o alfageometria2 conseguiu combinar as sugestões do modelo de Gêmeos com princípios conhecidos para desenhar provas.
Embora o alfageometria2 tenha respondido com sucesso 42 dos 50 problemas da IMO, superando a pontuação média dos players de medalhas de ouro, ainda existem algumas limitações, como a incapacidade de resolver o número incerto de variáveis, equações não lineares e desigualdade. Além disso, em algumas perguntas mais difíceis, o desempenho do Alpageometria2 não era ideal e apenas 20 das 29 perguntas foram resolvidas.
Este estudo provocou mais uma vez discussões sobre se os sistemas de IA devem se basear em operações simbólicas ou mais redes neurais do tipo cerebral. O Alphageometria2 usa uma abordagem híbrida que combina redes neurais e motores simbólicos baseados em regras. A equipe da DeepMind observa que, embora grandes modelos de idiomas possam gerar soluções parciais sem ferramentas externas, os motores simbólicos ainda são ferramentas importantes em aplicações matemáticas na situação atual.
O sucesso do alfageometria2 marca um avanço adicional na IA no campo da matemática e pode desempenhar um papel em problemas mais complexos no futuro.