La aplicación de la inteligencia artificial en el campo de las matemáticas ha hecho otro avance. Este logro no solo demuestra el potencial de la IA en la resolución de problemas geométricos complejos, sino que también proporciona nuevas ideas para el desarrollo futuro de los modelos generales de IA.
Recientemente, un sistema de IA desarrollado por Google Deepmind, Alphageometry2, superó con éxito el nivel promedio de los medallistas de oro de las Olímpicas de Matemáticas Internacionales (IMO) y se desempeñó bien en las preguntas de geometría. Alphageometry2 es una versión mejorada del sistema de alfageometría lanzado por Deepmind el año pasado en su última investigación, el equipo de investigación señaló que el sistema puede resolver el 84% de los problemas geométricos de IMO en los últimos 25 años.
Entonces, ¿por qué DeepMind se centraría en una competencia de matemáticas en la escuela secundaria? Probar teoremas matemáticos requiere habilidades de razonamiento y la capacidad de elegir soluciones apropiadas, y DeepMind cree que estas habilidades de resolución de problemas pueden ser cruciales para el desarrollo futuro de los modelos generales de IA.
Este verano, DeepMind también mostró un sistema que combina Alphageometry2 con Alphaproof, un modelo de IA para el razonamiento matemático formal, que resolvió cuatro de las seis preguntas en los calificadores de la OMI de 2024. Además de los problemas geométricos, este enfoque también puede extenderse a otras áreas de matemáticas y ciencias, e incluso puede ayudar con los cálculos de ingeniería complejos.
El núcleo de Alphageometry2 incluye un modelo de idioma de la familia Google Gemini y un "motor de símbolos". El modelo Gemini ayuda al motor simbólico a obtener soluciones al problema utilizando reglas matemáticas. El flujo de trabajo es: el modelo Gemini predice qué construcciones (como puntos, líneas, círculos) puede ser útil para resolver problemas, y el motor simbólico realiza un razonamiento lógico basado en estas construcciones. Después de una serie de búsquedas complejas, Alphageometry2 pudo combinar las sugerencias del modelo Gemini con principios conocidos para dibujar pruebas.
Aunque Alphageometry2 respondió con éxito 42 de los 50 problemas de la OMI, superando el puntaje promedio de los jugadores de medallas de oro, todavía hay algunas limitaciones, como la incapacidad de resolver el número incierto de variables, ecuaciones no lineales y desigualdad. Además, en algunas preguntas más difíciles, el rendimiento de Alphageometry2 no fue ideal, y solo 20 de las 29 preguntas se resolvieron.
Este estudio una vez más provocó discusiones sobre si los sistemas de IA deberían basarse en operaciones simbólicas o más redes neuronales como cerebrales. Alphageometry2 utiliza un enfoque híbrido que combina redes neuronales y motores simbólicos basados en reglas. El equipo de DeepMind señala que si bien los modelos de idiomas grandes pueden generar soluciones parciales sin herramientas externas, los motores simbólicos siguen siendo herramientas importantes en aplicaciones matemáticas en la situación actual.
El éxito de Alphageometry2 marca un mayor avance en la IA en el campo de las matemáticas, y puede desempeñar un papel en problemas más complejos en el futuro.