L'application de l'intelligence artificielle dans le domaine des mathématiques a fait une autre percée. Cette réalisation démontre non seulement le potentiel de l'IA pour résoudre des problèmes géométriques complexes, mais fournit également de nouvelles idées pour le développement futur des modèles d'IA généraux.
Récemment, un système d'IA développé par Google Deepmind, Alphageométrie2, a réussi à dépasser le niveau moyen des médaillés d'or des Jeux olympiques de mathématiques internationaux (IMO) et a bien performé dans les questions de géométrie. Alphageométrie2 est une version améliorée du système d'alphageométrie publié par DeepMind l'année dernière.
Alors, pourquoi DeepMind se concentrerait-il sur un tel concours de mathématiques du secondaire? Prouver les théorèmes mathématiques nécessite des compétences de raisonnement et la capacité de choisir des solutions appropriées, et DeepMind estime que ces capacités de résolution de problèmes peuvent être cruciales pour le développement futur des modèles d'IA généraux.
Cet été, DeepMind a également montré un système qui combine Alphageométrie2 avec Alphaproof, un modèle d'IA pour le raisonnement mathématique formel, qui a résolu quatre des six questions dans les qualifications de l'OMI 2024. Outre les problèmes géométriques, cette approche peut également s'étendre à d'autres domaines de mathématiques et de sciences, et peut même aider à des calculs d'ingénierie complexes.
Le noyau de Alphageométrie2 comprend un modèle de langue de la famille Google Gemini et un "moteur de symbole". Le modèle Gemini aide le moteur symbolique à dériver des solutions au problème en utilisant des règles mathématiques. Le flux de travail est: le modèle Gemini prédit quelles constructions (telles que les points, les lignes, les cercles) peuvent être utiles pour résoudre les problèmes, et le moteur symbolique effectue ensuite un raisonnement logique basé sur ces constructions. Après une série de recherches complexes, Alphageométrie2 a pu combiner les suggestions du modèle Gemini avec des principes connus pour dessiner des preuves.
Bien que l'alphageométrie2 ait répondu avec succès à 42 des 50 problèmes de l'OMI, dépassant le score moyen des acteurs de la médaille d'or, il y a encore certaines limites, telles que l'incapacité de résoudre le nombre incertain de variables, d'équations non linéaires et d'inégalité. De plus, sur des questions plus difficiles, les performances d'Alphageométrie2 n'étaient pas idéales et seulement 20 des 29 questions ont été résolues.
Cette étude a de nouveau déclenché des discussions sur la question de savoir si les systèmes d'IA devraient être basés sur des opérations symboliques ou des réseaux de neurones plus cérébraux. Alphageométrie2 utilise une approche hybride qui combine des réseaux de neurones et des moteurs symboliques basés sur des règles. L'équipe de DeepMind note que si les modèles de grands langues peuvent générer des solutions partielles sans outils externes, les moteurs symboliques sont toujours des outils importants dans les applications mathématiques dans la situation actuelle.
Le succès de Alphageométrie2 marque une nouvelle percée dans l'IA dans le domaine des mathématiques et pourrait jouer un rôle dans des problèmes plus complexes à l'avenir.