Un ancien élève de Tsinghua a utilisé l’IA pour vaincre 162 théorèmes mathématiques, et cela n’a même pas pu résoudre les problèmes de Terence Tao !

Auteur：Eve Cole Date de mise à jour：2025-03-02 06:00:02

Une équipe d’anciens élèves de Tsinghua a réalisé des percées mathématiques impressionnantes avec l’aide de l’IA ! Le LeanAgent qu'ils ont développé, un assistant d'IA doté de capacités d'apprentissage tout au long de la vie, a prouvé avec succès 162 théorèmes mathématiques non résolus et a même résolu le problème formel de la conjecture polynomiale de Freiman-Ruzsa proposée par Terence Tao. Cela démontre non seulement l’énorme potentiel de l’IA dans la recherche scientifique fondamentale, mais marque également une innovation dans les méthodes de recherche mathématique. Les éditeurs de downcodes vous donneront une compréhension approfondie de ce développement passionnant et de l'innovation technologique derrière LeanAgent.

Dans les dernières nouvelles sensationnelles dans le monde des mathématiques, un groupe d'anciens élèves de l'Université Tsinghua a utilisé la puissance de l'IA pour prouver avec succès 162 théorèmes mathématiques que personne n'avait été capable de résoudre auparavant. Ce qui est encore plus étonnant, c'est que cet agent nommé LeanAgent a effectivement surmonté le problème de formalisation de Terence Tero de la conjecture polynomiale de Freiman-Ruzsa. Cela nous fait déplorer que les méthodes de recherche en sciences fondamentales aient été complètement transformées par l'IA !

Comme nous le savons tous, bien que les modèles de langage actuels (LLM) soient sympas, la plupart d'entre eux sont encore statiques et ne peuvent pas apprendre de nouvelles connaissances en ligne. Il est encore plus difficile de prouver des théorèmes mathématiques avancés. Cependant, LeanAgent, développé conjointement par des équipes de recherche de Caltech, de l'Université de Stanford et de l'Université de Washington, est un assistant d'IA doté de capacités d'apprentissage tout au long de la vie, capable d'apprendre et de prouver en permanence des théorèmes.

LeanAgent répond à différentes difficultés mathématiques à travers des parcours d'apprentissage soigneusement conçus et utilise une base de données dynamique pour gérer un flux continu de connaissances mathématiques afin de garantir qu'il n'oublie pas les compétences déjà maîtrisées lors de l'apprentissage de nouvelles connaissances. Les expériences montrent qu'il a prouvé avec succès 162 théorèmes mathématiques que personne n'avait pu résoudre auparavant à partir de 23 bibliothèques de codes Lean différentes, et ses performances sont 11 fois supérieures à celles des grands modèles traditionnels.

Ces théorèmes couvrent de nombreux domaines des mathématiques supérieures, y compris des problèmes difficiles tels que l'algèbre abstraite et la topologie algébrique. Non seulement LeanAgent est capable de partir de concepts simples et d’aborder progressivement des sujets complexes, mais il démontre également d’excellentes performances en termes de stabilité et de migration inverse.

Cependant, le défi de Terence Tao rend toujours l'IA impuissante. Bien que les démonstrateurs de théorèmes interactifs (ITP) tels que Lean jouent un rôle important dans la formalisation et la vérification des preuves mathématiques, le processus de construction de telles preuves est souvent complexe et prend du temps, nécessitant des étapes méticuleuses et de vastes bibliothèques de codes mathématiques. Les grands modèles avancés comme o1 et Claude sont également sujets à des erreurs lorsqu'ils sont confrontés à des preuves informelles, ce qui met en évidence les lacunes du LLM en termes d'exactitude et de fiabilité des preuves mathématiques.

Des recherches antérieures ont tenté d'utiliser LLM pour générer des étapes de preuve complètes, comme LeanDojo, qui est un prouveur de théorème créé en entraînant un grand modèle sur un ensemble de données spécifique. Cependant, les données sur les preuves formelles de théorèmes sont extrêmement rares, ce qui limite l’applicabilité généralisée de cette approche. Un autre projet, ReProver, est un modèle optimisé pour la bibliothèque de codes de preuve de théorème Lean mathlib4. Bien qu'il couvre plus de 100 000 théorèmes et définitions mathématiques formelles, il est limité au champ d'application des mathématiques de premier cycle, il ne fonctionne donc pas bien face à des problèmes plus complexes. des problèmes.

Il convient de noter que la nature dynamique de la recherche mathématique pose de plus grands défis à l’IA. Les mathématiciens travaillent généralement sur plusieurs projets en même temps ou alternativement. Par exemple, Terence Tao fait progresser plusieurs domaines de recherche en même temps, notamment la conjecture PFR et la moyenne symétrique des nombres réels. Ces exemples montrent une lacune clé des méthodes actuelles de démonstration des théorèmes de l’IA : l’absence d’un système d’IA capable d’apprendre et de s’améliorer de manière adaptative dans différents domaines mathématiques, en particulier lorsque les données Lean sont limitées.

C'est pourquoi l'équipe de LeanDojo a créé LeanAgent, un nouveau cadre d'apprentissage tout au long de la vie conçu pour résoudre les défis ci-dessus. Le flux de travail de LeanAgent comprend la dérivation de la complexité des théorèmes pour formuler des cours d'apprentissage, l'équilibre entre stabilité et flexibilité dans le processus d'apprentissage grâce à une formation progressive et l'utilisation de la recherche arborescente du meilleur premier pour trouver des théorèmes non encore prouvés.

LeanAgent fonctionne avec n'importe quel grand modèle pour améliorer ses capacités de généralisation grâce à la « récupération ». Son innovation réside dans l'utilisation d'une base de données dynamique personnalisée pour gérer des connaissances mathématiques en constante expansion, et d'une stratégie d'apprentissage de cours basée sur une structure de preuve Lean pour aider à apprendre un contenu mathématique plus complexe.

Pour faire face au problème catastrophique de l’oubli de l’IA, les chercheurs ont adopté une méthode de formation progressive pour permettre à LeanAgent de s’adapter continuellement aux nouvelles connaissances mathématiques sans oublier les apprentissages antérieurs. Ce processus implique une formation progressive sur chaque nouvel ensemble de données, garantissant un équilibre optimal entre stabilité et flexibilité.

Grâce à ce type de formation progressive, LeanAgent a d'excellentes performances dans la démonstration de théorèmes, prouvant avec succès 162 problèmes difficiles qui n'ont pas été résolus par les humains, en particulier dans les théorèmes difficiles d'algèbre abstraite et de topologie algébrique. Sa capacité à prouver de nouveaux théorèmes est 11 fois supérieure à celle du ReProver statique, tout en conservant sa capacité à prouver des théorèmes connus.

LeanAgent montre les caractéristiques de l'apprentissage progressif au cours du processus de preuve des théorèmes, passant progressivement de théorèmes simples à des théorèmes plus complexes, prouvant ainsi sa profondeur dans la maîtrise des connaissances mathématiques. Par exemple, il démontre une compréhension approfondie des mathématiques en prouvant les théorèmes fondamentaux de structure algébrique liés à la théorie des groupes et à la théorie des anneaux. Dans l’ensemble, LeanAgent apporte des perspectives passionnantes à la communauté mathématique grâce à ses puissantes capacités d’apprentissage et d’amélioration continue !

Adresse papier : https://arxiv.org/pdf/2410.06209

L’émergence de LeanAgent indique que l’IA jouera un rôle de plus en plus important dans le domaine de la recherche mathématique et qu’il pourrait y avoir davantage de cas à l’avenir utilisant la puissance de l’IA pour résoudre des problèmes mathématiques complexes. Cela ouvre sans aucun doute une nouvelle direction à la recherche mathématique et fournit également de nouvelles idées et méthodes d’exploration dans d’autres domaines scientifiques. Dans l’attente de résultats encore plus étonnants à l’avenir !