Einem Team von Tsinghua-Alumni gelang mit Hilfe von KI beeindruckende mathematische Durchbrüche! Der von ihnen entwickelte LeanAgent, ein KI-Assistent mit Fähigkeiten zum lebenslangen Lernen, bewies erfolgreich 162 bisher ungelöste mathematische Theoreme und löste sogar das formale Problem der von Terence Tao vorgeschlagenen polynomischen Freiman-Ruzsa-Vermutung. Dies zeigt nicht nur das enorme Potenzial von KI in der wissenschaftlichen Grundlagenforschung, sondern markiert auch eine Innovation in mathematischen Forschungsmethoden. Die Redakteure von Downcodes vermitteln Ihnen einen detaillierten Einblick in diese spannende Entwicklung und die technologische Innovation hinter LeanAgent.
In den neuesten sensationellen Nachrichten aus der Welt der Mathematik nutzte eine Gruppe von Alumni der Tsinghua-Universität die Kraft der KI, um 162 mathematische Theoreme erfolgreich zu beweisen, die noch niemand zuvor lösen konnte. Noch erstaunlicher ist, dass dieser Agent namens LeanAgent tatsächlich das Formalisierungsproblem der polynomischen Freiman-Ruzsa-Vermutung von Terence Tero gelöst hat. Das lässt uns bedauern, dass die Forschungsmethoden der Grundlagenforschung durch KI völlig verändert wurden!
Wie wir alle wissen, sind die aktuellen Sprachmodelle (LLM) zwar cool, aber die meisten davon sind immer noch statisch und können kein neues Wissen online erlernen. Noch schwieriger ist es, fortgeschrittene mathematische Theoreme zu beweisen. Bei LeanAgent, das gemeinsam von Forschungsteams des Caltech, der Stanford University und der University of Washington entwickelt wurde, handelt es sich jedoch um einen KI-Assistenten mit Fähigkeiten zum lebenslangen Lernen, der kontinuierlich Theoreme lernen und beweisen kann.
LeanAgent reagiert auf unterschiedliche mathematische Schwierigkeiten durch sorgfältig konzipierte Lernpfade und verwaltet mithilfe einer dynamischen Datenbank einen kontinuierlichen Strom mathematischen Wissens, um sicherzustellen, dass beim Erlernen neuen Wissens die bereits erlernten Fähigkeiten nicht vergessen werden. Experimente zeigen, dass es 162 mathematische Theoreme aus 23 verschiedenen Lean-Code-Bibliotheken erfolgreich bewiesen hat, und seine Leistung ist 11-mal höher als die herkömmlicher großer Modelle. Das ist wirklich erstaunlich!
Diese Theoreme decken viele Bereiche der höheren Mathematik ab, einschließlich schwieriger Probleme wie der abstrakten Algebra und der algebraischen Topologie. LeanAgent ist nicht nur in der Lage, mit einfachen Konzepten zu beginnen und nach und nach komplexe Themen anzugehen, sondern zeigt auch hervorragende Leistungen in Bezug auf Stabilität und Rückwärtsmigration.
Die Herausforderung von Terence Tao führt jedoch immer noch dazu, dass sich die KI hilflos fühlt. Obwohl interaktive Theorembeweiser (ITPs) wie Lean eine wichtige Rolle bei der Formalisierung und Verifizierung mathematischer Beweise spielen, ist der Prozess der Erstellung solcher Beweise oft komplex und zeitaufwändig und erfordert akribische Schritte und umfangreiche mathematische Codebibliotheken. Fortgeschrittene große Modelle wie o1 und Claude sind auch bei informellen Beweisen fehleranfällig, was die Mängel von LLM in Bezug auf die Genauigkeit und Zuverlässigkeit mathematischer Beweise verdeutlicht.
Frühere Forschungen haben versucht, LLM zu nutzen, um vollständige Beweisschritte zu generieren, wie zum Beispiel LeanDojo, einen Theorembeweis, der durch das Training eines großen Modells anhand eines bestimmten Datensatzes erstellt wird. Es liegen jedoch äußerst wenige Daten für formale Theorembeweise vor, was die breite Anwendbarkeit dieses Ansatzes einschränkt. Ein weiteres Projekt, ReProver, ist ein für die Lean-Theorem-Beweiscodebibliothek mathlib4 optimiertes Modell. Obwohl es mehr als 100.000 formale mathematische Theoreme und Definitionen abdeckt, ist es auf den Bereich der Bachelor-Mathematik beschränkt und schneidet daher bei komplexeren Problemen nicht gut ab Probleme.
Es ist erwähnenswert, dass die Dynamik der mathematischen Forschung größere Herausforderungen für die KI mit sich bringt. Mathematiker arbeiten normalerweise an mehreren Projekten gleichzeitig oder abwechselnd. Terence Tao treibt beispielsweise mehrere Forschungsbereiche gleichzeitig voran, darunter PFR-Vermutung und symmetrischen Durchschnitt reeller Zahlen. Diese Beispiele zeigen einen wesentlichen Mangel aktueller Methoden zum Beweisen von KI-Theoremen: das Fehlen eines KI-Systems, das in verschiedenen mathematischen Bereichen adaptiv lernen und sich verbessern kann, insbesondere wenn Lean-Daten begrenzt sind.
Aus diesem Grund hat das Team von LeanDojo LeanAgent entwickelt, ein neues Rahmenwerk für lebenslanges Lernen, das die oben genannten Herausforderungen lösen soll. Der Arbeitsablauf von LeanAgent umfasst die Ableitung der Theoremkomplexität zur Formulierung von Lernkursen, das Ausbalancieren von Stabilität und Flexibilität im Lernprozess durch progressives Training und die Verwendung der Best-First-Baumsuche, um noch unbewiesene Theoreme zu finden.
LeanAgent arbeitet mit jedem großen Modell zusammen, um dessen Generalisierungsfähigkeiten durch „Abrufen“ zu verbessern. Seine Innovation liegt in der Verwendung einer benutzerdefinierten dynamischen Datenbank zur Verwaltung des ständig wachsenden mathematischen Wissens und einer Kurslernstrategie, die auf einer Lean-Proof-Struktur basiert, um das Erlernen komplexerer mathematischer Inhalte zu erleichtern.
Um das katastrophale Vergessensproblem der KI zu bewältigen, haben Forscher eine progressive Trainingsmethode eingeführt, die es LeanAgent ermöglicht, sich kontinuierlich an neue mathematische Kenntnisse anzupassen, ohne vorheriges Lernen zu vergessen. Dieser Prozess umfasst ein inkrementelles Training für jeden neuen Datensatz und gewährleistet so ein optimales Gleichgewicht aus Stabilität und Flexibilität.
Durch diese Art des progressiven Trainings verfügt LeanAgent über hervorragende Leistungen beim Beweisen von Theoremen und beweist erfolgreich 162 schwierige Probleme, die von Menschen nicht gelöst wurden, insbesondere bei anspruchsvollen Theoremen der abstrakten Algebra und der algebraischen Topologie. Seine Fähigkeit, neue Theoreme zu beweisen, ist 11-mal höher als die von static ReProver, während seine Fähigkeit, bekannte Theoreme zu beweisen, erhalten bleibt.
LeanAgent zeigt die Merkmale des progressiven Lernens während des Theorembeweisprozesses, indem es schrittweise von einfachen Theoremen zu komplexeren Theoremen übergeht und so seine Tiefe bei der Beherrschung mathematischer Kenntnisse unter Beweis stellt. Es demonstriert beispielsweise ein tiefes Verständnis der Mathematik, indem es grundlegende algebraische Struktursätze im Zusammenhang mit der Gruppentheorie und der Ringtheorie beweist. Insgesamt bietet LeanAgent mit seinen leistungsstarken Möglichkeiten zum kontinuierlichen Lernen und zur Verbesserung spannende Perspektiven für die Mathematik-Community!
Papieradresse: https://arxiv.org/pdf/2410.06209
Das Aufkommen von LeanAgent deutet darauf hin, dass KI im Bereich der mathematischen Forschung eine immer wichtigere Rolle spielen wird und es in Zukunft möglicherweise mehr Fälle geben wird, in denen die Leistungsfähigkeit der KI zur Lösung komplexer mathematischer Probleme genutzt wird. Dies eröffnet zweifellos eine neue Richtung für die mathematische Forschung und liefert auch neue Ideen und Methoden für die Erforschung anderer wissenschaftlicher Bereiche. Ich freue mich auf weitere tolle Ergebnisse in der Zukunft!