Sebuah tim alumni Tsinghua mencapai terobosan matematika yang mengesankan dengan bantuan AI! LeanAgent yang mereka kembangkan, asisten AI dengan kemampuan belajar seumur hidup, berhasil membuktikan 162 teorema matematika yang sebelumnya belum terpecahkan dan bahkan memecahkan masalah formal dugaan polinomial Freiman-Ruzsa yang diajukan oleh Terence Tao. Hal ini tidak hanya menunjukkan potensi besar AI dalam penelitian ilmiah dasar, tetapi juga menandai sebuah inovasi dalam metode penelitian matematika. Editor downcode akan memberi Anda pemahaman mendalam tentang perkembangan menarik ini dan inovasi teknologi di balik LeanAgent.
Dalam berita sensasional terkini di dunia matematika, sekelompok alumni Universitas Tsinghua menggunakan kekuatan AI untuk berhasil membuktikan 162 teorema matematika yang belum pernah bisa dipecahkan oleh siapa pun sebelumnya. Yang lebih menakjubkan lagi adalah agen bernama LeanAgent ini benar-benar mengatasi masalah formalisasi dugaan polinomial Freiman-Ruzsa Terence Tero! Hal ini membuat kami menyesalkan bahwa metode penelitian ilmu dasar telah sepenuhnya diubah oleh AI.
Seperti kita ketahui bersama, meskipun model bahasa (LLM) yang ada saat ini sudah keren, namun sebagian besar masih statis dan tidak dapat mempelajari ilmu baru secara online, bahkan lebih sulit lagi untuk membuktikan teorema matematika tingkat lanjut. Namun, LeanAgent, yang dikembangkan bersama oleh tim peneliti dari Caltech, Stanford University, dan University of Washington, merupakan asisten AI dengan kemampuan pembelajaran seumur hidup yang dapat terus mempelajari dan membuktikan teorema.
LeanAgent merespons berbagai kesulitan matematika melalui jalur pembelajaran yang dirancang dengan cermat, dan menggunakan database dinamis untuk mengelola aliran pengetahuan matematika yang berkelanjutan untuk memastikan bahwa ia tidak melupakan keterampilan yang telah dikuasainya saat mempelajari pengetahuan baru. Eksperimen menunjukkan bahwa ia berhasil membuktikan 162 teorema matematika yang belum pernah dipecahkan oleh siapa pun sebelumnya dari 23 pustaka kode Lean yang berbeda, dan kinerjanya 11 kali lebih tinggi dibandingkan model besar tradisional.
Teorema ini mencakup banyak bidang matematika tingkat tinggi, termasuk permasalahan sulit seperti aljabar abstrak dan topologi aljabar. LeanAgent tidak hanya mampu memulai dengan konsep sederhana dan secara bertahap menangani topik yang kompleks, namun juga menunjukkan kinerja yang sangat baik dalam hal stabilitas dan migrasi balik.
Namun tantangan Terence Tao tetap membuat AI merasa tidak berdaya. Meskipun pembukti teorema interaktif (ITP) seperti Lean memainkan peran penting dalam memformalkan dan memverifikasi bukti matematis, proses membangun bukti tersebut seringkali rumit dan memakan waktu, memerlukan langkah-langkah yang cermat dan perpustakaan kode matematika yang luas. Model besar tingkat lanjut seperti o1 dan Claude juga rentan terhadap kesalahan saat dihadapkan dengan pembuktian informal, yang menyoroti kekurangan LLM dalam keakuratan dan keandalan pembuktian matematis.
Penelitian sebelumnya telah mencoba menggunakan LLM untuk menghasilkan langkah-langkah pembuktian yang lengkap, seperti LeanDojo, yang merupakan pembuktian teorema yang dibuat dengan melatih model besar pada kumpulan data tertentu. Namun, data untuk pembuktian teorema formal sangat langka, sehingga membatasi penerapan pendekatan ini secara luas. Proyek lainnya, ReProver, adalah model yang dioptimalkan untuk pustaka kode pembuktian teorema Lean mathlib4. Meskipun mencakup lebih dari 100.000 teorema dan definisi matematika formal, proyek ini terbatas pada cakupan matematika tingkat sarjana, sehingga tidak berfungsi dengan baik saat menghadapi yang lebih kompleks. masalah. bagus.
Perlu dicatat bahwa sifat penelitian matematika yang dinamis membawa tantangan yang lebih besar bagi AI. Matematikawan biasanya mengerjakan beberapa proyek secara bersamaan atau bergantian. Misalnya, Terence Tao mengembangkan beberapa bidang penelitian secara bersamaan, termasuk dugaan PFR dan rata-rata simetris bilangan real. Contoh-contoh ini menunjukkan kelemahan utama metode pembuktian teorema AI saat ini: kurangnya sistem AI yang dapat belajar dan meningkatkan secara adaptif dalam berbagai bidang matematika, terutama ketika data Lean terbatas.
Itu sebabnya tim di LeanDojo menciptakan LeanAgent, kerangka pembelajaran seumur hidup baru yang dirancang untuk memecahkan tantangan di atas. Alur kerja LeanAgent mencakup memperoleh kompleksitas teorema untuk merumuskan kursus pembelajaran, menyeimbangkan stabilitas dan fleksibilitas dalam proses pembelajaran melalui pelatihan progresif, dan memanfaatkan pencarian pohon terbaik pertama untuk menemukan teorema yang belum terbukti.
LeanAgent bekerja dengan model besar apa pun untuk meningkatkan kemampuan generalisasinya melalui "pengambilan". Inovasinya terletak pada penggunaan database dinamis khusus untuk mengelola pengetahuan matematika yang terus berkembang, dan strategi pembelajaran kursus berdasarkan struktur bukti Lean untuk membantu mempelajari konten matematika yang lebih kompleks.
Untuk mengatasi masalah lupa yang disebabkan oleh AI, para peneliti mengadopsi metode pelatihan progresif yang memungkinkan LeanAgent terus beradaptasi dengan pengetahuan matematika baru tanpa melupakan pembelajaran sebelumnya. Proses ini melibatkan pelatihan tambahan pada setiap kumpulan data baru, memastikan keseimbangan optimal antara stabilitas dan fleksibilitas.
Melalui pelatihan progresif semacam ini, LeanAgent memiliki kinerja yang sangat baik dalam pembuktian teorema, berhasil membuktikan 162 permasalahan sulit yang belum diselesaikan oleh manusia, terutama dalam menantang teorema aljabar abstrak dan topologi aljabar. Kemampuannya untuk membuktikan teorema baru 11 kali lebih tinggi dibandingkan ReProver statis, dengan tetap mempertahankan kemampuannya untuk membuktikan teorema yang diketahui.
LeanAgent menunjukkan ciri-ciri pembelajaran progresif selama proses pembuktian teorema, transisi bertahap dari teorema sederhana ke teorema yang lebih kompleks, membuktikan kedalamannya dalam penguasaan pengetahuan matematika. Misalnya, menunjukkan pemahaman mendalam tentang matematika dengan membuktikan teorema dasar struktur aljabar yang berkaitan dengan teori grup dan teori ring. Secara keseluruhan, LeanAgent menghadirkan prospek menarik bagi komunitas matematika dengan kemampuan pembelajaran dan peningkatan berkelanjutan yang kuat!
Alamat makalah: https://arxiv.org/pdf/2410.06209
Munculnya LeanAgent menunjukkan bahwa AI akan memainkan peran yang semakin penting dalam bidang penelitian matematika, dan mungkin akan ada lebih banyak kasus di masa depan yang menggunakan kekuatan AI untuk memecahkan masalah matematika yang kompleks. Hal ini tentunya membuka arah baru bagi penelitian matematika, dan juga memberikan ide dan metode baru untuk eksplorasi di bidang ilmu pengetahuan lainnya. Menantikan hasil yang lebih menakjubkan di masa depan!