Sistem AI terbaru Google DeepMind, Alphageometry2, telah membuat kemajuan yang signifikan dalam memecahkan masalah geometris, melampaui rata -rata peraih medali emas dalam kompetisi Olimpiade Matematika Internasional (IMO). Pencapaian terobosan ini tidak hanya menunjukkan potensi AI di bidang matematika, tetapi juga memberikan arah baru untuk pengembangan AI umum.
Alphageometry2, sistem AI terbaru yang diluncurkan oleh Google DeepMind Research Lab, unggul dalam memecahkan masalah geometris, melampaui rata -rata peraih medali emas dalam kompetisi Olimpiade Matematika Internasional (IMO). Sistem ini dianggap sebagai versi alfageometri yang lebih baik, dan para peneliti mengatakan Alphageometry2 dapat menyelesaikan 84% masalah geometris di IMO selama 25 tahun terakhir.
Mengapa DeepMind fokus pada kompetisi matematika sekolah menengah seperti itu? Membuktikan mengapa teorema matematika atau teorema penjelasan (seperti teorema Pythagoras) memerlukan penalaran logis dan kemampuan untuk memilih beberapa langkah yang memungkinkan. Jika teori DeepMind berlaku, kemampuan pemecahan masalah ini akan sangat penting untuk model AI umum di masa depan.
Musim panas ini, DeepMind menunjukkan sistem yang menggabungkan alphageometry2 dengan penalaran matematika model AI Alphaproof, yang memecahkan empat dari enam masalah IMO 2024. Selain masalah geometris, pendekatan ini dapat diperluas ke bidang matematika dan ilmiah lainnya, seperti perhitungan teknik yang kompleks.
Komponen inti dari Alphageometry2 termasuk model bahasa dari seri Google Gemini dan "mesin simbol". Model Gemini membantu mesin simbolik menyimpulkan solusi yang layak untuk masalah melalui aturan matematika. Masalah geometris dengan IMO biasanya didasarkan pada angka yang perlu ditambahkan dengan "dibangun", seperti titik, garis, atau lingkaran. Model Gemini Alphageometry2 dapat memprediksi konstruksi mana yang dapat membantu dalam menyelesaikan masalah.
Perlu dicatat bahwa ketika menyelesaikan masalah IMO, Alphageometry2 menggunakan lebih dari 300 juta teorema dan bukti data sintetis yang dihasilkan oleh DeepMind sendiri untuk pelatihan. Tim peneliti memilih 45 masalah geometris untuk IMO selama 25 tahun terakhir dan memperluasnya untuk membentuk serangkaian 50 masalah. Alphageometry2 berhasil memecahkan 42 dari mereka, melampaui skor rata -rata peraih medali emas.
Namun, Alphageometry2 masih memiliki beberapa keterbatasan, seperti tidak dapat menyelesaikan masalah dengan titik bilangan variabel, persamaan nonlinier, dan ketidaksetaraan. Namun demikian, penelitian ini telah memicu diskusi tentang apakah sistem AI harus didasarkan pada operasi simbolik atau jaringan saraf. Alphageometry2 mengadopsi pendekatan hibrida yang menggabungkan jaringan saraf dan mesin simbolik berbasis aturan.
Keberhasilan Alphageometry2 memberikan arah baru untuk pengembangan AI tujuan umum di masa depan. Meskipun belum sepenuhnya mandiri, penelitian oleh tim DeepMind menunjukkan bahwa model AI yang lebih mandiri mungkin tersedia di masa depan.
Pintu masuk kertas: https://arxiv.org/pdf/2502.03544
Poin -Poin Kunci:
Alphageometry2 mampu menyelesaikan 84% masalah geometris di IMO selama 25 tahun terakhir, melampaui skor rata -rata peraih medali emas.
Sistem ini menggabungkan jaringan saraf dan mesin simbol untuk memecahkan masalah matematika yang kompleks menggunakan pendekatan hibrida.
DeepMind berharap untuk mempromosikan kemajuan penelitian pada AI umum yang lebih kuat dengan menyelesaikan masalah geometris.
Keberhasilan Alphageometry2 tidak hanya menunjukkan potensi AI di bidang matematika, tetapi juga memberikan arah baru untuk pengembangan AI umum. Di masa depan, dengan kemajuan teknologi yang berkelanjutan, AI akan menunjukkan kemampuan yang kuat di lebih banyak bidang.