Google Deepmindの最新のAIシステムであるAlphageometry2は、幾何学的問題の解決に大きな進歩を遂げ、国際数学オリンピック(IMO)競争で平均的な金メダリストを上回りました。この画期的な成果は、数学の分野におけるAIの可能性を実証するだけでなく、一般的なAIの開発のための新しい方向性も提供します。
Google Deepmind Research Labによって開始された最新のAIシステムであるAlphageometry2は、幾何学的問題の解決に優れており、国際数学オリンピック(IMO)競争で平均的な金メダリストを上回りました。このシステムは、アルファージ測定の改善されたバージョンと見なされており、研究者は、Alphageometry2が過去25年間でIMOの幾何学的問題の84%を解決できると述べています。
Deepmindは、このような高校の数学競技に焦点を当てているのはなぜですか?数学定理または説明定理(ピタゴラス定理など)が保持する理由を証明するには、論理的な推論と複数の可能なステップを選択する能力が必要です。 DeepMindの理論が当てはまる場合、これらの問題解決能力は、将来の一般的なAIモデルにとって非常に重要です。
この夏、DeepMindは、Alphageometry2と数学的推論AIモデルアルファプルーフを組み合わせたシステムを実証しました。これは、2024 IMOの6つの問題のうち4つを解決しました。幾何学的な問題に加えて、このアプローチは、複雑な工学計算など、他の数学的および科学的分野に拡張できます。
Alphageometry2のコアコンポーネントには、Google Geminiシリーズの言語モデルと「シンボルエンジン」が含まれます。 Geminiモデルは、象徴的なエンジンが数学的ルールを通じて問題に対して実行可能な解決策を推測するのに役立ちます。 IMOの幾何学的な問題は通常、ポイント、線、円などの「構築」で追加する必要がある数値に基づいています。 Alphageometry2のGeminiモデルは、問題の解決に役立つ構成要素を予測できます。
IMOの問題を解決する際、Alphageometry2は、TrainingのためにDeepMind自体によって生成された3億人以上の定理と証明合成データを使用していることに注意してください。研究チームは、過去25年間にIMOの45の幾何学的問題を選択し、それらを拡大して50の問題を形成しました。 Alphageometry2はそれらの42を正常に解決し、金メダリストの平均スコアを超えました。
ただし、Alphageometry2には、変数数ポイント、非線形方程式、および不平等の問題を解決できないなど、いくつかの制限があります。それにもかかわらず、この研究は、AIシステムがシンボリック操作またはニューラルネットワークに基づいているべきかどうかについての議論を引き起こしました。 Alphageometry2は、ニューラルネットワークとルールベースのシンボリックエンジンを組み合わせたハイブリッドアプローチを採用しています。
Alphageometry2の成功は、汎用AIの将来の発展のための新しい方向性を提供します。まだ完全には自給自足ではありませんが、DeepMindチームによる研究は、将来、より自給自足のAIモデルが利用可能になる可能性があることを示しています。
紙の入り口:https://arxiv.org/pdf/2502.03544
キーポイント:
Alphageometry2は、過去25年間でIMOの幾何学的問題の84%を解決することができ、金メダリストの平均スコアを超えています。
このシステムは、ニューラルネットワークとシンボルエンジンを組み合わせて、ハイブリッドアプローチを使用して複雑な数学的問題を解決します。
DeepMindは、幾何学的問題を解決することにより、より強力な一般的なAIの研究の進歩を促進したいと考えています。
Alphageometry2の成功は、数学の分野におけるAIの可能性を示しているだけでなく、一般的なAIの開発のための新しい方向性も提供します。将来、テクノロジーの継続的な進歩により、AIはより多くの分野で強力な能力を示します。