数学の分野での人工知能の適用は、Google Deepmindの最新のAIシステムであるAlphageometry2を別のブレークスルーにしました。この成果は、複雑な幾何学的問題を解決する際のAIの可能性を実証するだけでなく、一般的なAIモデルの将来の発展に新しいアイデアを提供します。
最近、Google Deepmind、Alphageometry2によって開発されたAIシステムは、国際数学オリンピック(IMO)の金メダリストの平均レベルをうまく上回り、幾何学的な質問でうまく機能しました。 Alphageometry2は、昨年のDeepMindによってリリースされたAlphageometryシステムのアップグレードバージョンであり、研究チームは、このシステムが過去25年間でIMOの幾何学的問題の84%を解決できることを指摘しました。
では、なぜこのような高校の数学の競争に焦点を当てているのでしょうか?数学定理を証明するには、推論スキルと適切なソリューションを選択する能力が必要であり、DeepMindは、これらの問題解決能力が一般的なAIモデルの将来の発展にとって重要である可能性があると考えています。
この夏、DeepMindは、2024年のIMO予選で6つの質問のうち4つを解決した正式な数学的推論のAIモデルであるAlphageometry2とAlphaproofを組み合わせたシステムを示しました。幾何学的な問題とは別に、このアプローチは数学や科学の他の領域にも拡張される可能性があり、複雑なエンジニアリングの計算を支援することさえできます。
Alphageometry2のコアには、Google Geminiファミリーの言語モデルと「シンボルエンジン」が含まれています。 Geminiモデルは、象徴的なエンジンが数学的ルールを使用して問題の解決策を導き出すのに役立ちます。ワークフローは次のとおりです。Geminiモデルは、どの構成要素(ポイント、ライン、円など)が問題の解決に役立つ可能性があるかを予測し、シンボリックエンジンはこれらの構成に基づいて論理的な推論を実行します。一連の複雑な検索の後、Alphageometry2はGeminiモデルの提案を既知の原則と既知の原則と組み合わせることができました。
Alphageometry2は、金メダルプレーヤーの平均スコアを超える50のIMO問題のうち42に成功しましたが、不確実な数の変数、非線形方程式、不平等を解決できないなど、いくつかの制限があります。さらに、いくつかのより難しい質問では、Alphageometry2のパフォーマンスは理想的ではなく、29の質問のうち20のみが解決されました。
この研究は、AIシステムがシンボリック操作またはより脳のようなニューラルネットワークに基づいているべきかどうかについての議論を再び引き起こしました。 Alphageometry2は、ニューラルネットワークとルールベースのシンボリックエンジンを組み合わせたハイブリッドアプローチを使用します。 DeepMindのチームは、大規模な言語モデルは外部ツールなしで部分的なソリューションを生成する可能性があるが、シンボリックエンジンは現在の状況では数学的アプリケーションの重要なツールであると述べています。
Alphageometry2の成功は、数学の分野におけるAIでのさらなるブレークスルーを示し、将来より複雑な問題で役割を果たす可能性があります。