Downcodes の編集者は、Mistral AI チームが MathΣtral と呼ばれる 7B 数学モデルをリリースしたことを知りました。これは 32k のコンテキスト ウィンドウを備え、より長く複雑な数学的問題を処理でき、Apache2.0 ライセンスの下でオープンソースです。 MathΣtral は、多数決投票と報酬モデルを通じて、MATH ベンチマークで 56.6%、MMLU ベンチマークで 63.47% を達成し、スコアは 68.37% と 74.59% に達しました。これはアルキメデスの生誕 2311 年を記念するものであるだけでなく、数学的推論と科学的発見の分野における大きな進歩でもあり、学術プロジェクトのサポートにおける Mistral AI の取り組みを示しています。
Mistral AI チームは MathΣtral を科学コミュニティに貢献し、複雑で多段階の論理的推論を必要とする高度な数学的問題の研究を強化したいと考えています。このモデルの STEM 分野における専門知識は、さまざまな業界標準のベンチマーク テストにおいて、同じカテゴリの高度な推論機能を達成しました。特に、MATH ベンチマークでは 56.6%、MMLU ベンチマークでは 63.47% を達成しました。 MathΣtral で最も驚くべき点は、その推論能力です。このモデルは、より多くの推論時間の計算を行うことで、大幅に優れた結果が得られることを示しています。 MATH ベンチマークでは、MathΣtral7B は多数決により 68.37% のスコアを達成し、強力な報酬モデルにより 64 候補中 74.59% というさらに高いスコアを達成しました。 Mistral AI チームによるこの動きは、学術プロジェクトをサポートするための同社の広範な取り組みの一環です。 MathΣtral のリリースは、Project Numina との協力の文脈で作成され、Mistral AI の学術研究への重点とサポートを反映しています。 MathΣtral は、Mistral AI のドキュメントに従って使用または微調整できるガイド付きモデルです。モデルの重みは HuggingFace でホストされており、ユーザーは misstral-inference を使用して MathΣtral を試し、mistral-finetune を使用して特定のニーズを満たすように調整できるようになりました。 Mistral AI の MathΣtral モデルは、技術の飛躍的な進歩であるだけでなく、数学と科学の分野の研究にも多大な貢献をしています。 AI テクノロジーの継続的な発展により、MathΣtral が数学的推論と科学的発見により多くの可能性とブレークスルーをもたらすと信じる理由があります。
公式サイトアドレス:https://mistral.ai/news/mathstral/
MathΣtral モデルのオープンソースと強力な推論機能は、数学と科学の研究に新しいツールと可能性をもたらし、注目と期待に値します。 Downcodes の編集者は、今後も AI 分野の新たな発展に注目し、よりエキサイティングなコンテンツを読者にお届けしていきます。