又搞了个大的！Mistral AI发布数学模型MathΣtral 可解复杂数学难题

作者：Eve Cole 更新时间：2024-12-08 19:32:01

Downcodes小编获悉，Mistral AI团队发布了一款名为MathΣtral的7B数学模型，该模型拥有32k的上下文窗口，能够处理更长更复杂的数学问题，并在Apache2.0许可下开源。MathΣtral在MATH基准测试中达到了56.6%，在MMLU基准测试中达到了63.47%，通过多数投票和奖励模型，得分更是高达68.37%和74.59%。这不仅是对阿基米德2311周年的致敬，更是数学推理和科学发现领域的一大突破，展现了Mistral AI在支持学术项目方面的努力。

Mistral AI团队将MathΣtral贡献给科学界，希望加强在需要复杂、多步骤逻辑推理的高级数学问题上的研究。模型在STEM领域的专业特长，在各种行业标准基准测试中达到了同类别的先进推理能力。特别是在MATH基准测试中达到了56.6%，在MMLU基准测试中达到了63.47%。MathΣtral最引人注目的是其推理能力。这个模型证明了，通过更多的推理时间计算，可以实现明显更好的结果。在MATH基准测试中，通过多数投票，MathΣtral7B的得分高达68.37%，而在64名候选人中，通过强大的奖励模型，得分更是达到了74.59%。Mistral AI团队的这一举措，是公司支持学术项目的更广泛努力的一部分。MathΣtral的发布，是在与Project Numina合作的背景下产生的，体现了Mistral AI对学术研究的重视和支持。MathΣtral是一个指导性模型，可以根据Mistral AI的文档进行使用或微调。模型权重托管在HuggingFace上，现在，用户可以使用misstral-inference尝试MathΣtral，并使用misstral-finetune进行适配，以满足特定需求。Mistral AI的MathΣtral模型，不仅是技术上的一次飞跃，更是对数学和科学领域研究的一次深刻贡献。随着AI技术的不断发展，我们有理由相信，MathΣtral将为数学推理和科学发现带来更多的可能性和突破。

官网地址：https://mistral.ai/news/mathstral/

MathΣtral模型的开源和强大的推理能力，为数学和科学研究带来了新的工具和可能性，值得关注和期待。Downcodes小编将持续关注AI领域的新进展，为读者带来更多精彩内容。