Downcodes小编获悉,Mistral AI团队发布了一款名为MathΣtral的7B数学模型,该模型拥有32k的上下文窗口,能够处理更长更复杂的数学问题,并在Apache2.0许可下开源。MathΣtral在MATH基准测试中达到了56.6%,在MMLU基准测试中达到了63.47%,通过多数投票和奖励模型,得分更是高达68.37%和74.59%。这不仅是对阿基米德2311周年的致敬,更是数学推理和科学发现领域的一大突破,展现了Mistral AI在支持学术项目方面的努力。
Mistral AI团队将MathΣtral贡献给科学界,希望加强在需要复杂、多步骤逻辑推理的高级数学问题上的研究。模型在STEM领域的专业特长,在各种行业标准基准测试中达到了同类别的先进推理能力。特别是在MATH基准测试中达到了56.6%,在MMLU基准测试中达到了63.47%。MathΣtral最引人注目的是其推理能力。这个模型证明了,通过更多的推理时间计算,可以实现明显更好的结果。在MATH基准测试中,通过多数投票,MathΣtral7B的得分高达68.37%,而在64名候选人中,通过强大的奖励模型,得分更是达到了74.59%。Mistral AI团队的这一举措,是公司支持学术项目的更广泛努力的一部分。MathΣtral的发布,是在与Project Numina合作的背景下产生的,体现了Mistral AI对学术研究的重视和支持。MathΣtral是一个指导性模型,可以根据Mistral AI的文档进行使用或微调。模型权重托管在HuggingFace上,现在,用户可以使用misstral-inference尝试MathΣtral,并使用misstral-finetune进行适配,以满足特定需求。Mistral AI的MathΣtral模型,不仅是技术上的一次飞跃,更是对数学和科学领域研究的一次深刻贡献。随着AI技术的不断发展,我们有理由相信,MathΣtral将为数学推理和科学发现带来更多的可能性和突破。
官网地址:https://mistral.ai/news/mathstral/
MathΣtral模型的开源和强大的推理能力,为数学和科学研究带来了新的工具和可能性,值得关注和期待。Downcodes小编将持续关注AI领域的新进展,为读者带来更多精彩内容。