月之暗面Kimi智能助手发布了新一代数学推理模型k0-math,并在多个数学基准测试中取得了优异成绩,超越了OpenAI o1系列的部分模型。k0-math在中考、高考、考研以及MATH测试中表现突出,尤其在MATH测试中得分高达93.8,仅次于o1完全版的94.8分。该模型采用全新的强化学习和思维链推理技术,模拟人脑的思考过程,提升了其解决数学难题的能力。虽然在竞赛级别的测试中还有提升空间,但k0-math展现了巨大的潜力。
特别是在MATH测试中,k0-math模型得分93.8,仅次于o1完全版的94.8分。尽管在竞赛级别的OMNI-MATH和AIME基准测试中,k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%,但公司计划持续迭代,以提升更难题目的解题能力。
k0-math模型采用了全新的强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升了解决数学难题的能力。
该模型在解题过程中会花费更多时间进行推理,包括思考和规划思路,并在必要时自行反思改进解题思路,以提升答题成功率。
尽管k0-math模型在解答大部分有难度的数学题方面表现出色,但当前版本还无法解答LaTeX格式难以描述的几何图形类问题,且对于过于简单的数学问题可能会过度思考,对高考难题和IMO题目也有一定概率做错。
k0-math的推出标志着月之暗面Kimi在AI数学推理领域取得了重要进展,未来将持续改进,力求在更高级别的数学挑战中取得突破。 其独特的思维链推理技术也为人工智能发展提供了新的思路。