北京月之暗面科技有限公司近日宣布其智能助手Kimi迎来重大升级,推出了k1.5多模态思考模型。该模型在多模态推理和通用推理能力上超越了包括GPT-4o和Claude3.5Sonnet在内的多个国际领先模型,实现了OpenAI之外公司首次达到o1正式版的多模态推理性能。这一突破标志着Kimi在人工智能领域取得了显着进展,其背后的技术创新和团队努力值得关注。此次升级不仅提升了Kimi的数学、代码和视觉多模态处理能力,更通过长上下文扩展和改进的策略优化方法,显着增强了模型的深度推理能力,为用户解决复杂问题提供了有力支持。
近日,北京月之暗面科技有限公司宣布其旗下智能助手Kimi 迎来了重大技术升级,推出了全新的k1.5多模态思考模型。这一模型在多模态推理和通用推理能力上达到了行业领先水平,标志着Kimi 在人工智能领域的又一次突破性进展。
k1.5多模态思考模型是Kimi 在短短三个月内第三次对其k 系列强化学习模型进行重磅升级。继去年11月发布的k0-math 数学模型和12月发布的k1视觉思考模型之后,k1.5模型在基准测试中表现卓越。在short-CoT 模式下,k1.5的数学、代码、视觉多模态和通用能力大幅超越了全球范围内短思考SOTA 模型GPT-4o 和Claude3.5Sonnet 的水平,领先幅度高达550%。而在long-CoT 模式下,k1.5的数学、代码和多模态推理能力也达到了长思考SOTA 模型OpenAI o1正式版的水平,这在全球范围内是OpenAI 之外的公司首次实现o1正式版的多模态推理性能。
此次升级的背后是Kimi 技术团队的不懈努力和创新。团队首次公开了详细的模型训练技术报告《Kimi k1.5:借助大语言模型实现强化学习的Scaling》,记录了新技术范式下的模型训练探索之路。
报告指出,k1.5模型的关键创新包括长上下文扩展,通过部分展开技术提高训练效率,同时观察到上下文长度的增加能够持续提升模型性能。此外,改进的策略优化方法和简洁的框架设计也为模型的强大性能提供了支持。值得注意的是,k1.5模型在文本和视觉数据上进行了联合训练,具备了联合推理两种模态的能力,尤其在数学能力方面表现出色,尽管在处理部分依赖图形理解的几何图形题时仍存在挑战。
为了进一步提升短链思维推理能力,团队还提出了有效的long2short 方法,利用Long-CoT 技术改进Short-CoT 模型,在AIME、MATH500和LiveCodeBench 等测试中取得了显著成绩,大幅超越了现有的短链思维模型,如GPT-4和Claude Sonnet3.5。
k1.5多模态思考模型的预览版将陆续灰度上线Kimi.com 网站和最新版本的Kimi 智能助手app。用户在使用过程中如果发现模型切换按钮,即可体验这一全新升级的模型。 k1.5模型擅长深度推理,能够帮助用户解决复杂的代码问题、数学问题和工作难题。
月之暗面科技有限公司表示,2025年将继续沿着既定路线图加速升级k 系列强化学习模型,带来更多模态、更多领域的能力和更强的通用能力,为用户解锁更多可能性。
github 报告链接:https://github.com/MoonshotAI/kimi-k1.5
Kimi k1.5模型的升级展现了月之暗面科技在人工智能领域的持续创新能力,其领先的技术水平和未来发展规划值得期待。相信未来Kimi将为用户带来更强大的智能化体验。