昆仑万维科技股份有限公司重磅推出其“天工大模型4.0”o1版(Skywork o1),正式启动邀请测试。 Skywork o1具备慢思考推理能力,是国内首款拥有中文逻辑推理能力的o1模型,在模型输出上内生了思考、计划、反思等能力,并在标准评测集上的推理能力得到显着提升。此次发布包含三款模型:Skywork o1Open、Skywork o1Lite和Skywork o1Preview,满足不同用户的需求。这标志着昆仑万维在通用人工智能领域取得了重大突破,也预示着未来人工智能应用将迈向更高层次。
Skywork o1是昆仑万维集团发布的系列模型,具备慢思考推理能力,是国内首款拥有中文逻辑推理能力的o1模型。该模型不仅在模型输出上内生了思考、计划、反思等能力,而且在标准评测集上的推理能力相较于普通模型有显着提升。此次发布的Skywork o1包括三款模型:Skywork o1Open、Skywork o1Lite和Skywork o1Preview,其中Skywork o1Open是基于Llama3.18B的开源模型,Skywork o1Lite具备完整的思考能力,而Skywork o1Preview则提供了更多样化和深入的思考过程。
昆仑万维集团表示,Skywork o1Open在数学和代码指标上均有大幅提高,将Llama-3.1-8B的性能提升至同生态位SOTA水平,并解锁了许多轻量级模型无法解决的复杂数学任务。此外,公司还将开源两个推理任务的Process Reward Model(PRM):Skywork o1Open-PRM-1.5B 和Skywork o1Open-PRM-7B,这些模型能够对每个步骤进行打分,提升了推理和思考能力。
Skywork o1在逻辑推理任务上的性能提升得益于昆仑万维自研的训练方案,包括推理反思能力训练、推理能力强化学习和推理planning。这些技术的应用使得Skywork o1在常识推理、逻辑推理、数学推理、伦理决策等问题上表现出色。
昆仑万维强调,Skywork o1的发布不仅是公司“All in AGI 与AIGC”战略的重要举措,也是构建AI技术栈的重要一步。公司将继续致力于实现通用人工智能,让每个人更好地塑造和表达自我。
尝鲜地址:www.tiangong.cn
Skywork o1的推出展现了昆仑万维在人工智能领域的强大实力和创新能力,其在逻辑推理上的突破将推动人工智能技术进一步发展,为用户带来更智能、更便捷的体验。期待未来Skywork o1能有更多令人惊喜的表现。