崑崙萬維「天工大模型4.0」o1版Skywork o1正式啟動邀請測試

作者：Eve Cole 更新時間：2024-11-28 12:00:02

昆仑万维重磅发布天工大模型4.0 o1版（Skywork o1），正式开启邀请测试！Skywork o1 作为国内首款拥有中文逻辑推理能力的o1模型，具备慢思考推理能力，在模型输出上内生了思考、计划、反思等能力，并在标准评测集上的推理能力显著提升。此次发布的三款模型：Skywork o1Open、Skywork o1Lite和Skywork o1Preview，分别针对不同需求，展现了昆仑万维在通用人工智能领域的突破性进展，标志着其“All in AGI 与 AIGC”战略的又一重要里程碑。

昆仑万维科技股份有限公司宣布，其旗下的「天工大模型4.0」o1版（Skywork o1）正式启动邀请测试。这一消息标志着公司在通用人工智能领域迈出了重要一步，旨在通过技术创新实现更高层次的人工智能应用。

Skywork o1是昆仑万维集团发布的系列模型，具备慢思考推理能力，是国内首款拥有中文逻辑推理能力的o1模型。该模型不仅在模型输出上内生了思考、计划、反思等能力，而且在标准评测集上的推理能力相较于普通模型有显著提升。此次发布的Skywork o1包括三款模型:Skywork o1Open、Skywork o1Lite和Skywork o1Preview，其中Skywork o1Open是基于Llama3.18B的开源模型，Skywork o1Lite具备完整的思考能力，而Skywork o1Preview则提供了更多样化和深入的思考过程。

昆仑万维集团表示，Skywork o1Open在数学和代码指标上均有大幅提高，将Llama-3.1-8B的性能提升至同生态位SOTA水平，并解锁了许多轻量级模型无法解决的复杂数学任务。此外，公司还将开源两个推理任务的Process Reward Model（PRM）:Skywork o1Open-PRM-1.5B 和Skywork o1Open-PRM-7B，这些模型能够对每个步骤进行打分，提升了推理和思考能力。

Skywork o1在逻辑推理任务上的性能提升得益于昆仑万维自研的训练方案，包括推理反思能力训练、推理能力强化学习和推理planning。这些技术的应用使得Skywork o1在常识推理、逻辑推理、数学推理、伦理决策等问题上表现出色。

昆仑万维强调，Skywork o1的发布不仅是公司“All in AGI 与 AIGC”战略的重要举措，也是构建AI技术栈的重要一步。公司将继续致力于实现通用人工智能，让每个人更好地塑造和表达自我。

尝鲜地址:www.tiangong.cn

Downcodes小编总结：昆仑万维的天工大模型4.0 o1版在逻辑推理和复杂任务处理上展现出强大的能力，为通用人工智能的发展提供了新的方向。其开源策略也为开发者提供了宝贵的资源和学习机会，值得期待后续的更新和应用。