昆仑万维重磅发布天工大模型4.0 o1版(Skywork o1),正式开启邀请测试!Skywork o1 作为国内首款拥有中文逻辑推理能力的o1模型,具备慢思考推理能力,在模型输出上内生了思考、计划、反思等能力,并在标准评测集上的推理能力显著提升。此次发布的三款模型:Skywork o1Open、Skywork o1Lite和Skywork o1Preview,分别针对不同需求,展现了昆仑万维在通用人工智能领域的突破性进展,标志着其“All in AGI 与 AIGC”战略的又一重要里程碑。
昆仑万维科技股份有限公司宣布,其旗下的「天工大模型4.0」o1版(Skywork o1)正式启动邀请测试。这一消息标志着公司在通用人工智能领域迈出了重要一步,旨在通过技术创新实现更高层次的人工智能应用。
Skywork o1是昆仑万维集团发布的系列模型,具备慢思考推理能力,是国内首款拥有中文逻辑推理能力的o1模型。该模型不仅在模型输出上内生了思考、计划、反思等能力,而且在标准评测集上的推理能力相较于普通模型有显著提升。此次发布的Skywork o1包括三款模型:Skywork o1Open、Skywork o1Lite和Skywork o1Preview,其中Skywork o1Open是基于Llama3.18B的开源模型,Skywork o1Lite具备完整的思考能力,而Skywork o1Preview则提供了更多样化和深入的思考过程。
昆仑万维集团表示,Skywork o1Open在数学和代码指标上均有大幅提高,将Llama-3.1-8B的性能提升至同生态位SOTA水平,并解锁了许多轻量级模型无法解决的复杂数学任务。此外,公司还将开源两个推理任务的Process Reward Model(PRM):Skywork o1Open-PRM-1.5B 和Skywork o1Open-PRM-7B,这些模型能够对每个步骤进行打分,提升了推理和思考能力。
Skywork o1在逻辑推理任务上的性能提升得益于昆仑万维自研的训练方案,包括推理反思能力训练、推理能力强化学习和推理planning。这些技术的应用使得Skywork o1在常识推理、逻辑推理、数学推理、伦理决策等问题上表现出色。
昆仑万维强调,Skywork o1的发布不仅是公司“All in AGI 与 AIGC”战略的重要举措,也是构建AI技术栈的重要一步。公司将继续致力于实现通用人工智能,让每个人更好地塑造和表达自我。
尝鲜地址:www.tiangong.cn
Downcodes小编总结:昆仑万维的天工大模型4.0 o1版在逻辑推理和复杂任务处理上展现出强大的能力,为通用人工智能的发展提供了新的方向。其开源策略也为开发者提供了宝贵的资源和学习机会,值得期待后续的更新和应用。