北京智谱华章科技有限公司在年度收官之际重磅推出首个基于扩展强化学习技术训练的推理模型GLM-Zero的初代版本——GLM-Zero-Preview。该模型在数理逻辑、代码编写和复杂问题推理方面展现出卓越能力,在多个权威评测中取得与OpenAI同类模型相当的成绩。GLM-Zero-Preview不仅提升了专家任务能力,同时保持了通用任务的优秀表现,为人工智能推理能力的提升树立了新的标杆。
在北京智谱华章科技有限公司的年度收官之际,公司发布了其首个基于扩展强化学习技术训练的推理模型——GLM-Zero的初代版本GLM-Zero-Preview。这款模型专注于提升人工智能的推理能力,尤其在数理逻辑、代码编写以及需要深度推理的复杂问题处理方面表现出色。与基座模型相比,GLM-Zero-Preview在保持通用任务能力的同时,专家任务能力得到了显著提升,其在AIME2024、MATH500和LiveCodeBench评测中的表现与OpenAI o1-preview相当。
用户现在可以在智谱清言平台的“Zero推理模型”智能体中免费体验GLM-Zero-Preview,该平台支持文字和图片上传,模型将输出完整的推理过程。同时,开发者也可以通过智谱开放平台的API调用此模型。
尽管GLM-Zero-Preview与OpenAI的o3模型还存在一定差距,但智谱华章科技有限公司计划持续优化迭代强化学习技术,并即将推出正式版GLM-Zero,将深度思考的能力从数理逻辑扩展到更多通用技术领域。
在模型表现方面,GLM-Zero-Preview展现了强化学习在增强模型深度推理能力方面的重要性。随着训练量的增加,模型在深度推理等方面的效果稳步提升。模型在推理阶段的scaling law也得到了验证,即随着模型可以思考的token数变多以及更多的计算量,模型给出的结果质量也稳步提升。GLM-Zero-Preview能够实现推理过程中自主决策、问题拆解和尝试多种方式解决问题,这与人类的思考决策过程类似。
在实测案例中,GLM-Zero-Preview在逻辑推理方面表现出识别逻辑漏洞和模拟多种假设的能力。在数学方面,该模型具有强大的归纳与演绎能力,能够快速处理复杂的数学运算,并在2025年考研数学一的测试中达到优秀研究生水平。在编程方面,GLM-Zero-Preview能够熟练使用多种编程语言,并帮助开发者快速编写代码。
智谱清言:
https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh
智谱开放平台:
https://bigmodel.cn/dev/api/normal-model/glm-zero-preview
GLM-Zero-Preview的推出标志着智谱华章在人工智能推理领域取得了显著进展,其免费开放的策略也便于开发者和用户体验和反馈,为未来模型的迭代优化提供宝贵数据。 期待正式版GLM-Zero的发布,进一步推动人工智能技术的进步。