DeepSeek 宣布正式发布并开源其大型语言模型 R1,其性能可与 OpenAI 的 o1 正式版媲美。R1 在后训练阶段大量运用强化学习技术,即使数据标注量少,也能保持强大的推理能力,在数学、代码和自然语言推理等方面表现出色。DeepSeek 还开源了 R1 和 R1-Zero 两款 660B 参数规模的模型,以及 6 个采用模型蒸馏技术的小模型,其中包括 32B 和 70B 参数的模型,性能超越了 OpenAI 的 o1-mini。此外,DeepSeek 还提供了极具竞争力的 API 定价方案,并采用 MIT 许可证,允许无限制商用,鼓励用户基于 R1 进行二次开发。
DeepSeek R1在性能、开源策略和API定价方面都展现了其强大的实力和开放的姿态,这标志着国产AI技术的显著进步,也为全球AI开发者提供了更多选择和可能性。开源的R1以及相关资源的开放,将促进AI技术的普及和发展,推动AI技术平权化时代的加速到来。 访问链接获取更多信息: 论文:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf API文档:https://api-docs.deepseek.com/zh-cn/guides/reasoning_model