DeepSeek V3的成功证明了国内的人工智能正在飞速发展 - AI文章

作者：Eve Cole 更新时间：2025-01-28 04:48:01

杭州AI公司DeepSeek发布了其最新大型语言模型V3，该模型以低廉的成本（560万美元）取得了与OpenAI的GPT-4和Anthropic的Claude 3.5Sonnet相近的性能，引发业界关注。这一成果凸显了DeepSeek在有限资源下的强大研究和工程能力，也为大型语言模型的研发提供了新的思路，挑战了高投入才能获得高回报的传统观念。 V3模型的成功，或许预示着AI领域未来发展的更多可能性。

近日，位于杭州的 AI 公司 DeepSeek 发布了其最新的大型语言模型 ——V3。这款开源模型在多项基准测试中的表现接近于 OpenAI 的4o 和 Anthropic 的 Claude3.5Sonnet，这让业界刮目相看。与美国同行动辄数亿美元的投资相比，DeepSeek 的 V3模型总成本仅为560万美元，这一巨大的差异让人瞩目。

大模型元宇宙 (1)

DeepSeek 的首席执行官梁文峰表示，资金从来不是他们面临的问题，尽管 V3是基于 H800芯片训练的，但 DeepSeek 的团队依然能够在资源有限的情况下展现出强大的研究与工程能力。

AI 领域的先驱 Andrej Karpathy 对此评价道，DeepSeek 的投资预算 “真是个笑话”，然而最终呈现的成果却是 “在资源约束下的高度令人印象深刻的研究与工程”。

AGI 被视为 AI 研究的 “圣杯”，能够在解决问题和执行任务上超越人类，相关专家预测，一旦技术成熟，首个实现 AGI 的国家将在经济、科学和安全上占据巨大的优势。

DeepSeek V3模型的成功，不仅证明了低成本也能取得突破性进展，更重要的是，它为全球AI研发提供了新的视角和方向，也为发展中国家在人工智能领域追赶先进水平带来了希望。未来，或许会有更多类似的“奇迹”发生。