杭州AI公司DeepSeek发布了其最新大型语言模型V3,该模型以低廉的成本(560万美元)取得了与OpenAI的GPT-4和Anthropic的Claude 3.5Sonnet相近的性能,引发业界关注。这一成果凸显了DeepSeek在有限资源下的强大研究和工程能力,也为大型语言模型的研发提供了新的思路,挑战了高投入才能获得高回报的传统观念。 V3模型的成功,或许预示着AI领域未来发展的更多可能性。
近日,位于杭州的 AI 公司 DeepSeek 发布了其最新的大型语言模型 ——V3。这款开源模型在多项基准测试中的表现接近于 OpenAI 的4o 和 Anthropic 的 Claude3.5Sonnet,这让业界刮目相看。与美国同行动辄数亿美元的投资相比,DeepSeek 的 V3模型总成本仅为560万美元,这一巨大的差异让人瞩目。
DeepSeek 的首席执行官梁文峰表示,资金从来不是他们面临的问题,尽管 V3是基于 H800芯片训练的,但 DeepSeek 的团队依然能够在资源有限的情况下展现出强大的研究与工程能力。
AI 领域的先驱 Andrej Karpathy 对此评价道,DeepSeek 的投资预算 “真是个笑话”,然而最终呈现的成果却是 “在资源约束下的高度令人印象深刻的研究与工程”。
AGI 被视为 AI 研究的 “圣杯”,能够在解决问题和执行任务上超越人类,相关专家预测,一旦技术成熟,首个实现 AGI 的国家将在经济、科学和安全上占据巨大的优势。
DeepSeek V3模型的成功,不仅证明了低成本也能取得突破性进展,更重要的是,它为全球AI研发提供了新的视角和方向,也为发展中国家在人工智能领域追赶先进水平带来了希望。未来,或许会有更多类似的“奇迹”发生。