杭州AI公司DeepSeek發布了其最新大型語言模型V3,該模型以低廉的成本(560萬美元)取得了與OpenAI的GPT-4和Anthropic的Claude 3.5Sonnet相近的性能,引發業界關注。這項成果凸顯了DeepSeek在有限資源下的強大研究和工程能力,也為大型語言模式的研發提供了新的思路,挑戰了高投入才能獲得高回報的傳統觀念。 V3模型的成功,或許預示著AI領域未來發展的更多可能性。
近日,位於杭州的AI 公司DeepSeek 發表了其最新的大型語言模式—V3。這款開源模型在多項基準測試中的表現接近OpenAI 的4o 和Anthropic 的Claude3.5Sonnet,這讓業界刮目相看。與美國同行動輒數億美元的投資相比,DeepSeek 的V3模型總成本僅560萬美元,這一巨大的差異讓人矚目。
DeepSeek 的執行長梁文峰表示,資金從來不是他們面臨的問題,儘管V3是基於H800晶片訓練的,但DeepSeek 的團隊依然能夠在資源有限的情況下展現出強大的研究與工程能力。
AI 領域的先驅Andrej Karpathy 對此評論道,DeepSeek 的投資預算“真是個笑話”,然而最終呈現的成果卻是“在資源約束下的高度令人印象深刻的研究與工程”。
AGI 被視為AI 研究的“聖杯”,能夠在解決問題和執行任務上超越人類,相關專家預測,一旦技術成熟,首個實現AGI 的國家將在經濟、科學和安全上佔據巨大的優勢。
DeepSeek V3模式的成功,不僅證明了低成本也能取得突破性進展,更重要的是,它為全球AI研發提供了新的視角和方向,也為發展中國家在人工智慧領域追趕先進水準帶來了希望。未來,或許會有更多類似的「奇蹟」發生。