中國初創公司DeepSeek憑藉其高性能、低成本的生成式AI大規模語言模型(LLM)迅速崛起,引發全球關注。其技術實力已得到國際權威專家的認可,並被認為在某些方面甚至超越了美國。本文將對東京大學教授松尾豐對DeepSeek的評價以及DeepSeek對全球AI格局的影響進行深入解讀,並探討其開源戰略的意義以及AI模型的安全風險。
中國初創企業DeepSeek(深度求索)開發的高性能、低成本生成式AI大規模語言模型(LLM)近日引發全球關注。日本AI研究領域的權威、東京大學教授松尾豐在接受日本經濟新聞採訪時,對DeepSeek的技術水平、開源戰略及其對日本企業的影響進行了深入分析。
松尾豐表示,DeepSeek的技術非常出色,其性能與美國OpenAI開發的ChatGPT接近。他指出,DeepSeek每次發布新模型時都會發布詳細的技術論文,展示其在模型優化方面的創新之處。例如,今年1月發布的最新模型“R1”通過強化學習提升了推理能力,達到了與OpenAI“o1”模型相當的水平。
松尾豐認為,中國的AI開發水平已經與美國比肩,甚至在某些方面超越了美國。他指出,中國不僅有阿里巴巴、騰訊、百度等科技巨頭,還擁有大量優秀工程師,形成了活躍的AI生態系統。 DeepSeek在這樣的環境中崛起並不令人意外,並可能進一步改變全球AI競爭的勢力格局。
松尾豐強調,DeepSeek的成功為日本初創企業提供了重要啟示。作為一家非大型科技企業,DeepSeek憑藉紮實的技術開發實現了世界領先的精度。這表明,即便在日本,只要專注於技術創新,企業同樣有機會在AI領域取得突破。
DeepSeek採取了開源戰略,這一做法與Meta和阿里巴巴等企業類似。松尾豐指出,開源模型為全球開發者提供了強大的基礎,使追加學習和性能提升變得更加容易。他認為,DeepSeek的出現增強了開源勢力的影響力,儘管非公開模型(如OpenAI和谷歌的產品)仍具備競爭優勢,但開源模型在特定場景下同樣能夠實現卓越性能。
關於AI模型的安全風險,松尾豐表示,風險因使用方式而異。開源模型可以在本地運行,避免了數據外洩的風險;而使用在線服務時,數據會發送到服務器進行處理。他強調,無論是DeepSeek還是OpenAI,用戶都需要對服務提供方保持信任,因為數據的使用和學習難以完全排除。
DeepSeek的崛起不僅展現了中國AI技術的飛速發展,也為全球AI產業帶來了新的競爭格局和發展方向,其開源戰略更是為全球開發者提供了寶貴的資源和機遇。未來,DeepSeek能否持續保持創新,並進一步提升其模型的性能和安全性,值得期待。