DeepSeek推首款推理模型R1-Lite-Preview，效能超越OpenAI o1

作者：Eve Cole 更新時間：2025-01-28 00:00:02

Downcodes小編獲悉，中國私募巨頭幻方量化旗下的DeepSeek近日發布了其最新的推理專注型大型語言模型R1-Lite-Preview。這款模型目前僅透過DeepSeek Chat網頁聊天機器人平台向公眾開放，其性能已引起廣泛關注，甚至接近或超過了OpenAI近期發布的o1-preview模型。 DeepSeek以其在開源AI生態系統中的貢獻而聞名，此次發布延續了其對可訪問性和透明性的承諾。

中國私募巨頭幻方量化旗下的DeepSeek，最近發布了其最新的推理專注型大型語言模型R1-Lite-Preview。該模型目前僅透過DeepSeek Chat 這個網頁聊天機器人平台提供給大眾使用。

DeepSeek 以其在開源AI 生態系統中的創新貢獻而聞名，這次的新發布旨在為公眾帶來高水平的推理能力，同時保持對可訪問性和透明性的承諾。儘管R1-Lite-Preview 目前僅在聊天應用程式中可用，但它已憑藉接近甚至超過OpenAI 近期發布的o1-preview 模型的性能引起了廣泛關注。

R1-Lite-Preview 採用「鍊式思維」推理，能夠展示其在回應使用者查詢時所經歷的不同思考過程。

儘管某些思維鏈可能對人類而言顯得無厘頭或錯誤，但整體而言，R1-Lite-Preview 的回答非常準確，甚至能夠解決一些傳統強大AI 模型如GPT-4o 和Claude 系列遇到的「陷阱” 問題，例如“草莓” 這個字裡有多少個字母R?“9.11和9.9哪個大?”

根據DeepSeek 的說法，該模型在需要邏輯推理、數學思考和即時問題解決的任務中表現出色。其性能在AIME（美國邀請數學考試）和MATH 等已建立的基準測試中超越了OpenAI o1-preview 的水平。

此外，DeepSeek 還發布了模型的擴展數據，展示了在給予模型更多時間或「思考令牌」以解決問題時，其準確性穩步提高的趨勢。圖表強調，隨著思考深度的增加，該模型在AIME 等基準上的得分提升。

目前，R1-Lite-Preview 的發佈在關鍵基準中表現優異，能夠處理從複雜數學到邏輯場景的一系列任務，得分與頂級推理模型如GPQA 和Codeforces 相當。此模型透明的推理過程讓使用者能夠即時觀察其邏輯步驟，增強了系統的責任感和可信度。

值得注意的是，DeepSeek 尚未發布完整的程式碼供第三方獨立分析或基準測試，也未提供API 介面供獨立測試，該公司尚未發布相關的部落格文章或技術文檔，說明R1-Lite-Preview 的訓練或構，這讓背後的起源依然充滿疑問。

R1-Lite-Preview 目前可以透過DeepSeek Chat（chat.deepseek.com）免費使用，但其高級「深思」模式每天限量50條訊息，用戶可藉此體驗其強大能力。 DeepSeek 計畫發布R1系列模型的開源版本和相關API，進一步支援開源AI 社群的發展。

DeepSeek 繼續在開源AI 領域中推動創新，R1-Lite-Preview 的發佈為其在推理和可擴展性方面增加了新的維度。隨著企業和研究者探索推理密集型AI 的應用，DeepSeek 的開放承諾將確保其模型成為發展和創新的重要資源。

官方入口:https://www.deepseek.com/

總而言之，R1-Lite-Preview展現了DeepSeek在大型語言模型領域的強大實力，其開源計畫也值得期待。但缺乏程式碼和技術文件的公開，也為其技術細節蒙上了一層神秘面紗。 Downcodes小編將持續關注DeepSeek的後續進展。