Downcodes小編獲悉,中國私募巨頭幻方量化旗下的DeepSeek近日發布了其最新的推理專注型大型語言模型R1-Lite-Preview。這款模型目前僅透過DeepSeek Chat網頁聊天機器人平台向公眾開放,其性能已引起廣泛關注,甚至接近或超過了OpenAI近期發布的o1-preview模型。 DeepSeek以其在開源AI生態系統中的貢獻而聞名,此次發布延續了其對可訪問性和透明性的承諾。
中國私募巨頭幻方量化旗下的DeepSeek,最近發布了其最新的推理專注型大型語言模型R1-Lite-Preview。該模型目前僅透過DeepSeek Chat 這個網頁聊天機器人平台提供給大眾使用。
DeepSeek 以其在開源AI 生態系統中的創新貢獻而聞名,這次的新發布旨在為公眾帶來高水平的推理能力,同時保持對可訪問性和透明性的承諾。儘管R1-Lite-Preview 目前僅在聊天應用程式中可用,但它已憑藉接近甚至超過OpenAI 近期發布的o1-preview 模型的性能引起了廣泛關注。
R1-Lite-Preview 採用「鍊式思維」 推理,能夠展示其在回應使用者查詢時所經歷的不同思考過程。
儘管某些思維鏈可能對人類而言顯得無厘頭或錯誤,但整體而言,R1-Lite-Preview 的回答非常準確,甚至能夠解決一些傳統強大AI 模型如GPT-4o 和Claude 系列遇到的「陷阱” 問題,例如“草莓” 這個字裡有多少個字母R?“9.11和9.9哪個大?”
根據DeepSeek 的說法,該模型在需要邏輯推理、數學思考和即時問題解決的任務中表現出色。其性能在AIME(美國邀請數學考試)和MATH 等已建立的基準測試中超越了OpenAI o1-preview 的水平。
此外,DeepSeek 還發布了模型的擴展數據,展示了在給予模型更多時間或「思考令牌」 以解決問題時,其準確性穩步提高的趨勢。圖表強調,隨著思考深度的增加,該模型在AIME 等基準上的得分提升。
目前,R1-Lite-Preview 的發佈在關鍵基準中表現優異,能夠處理從複雜數學到邏輯場景的一系列任務,得分與頂級推理模型如GPQA 和Codeforces 相當。此模型透明的推理過程讓使用者能夠即時觀察其邏輯步驟,增強了系統的責任感和可信度。
值得注意的是,DeepSeek 尚未發布完整的程式碼供第三方獨立分析或基準測試,也未提供API 介面供獨立測試,該公司尚未發布相關的部落格文章或技術文檔,說明R1-Lite-Preview 的訓練或構,這讓背後的起源依然充滿疑問。
R1-Lite-Preview 目前可以透過DeepSeek Chat(chat.deepseek.com)免費使用,但其高級「深思」 模式每天限量50條訊息,用戶可藉此體驗其強大能力。 DeepSeek 計畫發布R1系列模型的開源版本和相關API,進一步支援開源AI 社群的發展。
DeepSeek 繼續在開源AI 領域中推動創新,R1-Lite-Preview 的發佈為其在推理和可擴展性方面增加了新的維度。隨著企業和研究者探索推理密集型AI 的應用,DeepSeek 的開放承諾將確保其模型成為發展和創新的重要資源。
官方入口:https://www.deepseek.com/
總而言之,R1-Lite-Preview展現了DeepSeek在大型語言模型領域的強大實力,其開源計畫也值得期待。但缺乏程式碼和技術文件的公開,也為其技術細節蒙上了一層神秘面紗。 Downcodes小編將持續關注DeepSeek的後續進展。