Mistral 公司最近發布了其開源程式碼產生模型Codestral 的重大更新—Codestral25.01。此版本在架構上進行了最佳化,速度提升至前代的兩倍,並在各項基準測試中表現出色,尤其在Python 編碼測試中脫穎而出。 Codestral25.01 支援程式碼修正、測試產生和程式碼填充等多種功能,旨在為開發者提供更有效率的程式碼產生體驗,並已迅速獲得市場關注,在Copilot Arena 排行榜上名列前茅。 Mistral 提供多種途徑存取Codestral25.01,包括IDE 外掛程式、Mistral 平台、Google Vertex AI 以及Azure AI Foundry 預覽版,未來也將登陸Amazon Bedrock。
根據Mistral 的部落格文章,Codestral25.01的架構經過最佳化,承諾在同類模型中成為“絕對領導者”,其程式碼生成速度是先前版本的兩倍。這個新版本依舊保持了原有模型的優勢,專注於低延遲和高頻操作,支援程式碼修正、測試產生及程式碼填充等任務。 Mistral 表示,這對於擁有大量資料的企業和模型駐留使用情境尤其重要。
在各項基準測試中,Codestral25.01在Python 編碼測試中表現優異,在HumanEval 測試中取得了86.6% 的高分,超越了先前版本的Codestral、Codellama70B Instruct 和DeepSeek Coder33B Instruct。
開發者可以透過Mistral 的IDE 外掛程式合作夥伴來使用Codestral25.01。此外,用戶還可以透過Mistral 的平台和Google Vertex AI 存取該模型的API,目前該模型在Azure AI Foundry 上提供預覽,並將在Amazon Bedrock 上上線。
自2023年5月首次發表Codestral 以來,Mistral 便不斷推動其產品的升級與創新。先前推出的Codestral-Mamba 模型基於Mamba 架構,能產生更長的程式碼字串並處理更多輸入。值得注意的是,Codestral25.01在Mistral 發佈公告後的幾個小時內,就已迅速攀升至C opilot Arena 的排行榜上,顯示出市場對這一新模型的強烈興趣。
編寫程式碼作為基礎模型的早期功能之一,儘管在通用模型如OpenAI 的o3和Anthropic 的Claude 中也有應用,但在過去一年中,專注於程式設計的模型已經取得了顯著進步,常常能超越一些大型通用模型。近期,阿里巴巴、DeepSeek Coder 和微軟也相繼發表了新的程式設計模型,競爭愈來激烈。
在眾多開發者中,對於選擇通用模型或專注於程式設計的模型仍存在爭議。有些開發者更傾向於使用像Claude 這樣的通用模型,而對於程式設計任務的需求則推動了專用模型的不斷湧現。由於Codestral 專門針對編碼資料進行訓練,因此在程式設計任務上的表現自然更為優異。
官方部落格:https://mistral.ai/news/codestral-2501/
劃重點:
Mistral 推出Codestral25.01,程式碼產生速度提高至前版本的兩倍。
該模型在Python 編碼測試中表現優異,獲得86.6% 的HumanEval 測試分數。
Codestral25.01迅速在C opilot Arena 中升至榜首,並受到開發者廣泛關注。
Codestral25.01 的發布標誌著程式碼產生模型領域競爭的進一步加劇,其優異性能和便捷的存取方式使其成為開發者值得關注的新工具。 未來,Mistral 將如何進一步改進Codestral,值得期待。