Mistral 公司近日发布了其开源代码生成模型 Codestral 的重大更新——Codestral25.01。该版本在架构上进行了优化,速度提升至前代的两倍,并在各项基准测试中表现出色,尤其在 Python 编码测试中脱颖而出。 Codestral25.01 支持代码纠正、测试生成和代码填充等多种功能,旨在为开发者提供更高效的代码生成体验,并已迅速获得市场关注,在 Copilot Arena 排行榜上名列前茅。 Mistral 提供多种途径访问 Codestral25.01,包括 IDE 插件、Mistral 平台、Google Vertex AI 以及 Azure AI Foundry 预览版,未来还将登陆 Amazon Bedrock。
根据 Mistral 的博客文章,Codestral25.01的架构经过优化,承诺在同类模型中成为 “绝对领军者”,其代码生成速度是之前版本的两倍。这一新版本依旧保持了原有模型的优势,专注于低延迟和高频操作,支持代码纠正、测试生成及代码填充等任务。Mistral 表示,这对于拥有大量数据的企业和模型驻留使用场景尤为重要。
在各项基准测试中,Codestral25.01在 Python 编码测试中表现优异,在 HumanEval 测试中取得了86.6% 的高分,超越了之前版本的 Codestral、Codellama70B Instruct 和 DeepSeek Coder33B Instruct。
开发者可以通过 Mistral 的 IDE 插件合作伙伴来使用 Codestral25.01。此外,用户还可以通过 Mistral 的平台和 Google Vertex AI 访问该模型的 API,目前该模型在 Azure AI Foundry 上提供预览,并将在 Amazon Bedrock 上上线。
自2023年5月首次发布 Codestral 以来,Mistral 便不断推动其产品的升级与创新。之前推出的 Codestral-Mamba 模型基于 Mamba 架构,能生成更长的代码字符串并处理更多输入。值得注意的是,Codestral25.01在 Mistral 发布公告后的几个小时内,就已迅速攀升至 C o p i l o t Arena 的排行榜上,显示出市场对这一新模型的强烈兴趣。
编写代码作为基础模型的早期功能之一,尽管在通用模型如 OpenAI 的 o3和 Anthropic 的 Claude 中也有应用,但在过去一年中,专注于编程的模型已经取得了显著进步,常常能超越一些大型通用模型。近期,阿里巴巴、DeepSeek Coder 和微软也相继发布了新的编程模型,竞争愈发激烈。
在众多开发者中,对于选择通用模型还是专注于编程的模型仍存在争议。有些开发者更倾向于使用像 Claude 这样的通用模型,而对于编程任务的需求则推动了专用模型的不断涌现。由于 Codestral 专门针对编码数据进行训练,因此在编程任务上的表现自然更为优异。
官方博客:https://mistral.ai/news/codestral-2501/
划重点:
Mistral 推出 Codestral25.01,代码生成速度提高至前版本的两倍。
该模型在 Python 编码测试中表现优异,获得86.6% 的 HumanEval 测试分数。
Codestral25.01迅速在 C o p i l o t Arena 中升至榜首,受到开发者广泛关注。
Codestral25.01 的发布标志着代码生成模型领域竞争的进一步加剧,其优异性能和便捷的访问方式使其成为开发者值得关注的新工具。 未来,Mistral 将如何进一步改进 Codestral,值得期待。