通义千问开源Qwen2.5-Coder全系列代码能力追平 GPT-4o - AI文章

作者：Eve Cole 更新时间：2025-02-17 15:32:01

通义千问团队开源了其最新的代码大模型Qwen2.5-Coder全系列，包含0.5B/3B/14B/32B四个尺寸的模型，以及Base和Instruct两种版本。此举旨在推动开源代码大模型的发展，为开发者提供更多选择。Qwen2.5-Coder-32B-Instruct模型在代码生成、修复和推理等方面表现卓越，在多个基准测试中达到SOTA水平，与GPT-4o表现相当，尤其在Haskell和Racket等编程语言上表现突出。该模型还经过了内部代码偏好评估基准Code Arena的测试，证明其在人类偏好对齐方面具有优势。

微信截图_20241112083641.png

Qwen2.5-Coder支持超过40种编程语言，并在McEval上获得65.9分，在MdEval基准测试中得分75.2，排名第一。其预训练阶段独特的数据清洗和配比是其性能优异的关键因素之一。0.5B/1.5B/7B/14B/32B模型采用Apache2.0许可，3B模型为Research Only许可。团队通过评估不同尺寸模型的表现，验证了Scaling在Code LLMs上的有效性。Qwen2.5-Coder的开源，无疑将促进编程语言模型技术的发展和应用。

Qwen2.5-Coder系列此次开源，为开发者提供了一个强大且易用的编程模型选择，进一步推动了开源社区的发展。不同尺寸的模型满足不同需求，Base和Instruct版本则分别服务于模型微调和直接应用。模型链接已提供，欢迎开发者下载使用并为开源社区贡献力量。

Qwen2.5-Coder模型链接:https://modelscope.cn/collections/Qwen25-Coder-9d375446e8f5814a

通义千问开源Qwen2.5-Coder全系列 代码能力追平 GPT-4o - AI文章

通义千问开源Qwen2.5-Coder全系列代码能力追平 GPT-4o - AI文章