通義千問開源Qwen2.5-Coder全系列代碼能力追平GPT-4o - AI文章

作者：Eve Cole 更新時間：2025-02-17 15:32:01

通義千問團隊開源了其最新的代碼大模型Qwen2.5-Coder全系列，包含0.5B/3B/14B/32B四個尺寸的模型，以及Base和Instruct兩種版本。此舉旨在推動開源代碼大模型的發展，為開發者提供更多選擇。 Qwen2.5-Coder-32B-Instruct模型在代碼生成、修復和推理等方面表現卓越，在多個基準測試中達到SOTA水平，與GPT-4o表現相當，尤其在Haskell和Racket等編程語言上表現突出。該模型還經過了內部代碼偏好評估基準Code Arena的測試，證明其在人類偏好對齊方面具有優勢。

微信截图_20241112083641.png

Qwen2.5-Coder支持超過40種編程語言，並在McEval上獲得65.9分，在MdEval基準測試中得分75.2，排名第一。其預訓練階段獨特的數據清洗和配比是其性能優異的關鍵因素之一。 0.5B/1.5B/7B/14B/32B模型採用Apache2.0許可，3B模型為Research Only許可。團隊通過評估不同尺寸模型的表現，驗證了Scaling在Code LLMs上的有效性。 Qwen2.5-Coder的開源，無疑將促進編程語言模型技術的發展和應用。

Qwen2.5-Coder系列此次開源，為開發者提供了一個強大且易用的編程模型選擇，進一步推動了開源社區的發展。不同尺寸的模型滿足不同需求，Base和Instruct版本則分別服務於模型微調和直接應用。模型鏈接已提供，歡迎開發者下載使用並為開源社區貢獻力量。

Qwen2.5-Coder模型鏈接:https://modelscope.cn/collections/Qwen25-Coder-9d375446e8f5814a