通義千問團隊開源了其最新的代碼大模型Qwen2.5-Coder全系列,包含0.5B/3B/14B/32B四個尺寸的模型,以及Base和Instruct兩種版本。此舉旨在推動開源代碼大模型的發展,為開發者提供更多選擇。 Qwen2.5-Coder-32B-Instruct模型在代碼生成、修復和推理等方面表現卓越,在多個基準測試中達到SOTA水平,與GPT-4o表現相當,尤其在Haskell和Racket等編程語言上表現突出。該模型還經過了內部代碼偏好評估基準Code Arena的測試,證明其在人類偏好對齊方面具有優勢。
Qwen2.5-Coder支持超過40種編程語言,並在McEval上獲得65.9分,在MdEval基準測試中得分75.2,排名第一。其預訓練階段獨特的數據清洗和配比是其性能優異的關鍵因素之一。 0.5B/1.5B/7B/14B/32B模型採用Apache2.0許可,3B模型為Research Only許可。團隊通過評估不同尺寸模型的表現,驗證了Scaling在Code LLMs上的有效性。 Qwen2.5-Coder的開源,無疑將促進編程語言模型技術的發展和應用。
Qwen2.5-Coder系列此次開源,為開發者提供了一個強大且易用的編程模型選擇,進一步推動了開源社區的發展。不同尺寸的模型滿足不同需求,Base和Instruct版本則分別服務於模型微調和直接應用。模型鏈接已提供,歡迎開發者下載使用並為開源社區貢獻力量。
Qwen2.5-Coder模型鏈接:https://modelscope.cn/collections/Qwen25-Coder-9d375446e8f5814a