Downcodes小编获悉,阿里巴巴旗下通义千问团队重磅发布Qwen2.5系列语言模型,并宣布开源!这不仅是Qwen家族的最新成员,更是可能是历史上最大规模的开源模型发布之一。此次开源包含通用语言模型Qwen2.5,以及针对编程和数学领域优化的Qwen2.5-Coder和Qwen2.5-Math模型,全面提升了知识获取、编程和数学能力,支持长文本处理,并覆盖29种以上语言。让我们一起探索这个令人兴奋的开源项目吧!
通义千问团队宣布,继Qwen2发布三个月后,Qwen家族的最新成员——Qwen2.5系列语言模型正式开源。这标志着可能是历史上最大规模的开源发布之一,包括了通用语言模型Qwen2.5,以及专门针对编程和数学领域的Qwen2.5-Coder和Qwen2.5-Math模型。
Qwen2.5系列模型在最新的大规模数据集上进行了预训练,数据集包含高达18T tokens,相较于Qwen2,新模型在知识获取、编程能力和数学能力方面均有显著提升。模型支持长文本处理,能够生成最多8K tokens的内容,并保持了对29种以上语言的支持。
Qwen2.5系列模型的开源,不仅采用了Apache2.0许可证,还提供了多种不同规模的版本,以适应不同的应用需求。此外,通义千问团队还开源了性能媲美GPT-4的Qwen2-VL-72B模型。
新模型在指令执行、长文本生成、结构化数据理解以及生成结构化输出方面取得了显著改进。特别是在编程和数学领域,Qwen2.5-Coder和Qwen2.5-Math模型在专业数据集上进行了训练,展现了更强的专业领域能力。
Qwen2.5系列模型体验:
Qwen2.5合集:https://modelscope.cn/studios/qwen/Qwen2.5
Qwen2.5系列模型的开源,为人工智能领域的开发者提供了强大的工具,也为推动AI技术发展贡献了重要力量。期待更多基于Qwen2.5的创新应用涌现! 赶紧前往体验吧!