L'éditeur de Downcodes a appris que l'équipe Tongyi Qianwen sous Alibaba avait publié la série de modèles de langage Qwen2.5 et annoncé qu'elle était open source ! Non seulement il s'agit du plus récent membre de la famille Qwen, mais il s'agit probablement de l'une des plus grandes versions de modèles open source de l'histoire. Cet open source comprend le modèle de langage général Qwen2.5, ainsi que les modèles Qwen2.5-Coder et Qwen2.5-Math optimisés pour les domaines de la programmation et des mathématiques. Il améliore de manière globale les capacités d'acquisition de connaissances, de programmation et de mathématiques, et prend en charge les fonctionnalités longues. traitement de texte et couvre plus de 29 langues. Explorons ensemble ce projet open source passionnant !
L'équipe Tongyi Qianwen a annoncé que trois mois après la sortie de Qwen2, le dernier membre de la famille Qwen, la série de modèles linguistiques Qwen2.5, est officiellement open source. Il s'agit peut-être de l'une des plus grandes versions open source de l'histoire, comprenant le modèle de langage général Qwen2.5, ainsi que les modèles Qwen2.5-Coder et Qwen2.5-Math spécifiquement destinés aux domaines de la programmation et des mathématiques.
Les modèles de la série Qwen2.5 sont pré-entraînés sur le dernier ensemble de données à grande échelle, qui contient jusqu'à 18 T de jetons. Par rapport à Qwen2, le nouveau modèle s'est considérablement amélioré en termes d'acquisition de connaissances, de capacité de programmation et de capacité mathématique. Le modèle prend en charge le traitement de texte long, peut générer du contenu jusqu'à 8 000 jetons et prend en charge plus de 29 langues.
Les modèles open source de la série Qwen2.5 adoptent non seulement la licence Apache2.0, mais fournissent également une variété de versions de différentes tailles pour s'adapter aux différents besoins des applications. De plus, l'équipe Tongyi Qianwen a également open source le modèle Qwen2-VL-72B avec des performances comparables à celles du GPT-4.
Le nouveau modèle apporte des améliorations significatives dans l'exécution des instructions, la génération de textes longs, la compréhension des données structurées et la génération de sorties structurées. En particulier dans les domaines de la programmation et des mathématiques, les modèles Qwen2.5-Coder et Qwen2.5-Math ont été formés sur des ensembles de données professionnelles, démontrant ainsi de plus fortes capacités dans les domaines professionnels.
Expérience du modèle de la série Qwen2.5 :
Collection Qwen2.5 : https://modelscope.cn/studios/qwen/Qwen2.5
L'open source des modèles de la série Qwen2.5 fournit des outils puissants aux développeurs dans le domaine de l'intelligence artificielle et contribue également au développement de la technologie de l'IA. Attendez-vous à l’émergence d’applications plus innovantes basées sur Qwen2.5 ! Allez-y et faites-en l'expérience maintenant !