Alibaba Cloud Bailian lance le modèle de texte long Tongyi Qianwen million Qwen2.5-Turbo - Article AI

Auteur：Eve Cole Date de mise à jour：2025-01-26 01:00:01

Alibaba Cloud Bailian Platform a lancé le modèle de texte long Qwen2,5-Turbo millions. Ce modèle a été développé par l'équipe Tongyi Qianwen et a la capacité de traiter des textes ultra-longs allant jusqu'à 1 million de jetons, ce qui équivaut à 1 million d'anglais. mots ou 150 Dix mille caractères chinois. Ce modèle a obtenu d'excellents résultats en matière de récupération de texte long, d'évaluation de texte long RULER et de tâches de texte long proches des scènes réelles, surpassant GPT-4 dans plusieurs dimensions. En outre, il a également obtenu de bons résultats lors du test d'évaluation des textes courts, surpassant largement les modèles similaires précédents.

Alibaba Cloud Bailian Platform a récemment annoncé le lancement du modèle de texte long Qwen2.5-Turbo million. Le modèle Qwen2.5-Turbo a été développé par l'équipe Tongyi Qianwen et prend en charge le traitement de contextes ultra-longs pouvant atteindre 1 million de jetons. équivaut à 1 million de mots anglais ou 1,5 million de caractères chinois.

Cette nouvelle version du modèle a atteint une précision de 100 % dans les tâches de récupération de texte long et a obtenu un score de 93,1 sur l'ensemble d'évaluation de texte long RULER, surpassant GPT-4. Dans les tâches de texte longues proches des scènes réelles telles que LV-Eval et LongBench-Chat, Qwen2.5-Turbo surpasse GPT-4o-mini dans la plupart des dimensions. Dans le test de référence en texte court, Qwen2.5-Turbo a également très bien fonctionné, surpassant largement le modèle open source précédent avec une longueur de contexte de 1 million de jetons.

微信截图_20241121082702.png

Le modèle Qwen2.5-Turbo propose un large éventail de scénarios d'application, notamment une compréhension approfondie de romans, des assistants de code à grande échelle, la lecture de plusieurs articles, etc. Il peut traiter 10 romans, 150 heures de discours ou 30 000 lignes. de code à la fois. En termes de vitesse de raisonnement, l'équipe de Tongyi Qianwen a compressé la quantité de calcul d'environ 12,5 fois grâce au mécanisme d'attention clairsemée et a réduit le temps de retour du premier mot du traitement du contexte de 1 million de jetons de 4,9 minutes à 68 secondes, atteignant une augmentation de vitesse de 4,3 fois.

La plate-forme Alibaba Cloud Bailian offre à tous les utilisateurs la possibilité d'appeler directement l'API Qwen2.5-Turbo et offre un cadeau à durée limitée de 10 millions de jetons. Le coût de l’utilisation ultérieure d’un million de jetons n’est que de 0,3 yuan.

À l'heure actuelle, la plate-forme Alibaba Cloud Bailian a lancé plus de 200 grands modèles open source et fermés grand public nationaux et étrangers, notamment Qwen, Llama et ChatGLM, permettant aux utilisateurs d'appeler, de se former et d'affiner ou de créer directement des applications RAG.

L'émergence du modèle Qwen2.5-Turbo marque des progrès significatifs dans la technologie de traitement de textes longs, fournissant des outils d'IA plus puissants pour tous les horizons. La stratégie ouverte de la plateforme Alibaba Cloud Bailian permet également à davantage de développeurs d'appliquer facilement cette technologie de pointe et de promouvoir conjointement le développement du domaine de l'intelligence artificielle. Son faible coût réduit également encore davantage le seuil d’utilisation.