ByteDance lance le modèle Doubao 1.5Pro, dont les performances dépassent GPT-4o et Claude3.5Sonnet - Article AI

Auteur：Eve Cole Date de mise à jour：2025-01-27 03:48:02

ByteDance a lancé un nouveau modèle de pouf 1.5Pro, surpassant GPT-4o et Claude3.5Sonnet dans plusieurs tests de référence, marquant ainsi ses progrès significatifs dans le domaine de l'intelligence artificielle. Ce modèle utilise une architecture MoE clairsemée innovante pour atteindre des performances équivalentes au modèle dense à 7 paramètres avec moins de paramètres d'activation, et l'efficacité est augmentée d'environ 3 fois. En plus de la mise à niveau du modèle de base, le modèle de compréhension visuelle Doubao et le modèle vocal en temps réel ont été publiés simultanément, améliorant encore les capacités de traitement multimodal et l'expérience d'interaction vocale.

ByteDance a officiellement lancé son dernier modèle Doubao 1.5Pro (Doubao-1.5-pro). Ce nouveau modèle fonctionne bien dans des capacités complètes dans plusieurs domaines, surpassant avec succès les célèbres GPT-4o et Claude3.5Sonnet. La sortie de ce modèle marque une autre étape importante pour ByteDance dans le domaine de l'intelligence artificielle.

Doubao 1.5Pro adopte une nouvelle architecture MoE (Mixed Expert) clairsemée et utilise des paramètres d'activation plus petits pour la pré-formation. L'innovation de cette conception réside dans le fait qu'elle peut fournir des performances de modèle Dense équivalentes à 7 fois les paramètres d'activation, ce qui la rend bien plus efficace que l'architecture MoE conventionnelle de l'industrie, entraînant une amélioration de l'efficacité par 3. Cette conception rend le modèle Doubao encore meilleur sur plusieurs critères d'évaluation tels que les connaissances, le code, le raisonnement et le chinois.

En plus de la mise à niveau du modèle principal, ByteDance a également publié le modèle de compréhension visuelle Doubao Doubao-1.5-vision-pro et le modèle vocal en temps réel Doubao Doubao-1.5-realtime-voice-pro. Le nouveau modèle de compréhension visuelle a fait l'objet de mises à niveau techniques complètes en matière de traitement de données multimodal, de résolution dynamique et de compréhension fine de l'information, améliorant encore ses capacités de raisonnement visuel et de compréhension de texte. Dans le même temps, le lancement du modèle vocal en temps réel permet à l'application Doubao d'offrir une expérience de conversation vocale plus fluide, avec une faible latence et la possibilité d'interrompre à tout moment la conversation.

ByteDance a officiellement déclaré que le modèle Doubao n'utilisait aucune donnée générée par des modèles externes pendant le processus de formation, garantissant ainsi l'indépendance et la fiabilité du modèle. De plus, les prix de tous les nouveaux produits resteront inchangés et les utilisateurs pourront directement découvrir les nouvelles fonctionnalités de l'application Doubao.

Cette conférence a non seulement démontré les capacités d'innovation continue de ByteDance dans le domaine de l'IA, mais a également fourni aux développeurs un solide support API, favorisant ainsi la vulgarisation et l'application de la technologie de l'intelligence artificielle.

Le lancement du grand modèle Doubao 1.5Pro, ainsi que des modèles visuels et vocaux associés, démontrent la forte force et l'innovation technologique de ByteDance dans le domaine de l'IA. Son efficacité élevée, ses performances élevées et l’accent mis sur l’expérience utilisateur indiquent que les applications d’IA seront plus pratiques et plus puissantes à l’avenir.