ByteDance、性能で GPT-4o と Claude3.5Sonnet を上回る Beanbao モデル 1.5Pro をリリース - AI 記事

著者：Eve Cole 更新時間：2025-01-27 03:48:02

ByteDance は、新しいお手玉モデル 1.5Pro を発売し、複数のベンチマークテストで GPT-4o と Claude3.5Sonnet を上回り、人工知能の分野での大きな進歩を示しました。このモデルは、革新的なスパース MoE アーキテクチャを使用して、少ない起動パラメーターで 7 倍のパラメーターのデンスモデルと同等のパフォーマンスを実現し、効率が約 3 倍向上します。コアモデルのアップグレードに加えて、Doubao 視覚理解モデルとリアルタイム音声モデルが同時にリリースされ、マルチモーダル処理機能と音声対話エクスペリエンスがさらに強化されました。

ByteDance は、最新の Doubao モデル 1.5Pro (Doubao-1.5-pro) を正式に発表しました。この新しいモデルは、業界でよく知られている GPT-4o および Claude3.5Sonnet を上回る、さまざまな分野で優れた性能を発揮します。このモデルのリリースは、人工知能の分野におけるバイトダンスの新たな重要な一歩を示しています。

Doubao 1.5Pro は、新しいスパース MoE (Mixed Expert) アーキテクチャを採用し、事前トレーニングに小さなアクティベーションパラメーターを使用します。この設計の革新的な点は、アクティベーションパラメーターの 7 倍に相当する Dense モデルのパフォーマンスを提供できることであり、業界の従来の MoE アーキテクチャよりもはるかに効率的となり、3 倍の効率向上をもたらします。この設計により、知識、コード、推論、中国語などの複数の評価ベンチマークで Doubao モデルのスコアがさらに向上します。

メインモデルのアップグレードに加えて、ByteDance は Doubao 視覚理解モデル Doubao-1.5-vision-pro と Doubao リアルタイム音声モデル Doubao-1.5-realtime-voice-pro もリリースしました。新しい視覚理解モデルは、マルチモーダルデータ処理、動的解像度、およびきめ細かい情報理解において包括的な技術アップグレードを受けており、視覚的推論とテキスト理解の機能がさらに向上しています。同時に、リアルタイム音声モデルの開始により、Doubao アプリは低遅延で、会話中にいつでも中断できる、よりスムーズな音声会話エクスペリエンスを実現できます。

ByteDanceは、Doubaoモデルはトレーニングプロセス中に外部モデルによって生成されたデータを一切使用しておらず、モデルの独立性と信頼性を確保していると公式に述べた。さらに、すべての新製品の価格は変更されず、ユーザーは Doubao アプリの新機能を直接体験できます。

このカンファレンスは、AI分野におけるByteDanceの継続的なイノベーション能力を実証しただけでなく、開発者に強力なAPIサポートを提供し、人工知能技術の普及と応用をさらに促進しました。

Doubao 大型モデル 1.5Pro の発売と、それをサポートするビジュアルおよび音声モデルは、AI 分野における ByteDance の強力な強みと技術革新を示しています。その高効率、高性能、そしてユーザーエクスペリエンスの重視は、AI アプリケーションが将来さらに便利で強力になることを示しています。