上海人工知能研究所: Scholar Puyu の大型モデルのアップグレード - AI 記事

著者：Eve Cole 更新時間：2025-01-28 18:32:01

上海人工知能研究所は最近、自社開発したスカラーモデルが大幅にアップグレードされ、新しいバージョンの Scholar Puyu 3.0 (InternLM3) がリリースされたと発表しました。このバージョンでは、データ使用効率とモデルのパフォーマンスに大きな進歩があり、低コストでより高いパフォーマンスを達成し、定期的な対話と詳細な思考機能を初めて統合して、実際のアプリケーションシナリオにおけるモデルのパフォーマンスを大幅に向上させました。このアップグレードは技術的な進歩を達成するだけでなく、人工知能の分野で革新を続ける中国の決意と強さを反映しています。

上海人工知能研究所は、スカラーモデルが重要なバージョンアップグレードを受け、Scholar Puyu 3.0 (InternLM3) をリリースしたと発表しました。同研究室によれば、新バージョンではデータフレームワークの洗練によりデータ利用効率が大幅に向上し、思考密度の向上を実現したという。

アップグレードされた InternLM3-8B-Instruct モデルは、トレーニングに 4T のデータのみを使用し、その総合的なパフォーマンスは同じサイズのオープンソースモデルを上回り、トレーニングコストが 75% 以上節約されると関係者は述べています。このバージョンでは、一般的なモデルに定期的な対話と詳細な思考機能の統合が初めて実現され、現実の多様な使用シナリオによりよく対応できることは注目に値します。

モデル評価に関して、研究チームは、Sinan OpenCompass オープンソース評価フレームワークに基づいた統一的で再現可能な評価方法を採用しました。評価内容には、CMMLU や GPQA などの 10 を超える権威ある評価セットが含まれており、推論、数学、プログラミング、指示に従って、長いテキストの生成、対話、総合的なパフォーマンスなどの複数の側面をカバーしています。評価結果は、Shusheng Puyu 3.0 がほとんどの評価セットでスコアをリードしており、その全体的なパフォーマンスが GPT-4o-mini に非常に近いことを示しています。

上海 AI 研究所はまた、このモデルの新バージョンは、ブラウザーの使用をサポートするオープンソースコミュニティ初のユニバーサル対話モデルとなり、20 ステップを超える Web ページのジャンプをサポートできるため、詳細なマイニングが可能になると述べました。情報。

体験ページ：https://internlm-chat.intern-ai.org.cn。

ハイライト:

Shusheng Puyu 3.0 モデルは 4T データでトレーニングされており、その総合的なパフォーマンスは同規模のオープンソースモデルを上回り、トレーニングコストを 75% 以上節約します。

このモデルは、複数の信頼できる評価セットの中で最高のスコアを獲得しており、思考能力と対話能力の統合が大幅に向上しています。

新しいモデルはブラウザの使用をサポートし、詳細な情報マイニングを実行できるため、オープンソースコミュニティのハイライトの 1 つとなります。

全体として、Shusheng Puyu 3.0 のアップグレードは、大規模言語モデルの分野における中国の大きな進歩を示しており、その効率的なトレーニング方法と強力なパフォーマンスにより、より多くの分野で人工知能技術の応用が促進されることが期待されており、注目する価値があります。今後の展開に期待します。