Tencent のオープンソース大規模言語モデル Hunyuan-large は、最大 256K のテキストシーケンスをサポートします

著者：Eve Cole 更新時間：2024-11-30 11:36:01

Downcodes の編集者は、Tencent が本日、パラメータサイズ 398B、アクティベーションパラメータサイズ 52B のオープンソース MOE 大規模言語モデル Hunyuan-large をリリースしたことを知りました。このモデルは、複数の信頼できるベンチマークテストで良好なパフォーマンスを示し、CMMLU、MMLU、CEva1、MATH およびその他の学際的な包括的な評価セット、および中国語を含む 9 つの主要な側面において、Llama3.1、Mixtral およびその他の一流のオープンソースを上回っています。英語の NLP タスク、コード、数学の大規模モデル。強力なパフォーマンスと幅広い応用の可能性を示します。 Hunyuan-large の技術革新は、高品質の合成データの適用にあります。これにより、不十分な自然データの問題が効果的に解決され、最大 256K のテキストシーケンスの処理がサポートされ、長いコンテキストタスクの処理能力が大幅に向上します。

このモデルは、技術革新の観点から、合成データを使用してトレーニングを強化することで、高品質の合成データを実現でき、自然データの欠点に効果的に対処できることがわかります。コンテキスト処理機能の点では、事前トレーニングされたモデルは最大 256K のテキストシーケンスをサポートし、長いコンテキストタスクを処理する能力を大幅に強化します。

同時に、Tencent Hunyuan は、業界における実際の長文レビューセットの不足を埋めるために、業界のアプリケーション研究を支援するために Penguin Scroll レビューセットをオープンソース化すると発表しました。自社開発の PenguinScrolls は、財政、法律、学術論文など、長さの範囲が 1K ～ 128K のさまざまな自然な長文に基づいており、さまざまな深い読解や長文推論のタスクをカバーします。

Tencent Hunyuan Large 言語モデルと Penguin Scroll 評価セットのオープンソースのリリースにより、業界により強力な言語モデルと評価ツールが提供され、自然言語処理と人工知能の開発が促進されます。

公式ウェブサイトアドレス：https://llm.hunyuan.tencent.com

Tencent の Hunyuan 大型モデルのオープンソースは、開発者に強力なツールを提供するだけでなく、人工知能分野の進歩にも貢献します。 Penguin Scroll レビューセットのオープンソースにより、長文処理技術の改善と開発がさらに促進されます。今後もさらに革新的な成果が期待されます。

Tencent のオープンソース大規模言語モデル Hunyuan-large は、最大 256K のテキスト シーケンスをサポートします

Tencent のオープンソース大規模言語モデル Hunyuan-large は、最大 256K のテキストシーケンスをサポートします