NVIDIA は最近、最新の汎用大型モデル Nemotron-4 をリリースしました。これは 150 億のパラメータを持ち、多言語タスクやコーディング タスクで優れたパフォーマンスを発揮します。 Nemotron-4 は、チンチラ モデルのスケーリング則を採用しており、コンピューティング予算、データ、モデル サイズの最適化において画期的な進歩を遂げており、そのパフォーマンスは同じスケールの他のモデルを上回っており、現在最も強力な汎用言語モデルの 1 つとなっています。目標は、単一の A100 または H100 GPU で実行できるようにして、大規模モデルの効率の新しいベンチマークを設定することです。 大型モデルの高性能化の追求が大きく前進しました。
NVIDIA は、複数の言語やコーディング タスクで優れたパフォーマンスを発揮する、150 億のパラメーターを備えた汎用大型モデルである Nemotron-4 をリリースしました。このモデルはチンチラ モデルのスケーリング則を採用して計算予算、データ、モデル サイズを最適化し、同じパラメーター スケールのモデルを超え、最も強力な一般言語モデルになります。 Nemotron-4 は、単一の A100 または H100 GPU で実行することを目指しており、大型モデルの分野で新しい標準を確立します。
Nemotron-4 のリリースは、大規模モデルのパフォーマンスを向上させるだけでなく、さらに重要なことに、単一の GPU で実行するというその目標により、大規模モデルの使用の敷居が下がり、より多くの開発者や研究者に利便性が提供され、大規模モデルのアプリケーションが到来します。さらなる普及。 Nvidiaの動きは、人工知能技術の開発を促進する上で非常に重要です。