Google DeepMind は最近、110 億のパラメーターを備えた仮想的に生成されたインタラクティブ環境である Genie と呼ばれる基本的な世界モデルをリリースしました。トレーニングのためにデータに手動で注釈を付ける必要がある従来の AI とは異なり、Genie はインターネット ビデオ データを直接使用して学習し、さまざまなアクションの特性とパターンを独自に識別し、写真、スケッチ、さらには制御可能な仮想世界を生成できます。生成されるビデオは漫画風で、ロボットの動きや変形した物体をシミュレートでき、強力な学習能力ときめ細かい制御能力を示しており、これは AI 分野におけるマイルストーンです。
Genie の登場は、AI モデルのトレーニングにおける大きな進歩を示し、その強力な学習能力と微妙な動きを認識する能力は、将来の AI 開発に新たな方向性をもたらします。 他の同様のモデルと比較して、Genie は自律学習および生成において強力な機能を実証し、仮想世界の構築と AI インタラクションに新たな可能性を提供します。