Google は、OpenAI の Sora と競合するように設計された新しいビデオ生成モデル Veo2 をリリースしました。 Veo2 はビデオのリアリズムと詳細なパフォーマンスを大幅に向上させ、物理法則、人間の動き、表現の微妙な変化をより深く理解できるようになりました。このアップデートにより、ビデオの品質が向上するだけでなく、ユーザーの指示を理解して実行するモデルの能力も強化され、ビデオ作成のためのより強力なツールが提供されます。 Google Labs の VideoFX プラットフォームを通じて、ユーザーは Veo2 の強力な機能を体験し、最大 4K 解像度のビデオを生成し、ビデオの種類、レンズ、映画効果を選択できます。ただし、Veo2 は現時点では待機リストに登録されているユーザーのみが利用でき、Google フォームから申し込む必要があることに注意してください。
GoogleはOpenAIのSoraへの対抗を目指し、新世代の動画生成モデルVeo2を正式リリースした。 Google によると、Veo2 はビデオを生成する際に、より優れたリアリズムと詳細を実現するとのことです。このアップデートにより、ビデオの品質が向上するだけでなく、現実の物理学や人間の動きや表現のニュアンスへの理解も深まります。
Veo2 のパワー
Googleは、Veo2は「現実世界の物理学と人間の動きや表現のニュアンスをよりよく理解している」と述べている。 Google Labs の VideoFX プラットフォームで利用できますが、順番待ちリストに基づいてのみ利用可能です。ユーザーは Google フォーム経由で登録し、選択したときに Google が一時的にアクセスを許可するまで待つ必要があります。
Googleによると、ユーザーはニーズに応じてビデオ、レンズ、ムービーエフェクトの種類を選択でき、Veo2は最大4K解像度のビデオを生成できるという。
対照的に、オリジナルの Veo は引き続き Vertex AI で利用でき、Veo2 で生成されたビデオには、AI で生成されたコンテンツであることを識別するための Google のメタデータ ウォーターマーク SynthID が付属します。
Veo2 の技術的進歩にも関わらず、Google は、このモデルが時折余分な指などの「幻覚」を示すことを認めていますが、全体的には新しいバージョンでは幻覚が減少しています。
Googleは、「全体的な好み」(つまり、視聴者がどの動画を好むか)と「タイムリーなコンプライアンス」(動画が人間の作成者によって与えられた指示にどの程度一致しているか)を測定する独自の内部テストで、人間の評価者は人工的な評価者ではなくVeoを好んだと述べた。ソラと他の競合他社の知能モデル。
Veo2体験入口:https://labs.google/fx/tools/video-fx
導入入口:https://deepmind.google/technologies/veo/veo-2/
AIビデオ生成にはまだ努力が必要
AI ビデオ生成技術は常に向上していますが、Google と OpenAI などの大手プレーヤーとの間の競争は依然として熾烈です。 RunwayML や Luma AI などの他の中小企業も、ビデオ生成機能を強化するための新機能を展開しています。
最近、RunwayML は Gen-3Alpha Turbo モデルに高度な制御機能を導入し、Pika Labs はユーザーが独自のキャラクターをビデオに追加できる Pika 2.0 をリリースしました。
しかし、AI が生成した動画に対するユーザーの信頼はまだ不十分です。 Sora のリリースは人々の疑念を完全に払拭したわけではなく、一部のユーザーは生成された結果には物理的および解剖学的違反があると報告しました。さらに、最近のゲーム賞ショーの視聴者は、AI が生成したコンテンツの「AI カオス」に不満を表明しました。
Googleによると、多くのユーザー、特に一部のYouTubeクリエイターがVeo2に強い関心を示しており、彼らはすでにVideoFXを使って短いビデオの背景を作成し、時間を節約しているという。
Imagen3 のアップデート
Veo2 に加えて、Google は画像生成モデル Imagen3 も更新しました。これにより、生成された画像のリアルさと色の鮮やかさがさらに向上しました。 Imagen3 の新バージョンは、写真のリアリズムから印象派、抽象やアニメのスタイルまで、さまざまな芸術スタイルをより正確に表現できます。同時に、このモデルはユーザーの指示に従うパフォーマンスも向上しました。
ハイライト:
- Google が Veo2 ビデオ生成モデルをリリースし、そのビデオ品質が OpenAI の Sora よりも優れていると主張しています。
- Google フォームから Veo2 の利用申請を行うことができ、動画生成時のスタイルやエフェクトを選択することができます。
- 更新された Imagen3 画像生成モデルは、さまざまな芸術的なスタイルをより適切に表現し、より良いユーザー エクスペリエンスを提供できます。
全体として、Veo2 の登場は AI ビデオ生成テクノロジーのさらなる前進を示していますが、この分野が依然として多くの課題に直面していることも明らかにしています。 テクノロジーの継続的な進歩とユーザーエクスペリエンスの向上が今後の開発の方向性となります。