2024 年の世界人工知能会議 (WAIC) で、SenseTime は見事な登場を果たし、制御可能な大規模なキャラクター ビデオ生成モデル Vimi を発表しました。この目を引くAIモデルは、その強力な技術力と革新的なアプリケーションシナリオにより、ビデオ制作の分野に革命的な変化をもたらしました。 Downcodes のエディターを使用すると、Vimi モデルの独自性とそれがユーザーにもたらす新しいエクスペリエンスを深く理解できます。
2024 年の世界人工知能会議 (WAIC) で、SenseTime は、大規模な制御可能なキャラクター ビデオ生成モデルである Vimi を発表しました。 Vimi モデルは、SenseTime の高度なラージモデル技術を使用して、1 枚の写真からターゲットの動きに合わせたキャラクターのビデオを生成し、正確な表現と身体制御を実現します。このモデルは、ビデオ、アニメーション、サウンド、テキストなどの複数の駆動方法をサポートしており、長年蓄積された顔追跡技術と細部の正確な制御を備えており、一貫性が高く、調和のとれた光と影のビデオコンテンツを生成できます。
Vimi の安定性は特に優れており、1 分以上の一眼レフ人物動画を生成でき、時間が経っても映像効果が劣化しません。また、キャラクターの動きに応じて環境シーンを調整し、カメラアングルの変更や髪の揺れをシミュレートし、リアルな視覚効果を提供することもできます。さらに、Vimi は光と影の変化シミュレーションもサポートしており、ビデオクリエイターに豊かな創造的自由を提供します。
Vimi 大型モデルをベースにした最初の C サイド アプリケーションである Vimi Camera は、主に女性ユーザーを対象としており、エンターテイメントと創作のニーズを満たすことができます。ユーザーがさまざまな角度から人物の高解像度写真をアップロードすると、Vimi カメラがさまざまなスタイルのデジタル アバターや写真ビデオを自動的に生成し、多様な生成スタイルを提供できます。 Vimi カメラは、1 枚の写真から興味深いキャラクターの絵文字を生成することもサポートしており、さまざまな遊び方でパーソナライズされた作成を実現できます。
現在、Vimi カメラは社内テスト中です。興味のあるユーザーは、公式アカウントをフォローし、予約リンクを入力して体験を申し込むことができます。
Vimi モデルとそのアプリケーション Vimi カメラは、AI 分野における SenseTime の強力な強みとユーザー ニーズの正確な把握を実証し、将来のビデオ作成に無限の可能性を提供します。 Vimi はビデオ生成テクノロジーの新しいトレンドをリードし、ユーザーにさらなる驚きをもたらすと信じています。