Google は最近、1 枚の写真に基づいて本物のような会話ビデオを生成できる VLOGGER と呼ばれる AI ツールを発表しました。この技術はテキスト駆動およびオーディオ技術に基づいており、キャラクターの表情の変更、口の閉じ方の調整、さらには既存のビデオの翻訳など、独自のビデオ編集機能を提供します。アリババのEMOと比較すると、VLOGGERは動画編集機能に優れています。現在のビデオ生成効果はまだ改善の必要がありますが、AIビデオ生成の分野における革新的な試みは注目に値します。
Google は、テキストと音声駆動テクノロジーに基づいて、1 枚の写真から人間が話すビデオを生成するツールである VLOGGER を発表しました。 VLOGGERはアリババのEMOと比べて、表情の変更や口の閉じ方の調整、既存の動画を編集して翻訳できる動画編集機能を備えています。 VLOGGER は技術的にはユニークですが、ビデオ生成を改善する必要があります。
VLOGGER の登場は AI 動画生成技術の新たな進歩を示し、その独自の動画編集機能はユーザーにさらなるクリエイティブの可能性を提供します。今後、テクノロジーの成熟に伴い、VLOGGERは動画制作の分野でより大きな役割を果たし、より便利で豊かな動画体験をユーザーに提供できると考えています。将来的には VLOGGER がさらに改良され、より素晴らしいビデオ生成効果が得られることを楽しみにしています。