ByteのオープンソースリップシンクモデルLatentSyncは超リアルなリップシンクを実現
最近、ByteDance は、LatentSync と呼ばれる新しいリップシンク フレームワークをリリースしました。これは、オーディオ状態の潜在拡散モデルを使用して、より正確なリップシンクを実現することを目的としています。このフレームワークは安定拡散に基づいており、時間の一貫性を考慮して最適化されています。ピクセルの空間拡散や 2 段階の生成に基づくこれまでの手法とは異なり、Lat
2025-01-09