阿里巴巴智能计算研究所近日发布了全新的生成式视频框架EMO,该框架具备令人瞩目的能力:仅需输入图片和音频,即可生成极具表现力的视频内容。EMO支持多语言、对话、唱歌等多种场景,为头像视频生成领域带来了新的可能性。然而,技术发展的同时也带来潜在的风险,例如深度伪造等问题需要引起重视。
阿里巴巴智能计算研究所推出新的生成式框架EMO,通过输入图片和音频即可生成具有表现力的视频。EMO支持多语言、对话、唱歌等场景,但也存在造假风险。该框架为头像视频生成领域带来新可能,但目前仅用于学术研究和效果演示,仍需进一步完善和扩展。
EMO框架的出现,预示着AI视频生成技术迈向新的台阶,其多场景应用潜力巨大。但同时,也需关注其潜在的伦理和社会风险,并加强技术监管,确保其健康发展,避免被滥用。