Downcodes小编获悉,智谱技术团队近日开源了其最新的视频生成模型CogVideoX v1.5,这是继8月份以来CogVideoX系列的又一次重大更新。此次更新带来了显著的性能提升,为开发者提供了更强大的视频生成工具,也标志着AI视频生成技术迈向了新的阶段。CogVideoX v1.5在视频长度、分辨率和帧率等方面都有了大幅提升,并增强了对复杂语义的理解能力,进一步拓展了其应用场景。
据了解,此次更新大幅提升了视频生成能力,包括支持5秒和10秒的视频长度、768P 的分辨率以及16帧的生成能力。同时,I2V(图像到视频)模型也支持任意尺寸比例,进一步增强了复杂语义的理解能力。
CogVideoX v1.5包含两个主要模型:CogVideoX v1.5-5B 和 CogVideoX v1.5-5B-I2V,旨在为开发者提供更强大的视频生成工具。
更值得关注的是,CogVideoX v1.5将同步上线至清影平台,并与新推出的 CogSound 音效模型结合,成为 “新清影”。新清影将提供多项特色服务,包括视频质量的显著提升、美学表现和运动合理性,支持生成10秒、4K、60帧的超高清视频。
官方介绍如下:
CogVideoX v1.5的开源,为AI视频生成领域带来了新的活力,也为开发者提供了更多可能性。 相信在未来,我们将看到更多基于CogVideoX v1.5的创新应用出现。 Downcodes小编将持续关注该领域的最新动态,为大家带来更多精彩报道。