OpenAI于近日发布了其备受期待的视频生成模型Sora Turbo,此举标志着2024年生成式AI领域取得了重大突破。 Sora Turbo在视频生成效率和时长上都有显着提升,能够根据文本、图片或视频提示生成最高达20秒的1080P高清视频,并支持多种功能,如超分、超帧和HDR游戏阵容的全游戏支持等,极大提升了用户体验。其强大的功能和便捷的使用方式,使其成为目前全球生成时长最高的视频模型之一。
OpenAI在今日的直播中发布了备受期待的产品——Sora Turbo,标志着2024年生成式AI领域的一大突破。 Sora Turbo的生成效率显着提升,能够通过文本直接生成最多20秒的1080P视频,成为目前全球生成时长最高的视频模型之一。该模型支持文本加图片或视频的输入,生成特定视频内容,使生成效果更加可控。
Sora Turbo的技术亮点包括超分、超帧和HDR游戏阵容的全游戏支持,以及两个基于独显的自研功能升级。其中,触控动态插帧功能可以显着提升插帧准确性,减少画面破损;游戏暗夜模式则通过AI算法提升暗部细节,增强暗部可视效果,同时解决了暗光环境下玩游戏的亮度问题。
目前,Sora已进入无限制使用阶段,对于ChatGPT Plus和Pro会员来说,使用Sora无需额外费用,这一政策被认为非常良心。 OpenAI还开发了全新UI,并提供社区分享服务,允许用户分享自己生成的视频,或借鉴他人的提示效果来完善自己的作品。
Sora的技术原理包括对Patch的应用,允许在大量图像和视频数据上进行密集训练,以及视频压缩网络的应用,降低视觉数据维度,提高输出质量。
Sora还融合了扩散模型与Transformer架构,采用创新的扩散式转换器方法,取代了传统的U-Net架构,有效提升了对输入图像与文本标签之间分布关系的捕捉能力。此外,Sora引入了DALL・E3的重新字幕技术,通过训练具备高度描述性的字幕模型,为训练集中的所有视频创建文本字幕,提升文本的保真度和视频的整体质量。
体验地址:https://sora.com/
Sora Turbo的出现,不仅提升了AI视频生成的效率和质量,也为用户提供了更便捷、更强大的创作工具。 OpenAI的开放政策和社区分享功能,进一步推动了AI技术的普及和发展。相信Sora Turbo将会在未来AI视频生成领域发挥更大的作用,为用户带来更多惊喜。