近日,OpenAI 发布了一则引人注目的消息:在其内部测试的项目 Sora 中,除了已经推出的视频生成功能外,图像生成功能也在紧锣密鼓地研发中。这个新功能让用户能够在视频和图像生成之间快速切换,提升创作的灵活性。
根据内部消息,Sora 将会增加一个隐藏的切换按钮,用户只需在提示栏中选择即可在两种模式之间切换。当选择图像生成时,系统会自动提示用户描述一幅图像。这一设计旨在简化用户操作,提高生成内容的相关性和质量。
除了图像生成功能的改进,Sora 还对其视频推送进行了重新分类。新推出的 “Best” 和 “Top” 类别将帮助用户更好地筛选和查找内容。“Best” 类别与目前的特色频道类似,而 “Top” 类别则可能根据用户点赞数或时间段对视频进行排名。这一分类的变化让人们对 Sora 的内容推荐机制充满期待。
对于 DALL-E3的用户来说,这一消息无疑让人兴奋,因为 DALL-E3自发布以来已经显得有些过时,特别是在与 Midjourney 等竞争对手相比时。尽管目前 Sora 的图像生成功能尚未正式推出,但左侧导航栏中的 “Images Internal” 类别已经引发了用户的好奇心。虽然目前这个类别主要用于视频推送,但未来也可能会提供图片生成的相关内容。
有人猜测,这次的图像生成模型或许会被称为 DALL-E4,然而 OpenAI 尚未对此进行确认。业内专家推测,Sora 中的图像生成器可能不会直接使用 DALL-E4,而是会依赖于现有的 “sora-turbo” 模型。此外,业内人士也指出,ChatGPT 尚未推出基于 GPT-4o 的多模态图像生成功能,因此此次 Sora 项目的推出将是一个值得关注的新进展。
值得注意的是,Sora 中的文本到图像生成器的代号被称为 “papaya”,让人对这个项目充满好奇与期待。在 DALL-E3发布一年半之后,下一代模型究竟会带来怎样的创新,令人不禁想要一探究竟。
总之,Sora 的图像生成功能即将推出,为用户提供更多创作可能性,值得期待。