Недавно Openai выпустила убедительные новости: в своем проекте внутреннего тестирования Sora, в дополнение к запущенной функции генерации видео, функция генерации изображений также разрабатывается в полном разгаре. Эта новая функция позволяет пользователям быстро переключаться между видео и генерацией изображений, улучшая творческую гибкость.
Согласно внутренним сообщениям, SORA добавит скрытую кнопку переключения, и пользователи могут переключаться между двумя режимами, просто выбрав в панели приглашения. При выборе генерации изображений система автоматически предложит пользователю описать изображение. Этот дизайн предназначен для упрощения операций с пользователями и улучшения актуальности и качества генерируемого контента.
В дополнение к улучшению возможностей генерации изображений, SORA также реклассифицировала свой видео -толчок. Недавно запущенные категории «Лучшие» и «Топ» помогут пользователям лучше фильтровать и найти контент. «Лучшая» категория похожа на текущие представленные каналы, в то время как категория «Top» может оценивать видео на основе количества лайков от пользователей или периодов времени. Это изменение в категории заставляет людей с нетерпением ждать механизма рекомендаций Соры.
Для пользователей Dall-E3 новости, несомненно, захватывающие, поскольку Dall-E3 был несколько устаревшим с момента ее запуска, особенно по сравнению с такими конкурентами, как Midjourney. Хотя функция генерации изображений Sora еще не была официально запущена, категория «внутренняя» изображения в левой навигационной панели вызвала любопытство пользователей. Хотя эта категория в настоящее время используется в основном для видеопроката, она также может предоставить связанный контент для генерации изображений в будущем.
Некоторые люди предполагают, что эта модель генерации изображений можно назвать Dall-E4, но OpenAI еще не подтвердила этого. Отраслевые эксперты предполагают, что генератор изображений в SORA может не использовать Dall-E4 напрямую, но будет полагаться на существующую модель «Sora-Turbo». Кроме того, инсайдеры отрасли также указали, что CHATGPT еще не запустил функцию генерации мультимодальной изображения на основе GPT-4O, поэтому запуск проекта SORA станет новым прогрессом, заслуживающим внимания.
Стоит отметить, что кодовое название генератора текста до изображения в Соре называется «папайя», что делает людей любопытными и ожидаемыми в этом проекте. Через полтора года после выхода Dall-E3, какое инновации принесет модель следующего поколения, что заставляет людей хотеть выяснить.
Короче говоря, функция генерации изображений Sora будет запущена, предоставляя пользователям более творческие возможности, которые стоит с нетерпением ждать.