Google выпустила новую модель поколения видео Veo2, призванную конкурировать с Sora от OpenAI. Veo2 значительно улучшил реализм видео и детализацию, а также лучше понимает физические законы, движения человека и тонкие изменения в выражениях лиц. Это обновление не только улучшает качество видео, но и расширяет возможности модели понимать и выполнять инструкции пользователя, предоставляя более мощный инструмент для создания видео. С помощью платформы VideoFX от Google Labs пользователи могут испытать мощные функции Veo2, создавать видео с разрешением до 4K и выбирать типы видео, объективы и эффекты фильмов. Однако следует отметить, что Veo2 в настоящее время доступен только пользователям в списке ожидания, и им необходимо подать заявку через форму Google.
Google официально выпустила модель поколения видео нового поколения Veo2, стремясь составить конкуренцию Sora от OpenAI. Google утверждает, что Veo2 демонстрирует большую реалистичность и детализацию при создании видео. Это обновление не только улучшает качество видео, но и улучшает понимание реальной физики и нюансов человеческих движений и выражений.
Сила Veo2
Google утверждает, что Veo2 «лучше понимает физику реального мира и нюансы человеческих движений и выражений». Он доступен на платформе VideoFX от Google Labs, но только в списке ожидания. Пользователям необходимо зарегистрироваться через форму Google и дождаться, пока Google временно предоставит доступ в выбранное ими время.
В Google заявили, что пользователи смогут выбирать тип видео, объектив и киноэффекты в соответствии со своими потребностями, а Veo2 сможет генерировать видео с разрешением до 4K.
Напротив, оригинальный Veo по-прежнему доступен на Vertex AI, а видео, созданные Veo2, будут иметь водяной знак SynthID в метаданных Google, чтобы идентифицировать его как контент, созданный AI.
Несмотря на технические достижения Veo2, Google признает, что модель иногда демонстрирует «галлюцинации», такие как появление дополнительных пальцев, но в целом новая версия вызывает меньше галлюцинаций.
Google сообщил, что в ходе собственного внутреннего тестирования, которое измеряет «общее предпочтение» (т. е. какое видео предпочитают зрители) и «своевременное соответствие» (насколько хорошо видео соответствует инструкциям, данным создателями-людьми), оценщики-люди отдали предпочтение Veo, а не искусственному разведывательные модели Соры и других конкурентов.
Вход в Veo2: https://labs.google/fx/tools/video-fx.
Вводный вход: https://deepmind.google/technologies/veo/veo-2/.
Генерация видео с помощью искусственного интеллекта все еще нуждается в доработке
Хотя технология создания видео с помощью искусственного интеллекта постоянно совершенствуется, конкуренция между Google и крупными игроками, такими как OpenAI, остается жесткой. Другие более мелкие компании, такие как RunwayML и Luma AI, также внедряют новые функции для расширения своих возможностей по созданию видео.
Недавно компания RunwayML представила расширенные функции управления для модели Gen-3Alpha Turbo, а Pika Labs выпустила Pika 2.0, позволяющую пользователям добавлять в видео своих собственных персонажей.
Однако доверие пользователей к видеороликам, созданным ИИ, по-прежнему недостаточно. Выпуск Соры не полностью устранил сомнения людей, и некоторые пользователи сообщили, что полученные результаты имели физические и анатомические нарушения. Кроме того, зрители на недавних церемониях вручения игровых наград выразили недовольство «хаосом ИИ» в контенте, созданном ИИ.
Google сообщил, что многие пользователи выразили большой интерес к Veo2, особенно некоторые авторы YouTube, которые уже используют VideoFX для создания фона для своих коротких видеороликов, чтобы сэкономить время.
Обновления Imagen3
В дополнение к Veo2 Google также обновила свою модель генерации изображений Imagen3, которая еще больше повышает реалистичность и яркость цветов создаваемых изображений. Новая версия Imagen3 может более точно отображать различные художественные стили: от фотографического реализма до импрессионизма, абстрактных стилей и стилей аниме. В то же время модель лучше выполняла инструкции пользователя.
Основные моменты:
- Google выпускает модель генерации видео Veo2, утверждая, что ее качество видео лучше, чем у Sora OpenAI.
- Пользователи могут подать заявку на использование Veo2 через форму Google и могут выбирать стили и эффекты при создании видео.
- Обновленная модель генерации изображений Imagen3 может лучше выражать различные художественные стили и обеспечивать лучший пользовательский опыт.
В целом, появление Veo2 знаменует собой еще один шаг вперед в технологии генерации видео с помощью искусственного интеллекта, но также показывает, что эта область все еще сталкивается с множеством проблем. Постоянное развитие технологий и улучшение пользовательского опыта станут будущим направлением развития.