Google обновляет модель генерации видео AI Veo2, разрешение 4K, оценка предпочтений человека лучше, чем у Sora

Автор：Eve Cole Время обновления：2024-12-19 12:32:01

Google выпустила новую модель поколения видео Veo2, призванную конкурировать с Sora от OpenAI. Veo2 значительно улучшил реализм видео и детализацию, а также лучше понимает физические законы, движения человека и тонкие изменения в выражениях лиц. Это обновление не только улучшает качество видео, но и расширяет возможности модели понимать и выполнять инструкции пользователя, предоставляя более мощный инструмент для создания видео. С помощью платформы VideoFX от Google Labs пользователи могут испытать мощные функции Veo2, создавать видео с разрешением до 4K и выбирать типы видео, объективы и эффекты фильмов. Однако следует отметить, что Veo2 в настоящее время доступен только пользователям в списке ожидания, и им необходимо подать заявку через форму Google.

Google официально выпустила модель поколения видео нового поколения Veo2, стремясь составить конкуренцию Sora от OpenAI. Google утверждает, что Veo2 демонстрирует большую реалистичность и детализацию при создании видео. Это обновление не только улучшает качество видео, но и улучшает понимание реальной физики и нюансов человеческих движений и выражений.

Сила Veo2

Google утверждает, что Veo2 «лучше понимает физику реального мира и нюансы человеческих движений и выражений». Он доступен на платформе VideoFX от Google Labs, но только в списке ожидания. Пользователям необходимо зарегистрироваться через форму Google и дождаться, пока Google временно предоставит доступ в выбранное ими время.

В Google заявили, что пользователи смогут выбирать тип видео, объектив и киноэффекты в соответствии со своими потребностями, а Veo2 сможет генерировать видео с разрешением до 4K.

Напротив, оригинальный Veo по-прежнему доступен на Vertex AI, а видео, созданные Veo2, будут иметь водяной знак SynthID в метаданных Google, чтобы идентифицировать его как контент, созданный AI.

Несмотря на технические достижения Veo2, Google признает, что модель иногда демонстрирует «галлюцинации», такие как появление дополнительных пальцев, но в целом новая версия вызывает меньше галлюцинаций.

Google сообщил, что в ходе собственного внутреннего тестирования, которое измеряет «общее предпочтение» (т. е. какое видео предпочитают зрители) и «своевременное соответствие» (насколько хорошо видео соответствует инструкциям, данным создателями-людьми), оценщики-люди отдали предпочтение Veo, а не искусственному разведывательные модели Соры и других конкурентов.

Вход в Veo2: https://labs.google/fx/tools/video-fx.

Вводный вход: https://deepmind.google/technologies/veo/veo-2/.

Генерация видео с помощью искусственного интеллекта все еще нуждается в доработке

Хотя технология создания видео с помощью искусственного интеллекта постоянно совершенствуется, конкуренция между Google и крупными игроками, такими как OpenAI, остается жесткой. Другие более мелкие компании, такие как RunwayML и Luma AI, также внедряют новые функции для расширения своих возможностей по созданию видео.

Недавно компания RunwayML представила расширенные функции управления для модели Gen-3Alpha Turbo, а Pika Labs выпустила Pika 2.0, позволяющую пользователям добавлять в видео своих собственных персонажей.

Однако доверие пользователей к видеороликам, созданным ИИ, по-прежнему недостаточно. Выпуск Соры не полностью устранил сомнения людей, и некоторые пользователи сообщили, что полученные результаты имели физические и анатомические нарушения. Кроме того, зрители на недавних церемониях вручения игровых наград выразили недовольство «хаосом ИИ» в контенте, созданном ИИ.

Google сообщил, что многие пользователи выразили большой интерес к Veo2, особенно некоторые авторы YouTube, которые уже используют VideoFX для создания фона для своих коротких видеороликов, чтобы сэкономить время.

Обновления Imagen3

В дополнение к Veo2 Google также обновила свою модель генерации изображений Imagen3, которая еще больше повышает реалистичность и яркость цветов создаваемых изображений. Новая версия Imagen3 может более точно отображать различные художественные стили: от фотографического реализма до импрессионизма, абстрактных стилей и стилей аниме. В то же время модель лучше выполняла инструкции пользователя.

Основные моменты:

- Google выпускает модель генерации видео Veo2, утверждая, что ее качество видео лучше, чем у Sora OpenAI.

- Пользователи могут подать заявку на использование Veo2 через форму Google и могут выбирать стили и эффекты при создании видео.

- Обновленная модель генерации изображений Imagen3 может лучше выражать различные художественные стили и обеспечивать лучший пользовательский опыт.

В целом, появление Veo2 знаменует собой еще один шаг вперед в технологии генерации видео с помощью искусственного интеллекта, но также показывает, что эта область все еще сталкивается с множеством проблем. Постоянное развитие технологий и улучшение пользовательского опыта станут будущим направлением развития.