Модель генерации видео Sora от OpenAI привлекла широкое внимание. Ее мощные возможности генерации видео просто поразительны, но источник обучающих данных сбивает с толку. В этой статье мы углубимся в возможные источники данных обучения Соры, особенно в роли прямых трансляций игр и стратегических видеороликов, а также проанализируем юридические проблемы, которые могут возникнуть, и их влияние на будущее развитие ИИ.
Артефакт Sora для генерации видео OpenAI привлек много внимания с момента его запуска, но откуда он взялся, всегда оставалось загадкой. Теперь, кажется, часть тайны раскрыта: данные тренировок Соры, вероятно, содержат большое количество прямых трансляций игр и стратегических видеороликов с Twitch!
Сора похож на опытного «мастера имитации», способного создавать видеоролики продолжительностью до 20 секунд с помощью только текстовых подсказок или изображений, а также управлять несколькими соотношениями сторон и разрешениями. В феврале этого года, когда OpenAI впервые представила Sora, в видеоролике «Minecraft» она намекнула, что ее модель «концентрируется на практике». Итак, помимо «Майнкрафта», какие еще игровые сокровища спрятаны в «Секретах боевых искусств» Соры?
Результаты удивительны, поскольку Сора, похоже, знаком с различными типами игр. Он может генерировать клонированное игровое видео с тенью «Марио», хотя есть некоторые «незначительные недостатки»; он также может имитировать захватывающий экран игры-стрелялки от первого лица, как в «Call of Duty» и «Counter-Strike». «объединены»»; он также может воссоздать боевые сцены аркадной игры «Черепашки-ниндзя» 1990-х годов, заставляя людей чувствовать себя так, будто они погружены в детские воспоминания.
Что еще более удивительно, так это то, что Сора также хорошо знает форму прямых трансляций Twitch, а это означает, что он «просмотрел» большое количество контента прямых трансляций. Видеоскриншоты, созданные Сорой, не только точно передали структуру кадра прямого эфира, но и ярко восстановили образ известного ведущего Auronplay, включая татуировку на его левой руке.
Мало того, Сора также «знает» другую ведущую Twitch Покимане и создал видео с персонажем, похожим на нее. Конечно, чтобы избежать проблем с авторскими правами, OpenAI установила механизм фильтрации, который не позволяет Sora создавать видео, содержащие символы, защищенные торговыми марками.
Хотя OpenAI хранит молчание об источнике своих обучающих данных, есть признаки того, что игровой контент, скорее всего, включен в обучающий набор Соры. В мартовском интервью Wall Street Journal Мира Мулати, бывший технический директор OpenAI, не отрицала напрямую, что Сора использовал для обучения контент с YouTube, Instagram и Facebook. OpenAI также признает в технических спецификациях Sora, что использует «общедоступные» данные, а также лицензионные данные из медиабиблиотек, таких как Shutterstock.
Если игровой контент действительно будет использоваться для обучения Соры, это может вызвать ряд юридических проблем, особенно когда OpenAI разработает более интерактивный опыт на основе Соры. Юрист по интеллектуальной собственности Pryor Cashman Джошуа Вайгенсберг отметил, что несанкционированное использование игровых видеороликов для обучения ИИ сопряжено с огромными рисками, поскольку обучение моделей ИИ обычно требует копирования данных обучения, а игровые видеоролики содержат большое количество контента, защищенного авторским правом.
Генеративные модели ИИ, такие как Сора, основаны на вероятности. Они изучают закономерности на основе больших объемов данных и делают прогнозы. Эта способность позволяет им «изучить», как устроен мир. Но есть и скрытые опасности. При определенных подсказках модель может генерировать контент, очень похожий на ее обучающие данные. Это вызвало резкое недовольство создателей, которые считали, что их произведения используются для обучения без разрешения.
В настоящее время против Microsoft и OpenAI судятся из-за того, что их инструменты искусственного интеллекта якобы копируют лицензионный код. Компании, занимающиеся применением искусственного интеллекта, такие как Midjourney, Runway и Stability AI, также столкнулись с обвинениями в нарушении прав художников. Крупные музыкальные компании также подали иски против Udio и Suno, стартапов, разрабатывающих генераторы песен с использованием искусственного интеллекта.
Многие компании, занимающиеся искусственным интеллектом, уже давно выступают за принципы «справедливого использования», утверждая, что их модели создают «преобразующие» работы, а не плагиат. Но игровой контент имеет свои особенности. Эван Эверест, адвокат по авторским правам компании Dorsey & Whitney, отметил, что игровые видеоролики включают как минимум два уровня защиты авторских прав: авторские права на игровой контент, принадлежащие разработчику игры, и авторские права на уникальное видео, созданное игроком или видео. продюсер. Для некоторых игр также может существовать третий уровень прав, а именно авторские права на пользовательский контент.
Например, Fortnite позволяет игрокам создавать свои собственные игровые карты и делиться ими с другими. В игровом видеоролике об этих картах участвуют как минимум три правообладателя: Epic, геймеры и создатели карт. Если суд определит, что обучение модели ИИ влечет за собой ответственность за авторские права, эти владельцы авторских прав могут стать потенциальными истцами или уполномоченными источниками.
Кроме того, Вейгенсберг также отметил, что сама игра также имеет множество «охраняемых» элементов, таких как фирменные текстуры, которые судьи могут учитывать в судебных разбирательствах по вопросам интеллектуальной собственности.
В настоящее время многие игровые студии и издатели, включая Epic, Microsoft (владеющая Minecraft), Ubisoft, Nintendo, Roblox и CD Projekt Red, разработчика Cyberpunk 2077, не прокомментировали этот вопрос.
Даже если компании, занимающиеся искусственным интеллектом, выиграют эти юридические споры, пользователи не могут быть освобождены от ответственности. Если генеративная модель копирует произведение, защищенное авторским правом, лицо, которое публикует произведение или включает его в другие проекты, все равно может быть привлечено к ответственности за нарушение прав интеллектуальной собственности.
Некоторые компании, занимающиеся искусственным интеллектом, имеют положения о возмещении убытков на случай таких ситуаций, но обычно бывают исключения. Например, условия OpenAI применяются только к корпоративным клиентам, а не к отдельным пользователям. Кроме того, помимо рисков, связанных с авторским правом, существуют также такие риски, как нарушение прав на товарные знаки: например, выходной контент может содержать активы, используемые для маркетинга и брендинга, включая внутриигровых персонажей.
По мере роста интереса к моделям мира ситуация может усложниться. Одним из применений моделей мира является создание реальных видеоигр, что может вызвать юридические проблемы, если эти «синтетические» игры слишком похожи на то, на чем обучалась модель.
Эйвери Уильямс, адвокат по делам об интеллектуальной собственности в McKool Smith, отметил, что такие элементы, как голоса, движения, персонажи, песни, диалоги и произведения искусства, используемые для обучения платформы ИИ в играх, представляют собой нарушение авторских прав. Вопросы о «добросовестном использовании», поднятые в многочисленных судебных процессах против компаний, занимающихся генеративным искусственным интеллектом, окажут такое же влияние на индустрию видеоигр, как и другие творческие рынки.
Успех Соры также подчеркивает огромный потенциал генеративной технологии искусственного интеллекта в области создания контента, но также обнажает огромные проблемы в использовании данных и правах интеллектуальной собственности. Как сбалансировать технологические инновации и защиту интеллектуальной собственности, станет ключевым вопросом, который необходимо решить в будущем развитии ИИ. В будущем источник данных обучения моделей ИИ и их законность будут подвергаться более строгому контролю, что окажет глубокое влияние на будущее развитие индустрии ИИ.