OpenAI의 Sora 비디오 생성 모델은 강력한 비디오 생성 기능으로 널리 주목을 받았지만 훈련 데이터 소스는 혼란스러웠습니다. 이 기사에서는 Sora의 가능한 훈련 데이터 소스, 특히 게임 라이브 방송 및 전략 비디오가 수행하는 역할을 조사하고 발생할 수 있는 법적 문제와 향후 AI 개발에 미치는 영향을 분석합니다.
OpenAI의 비디오 생성 인공물인 Sora는 출시 이후 많은 관심을 받았지만 어디서 배웠는지는 항상 미스터리였습니다. 이제 미스터리의 일부가 밝혀진 것 같습니다. Sora의 훈련 데이터에는 Twitch의 수많은 게임 생방송 및 전략 비디오가 포함될 가능성이 높습니다!
Sora는 텍스트 프롬프트나 이미지만으로 최대 20초 길이의 비디오를 생성할 수 있고 다양한 화면 비율과 해상도를 제어할 수 있는 숙련된 "모방의 달인"과 같습니다. 오픈AI는 올해 2월 소라를 처음 공개했을 당시 '마인크래프트' 영상에서 해당 모델이 '연습에 집중 중'임을 암시한 바 있다. 그렇다면 소라의 '무술비밀'에는 '마인크래프트' 외에 또 어떤 게임 보물이 숨겨져 있을까?
소라는 다양한 게임 유형에 익숙한 것 같아서 결과는 놀랍습니다. "사소한 결함"이 있지만 "Mario"의 그림자가 있는 복제 게임 비디오를 생성할 수 있습니다. 또한 "Call of Duty" 및 "Counter-Strike"와 같은 스릴 넘치는 1인칭 슈팅 게임 화면을 시뮬레이션할 수도 있습니다. 또한 1990년대 아케이드 게임 '닌자터틀'의 격투장면을 재현해 어린시절 추억에 잠긴 듯한 느낌을 준다.
더욱 놀라운 점은 소라도 트위치 생방송의 형태를 잘 알고 있다는 점이다. 그만큼 많은 양의 생방송 콘텐츠를 '봤다'는 뜻이다. 소라가 제작한 영상 스크린샷은 생방송의 프레임 구조를 정확하게 포착했을 뿐만 아니라, 왼팔의 문신을 비롯해 유명 앵커 아론플레이의 모습을 생생하게 재현했다.
뿐만 아니라 소라는 또 다른 트위치 앵커 포키마네를 '알고' 자신과 비슷한 캐릭터의 영상을 제작하기도 했다. 물론, 저작권 문제를 피하기 위해 OpenAI는 Sora가 상표권이 있는 캐릭터가 포함된 비디오를 생성하지 못하도록 필터링 메커니즘을 설정했습니다.
OpenAI는 훈련 데이터의 출처에 대해 입을 다물고 있지만 Sora의 훈련 세트에 게임 콘텐츠가 포함될 가능성이 가장 높다는 징후가 있습니다. OpenAI의 전 CTO인 미라 물라티(Mira Mulati)는 지난 3월 월스트리트저널과의 인터뷰에서 소라가 훈련에 유튜브, 인스타그램, 페이스북의 콘텐츠를 활용했다는 사실을 직접적으로 부인하지 않았다. OpenAI는 또한 Sora의 기술 사양에서 "공개적으로 사용 가능한" 데이터와 Shutterstock과 같은 미디어 라이브러리의 라이선스 데이터를 사용한다는 점을 인정합니다.
게임 콘텐츠가 실제로 Sora를 훈련하는 데 사용된다면, 특히 OpenAI가 Sora를 기반으로 더욱 상호 작용적인 경험을 개발할 때 일련의 법적 문제가 발생할 수 있습니다. Pryor Cashman 지적재산권 변호사인 Joshua Weigensberg는 AI 모델을 훈련하려면 일반적으로 훈련 데이터를 복사해야 하고 게임 비디오에는 저작권으로 보호되는 콘텐츠가 많이 포함되어 있기 때문에 AI 훈련을 위해 게임 비디오를 무단으로 사용하면 큰 위험에 직면할 것이라고 지적했습니다.
Sora와 같은 생성 AI 모델은 확률을 기반으로 합니다. 그들은 대량의 데이터로부터 패턴을 학습하고 예측합니다. 이 능력을 통해 그들은 세상이 어떻게 작동하는지 "학습"할 수 있습니다. 그러나 숨겨진 위험도 있습니다. 특정 프롬프트에서 모델은 훈련 데이터와 매우 유사한 콘텐츠를 생성할 수 있습니다. 이는 창작자들 사이에서 자신의 작품이 무단으로 훈련에 사용되었다고 믿는 강한 불만을 불러일으켰습니다.
현재 Microsoft와 OpenAI는 라이선스 코드를 복사한 혐의로 자사의 AI 도구에 대해 고소를 당하고 있습니다. 미드저니(Midjourney), 런웨이(Runway), 스태빌리티AI(Stability AI) 등 AI 미술 응용업체들도 아티스트 권리를 침해했다는 비난을 받았다. 주요 음반사들도 인공지능 노래 생성기를 개발하는 스타트업인 유디오(Udio)와 수노(Suno)를 상대로 소송을 제기했다.
많은 AI 회사들은 그들의 모델이 표절이 아닌 "변형적인" 저작물을 만들어낸다고 주장하면서 오랫동안 "공정 사용" 원칙을 주장해 왔습니다. 하지만 게임 콘텐츠에는 고유한 특성이 있습니다. Dorsey & Whitney의 저작권 변호사인 Evan Everest는 게임 비디오에는 최소한 두 가지 저작권 보호 계층, 즉 게임 개발자가 소유한 게임 콘텐츠의 저작권과 플레이어 또는 비디오가 생성한 고유 비디오의 저작권이 포함되어 있음을 지적했습니다. 생산자. 일부 게임의 경우 세 번째 권리, 즉 사용자 생성 콘텐츠에 대한 저작권이 있을 수도 있습니다.
예를 들어 Fortnite를 사용하면 플레이어는 자신만의 게임 맵을 만들고 이를 다른 사람과 공유할 수 있습니다. 이러한 지도에 대한 게임 동영상에는 Epic, 게이머, 지도 제작자 등 최소 3명의 저작권 소유자가 포함됩니다. 법원이 AI 모델 훈련에 저작권 책임이 수반된다고 판단하는 경우 해당 저작권 소유자는 잠재적인 원고 또는 승인된 출처가 될 수 있습니다.
또한 Weigensberg는 게임 자체에도 판사가 지적 재산권 소송에서 고려할 수 있는 독점 텍스처와 같은 "보호 가능한" 요소가 많이 있다는 점을 지적했습니다.
현재 Epic, Microsoft(Minecraft 소유), Ubisoft, Nintendo, Roblox 및 Cyberpunk 2077 개발자 CD Projekt Red를 포함한 여러 게임 스튜디오와 출판사는 이 문제에 대해 언급하지 않았습니다.
AI 기업이 이러한 법적 분쟁에서 승리하더라도 이용자는 책임이 면제되지 않을 수 있다. 생성 모델이 저작권이 있는 저작물을 복사하는 경우 해당 저작물을 게시하거나 다른 프로젝트에 포함시킨 사람은 여전히 지적 재산권 침해에 대한 책임을 질 수 있습니다.
일부 AI 회사에는 이러한 상황에 대처하기 위해 보상 조항이 있지만 일반적으로 예외가 있습니다. 예를 들어 OpenAI의 약관은 개인 사용자가 아닌 기업 고객에게만 적용됩니다. 또한, 저작권 위험 외에도 상표 위반 등의 위험도 있습니다. 예를 들어 출력 콘텐츠에는 게임 내 캐릭터를 포함하여 마케팅 및 브랜딩에 사용되는 자산이 포함될 수 있습니다.
월드 모델에 대한 관심이 높아지면서 상황은 더욱 복잡해질 수 있습니다. 세계 모델을 적용하는 방법 중 하나는 실제 비디오 게임을 생성하는 것인데, 이러한 "합성" 게임이 모델이 훈련한 것과 너무 유사한 경우 법적 문제를 일으킬 수 있습니다.
맥쿨 스미스(McKool Smith)의 지적재산권 소송 변호사 에이버리 윌리엄스(Avery Williams)는 게임에서 AI 플랫폼을 훈련시키는 데 사용되는 음성, 동작, 캐릭터, 노래, 대화, 예술 작품 등의 요소가 저작권 침해에 해당한다고 지적했습니다. 생성 AI 회사를 상대로 제기된 수많은 소송에서 제기된 '공정 사용'에 대한 질문은 다른 크리에이티브 시장과 마찬가지로 비디오 게임 산업에도 동일한 영향을 미칠 것입니다.
Sora의 성공은 또한 콘텐츠 제작 분야에서 생성적 AI 기술의 엄청난 잠재력을 강조하지만 데이터 사용 및 지적 재산권에 대한 큰 과제도 드러냅니다. 기술 혁신과 지적재산권 보호의 균형을 어떻게 맞추느냐는 향후 AI 발전에서 해결해야 할 핵심 문제가 될 것이다. 앞으로 AI 모델에 대한 훈련 데이터의 출처와 적법성은 더욱 엄격한 조사를 받게 될 것이며 이는 향후 AI 산업 발전에 큰 영향을 미칠 것입니다.