OpenAI の Sora ビデオ生成モデルは、その強力なビデオ生成機能が素晴らしいですが、そのトレーニング データ ソースが混乱を招いています。この記事では、Sora の考えられるトレーニング データ ソース、特にゲームのライブ ブロードキャストや戦略ビデオが果たす役割を詳しく掘り下げ、発生する可能性のある法的問題と将来の AI 開発への影響を分析します。
OpenAI のビデオ生成アーティファクト Sora は、発表以来多くの注目を集めてきましたが、どこから学習したのかは常に謎でした。今回、その謎の一部が明らかになったようです。ソラのトレーニングデータには、Twitch からのゲーム生放送や攻略動画が大量に含まれている可能性があります。
Sora は熟練した「模倣の達人」のようなもので、テキスト プロンプトや画像だけで最長 20 秒のビデオを生成でき、複数のアスペクト比と解像度を制御できます。 OpenAIがSoraを初めて発表した今年2月、同社は「Minecraft」のビデオでそのモデルが「練習に集中している」ことをほのめかしていた。では、ソラの「武道の秘伝」には、「Minecraft」以外にどのようなゲームの宝物が隠されているのでしょうか?
ソラはさまざまなタイプのゲームに精通しているようであるため、この結果は驚くべきものでした。 「マリオ」の影を含むクローン ゲーム ビデオを生成できますが、「小さな欠陥」もありますが、「コール オブ デューティ」や「カウンター ストライク」のようなスリリングな一人称シューティング ゲーム画面をシミュレートすることもできます。また、1990 年代のアーケード ゲーム「ティーンエイジ ミュータント ニンジャ タートルズ」の戦闘シーンを再現することもでき、子供時代の思い出に浸っているような気分にさせてくれます。
さらに驚くべきことは、Sora は Twitch ライブ ブロードキャストの形式もよく知っており、これは大量のライブ ブロードキャスト コンテンツを「視聴」していることを意味します。ソラによって生成されたビデオのスクリーンショットは、生放送のフレーム構造を正確にキャプチャしただけでなく、左腕のタトゥーを含め、有名なアンカーのオーロンプレイの画像を鮮明に復元しました。
それだけでなく、ソラは別の Twitch アンカー ポキマネを「知っており」、彼女に似たキャラクターのビデオを生成しました。もちろん、著作権の問題を回避するために、OpenAI は、Sora が商標登録されたキャラクターを含むビデオを生成しないようにフィルタリング メカニズムを設定しました。
OpenAI はトレーニング データのソースについては口を閉ざしていますが、Sora のトレーニング セットにはゲーム コンテンツが含まれている可能性が高いという兆候があります。 OpenAIの元CTO、ミラ・ムラティ氏は3月のウォール・ストリート・ジャーナルとのインタビューで、SoraがYouTube、Instagram、Facebookのコンテンツをトレーニングに使用したことを直接否定しなかった。 OpenAIはまた、Soraの技術仕様の中で、「公開されている」データだけでなく、Shutterstockなどのメディアライブラリからライセンスされたデータも使用していることを認めている。
実際にゲーム コンテンツが Sora のトレーニングに使用されている場合、特に OpenAI が Sora に基づいてよりインタラクティブなエクスペリエンスを開発する場合、一連の法的問題が引き起こされる可能性があります。プライアー・キャッシュマンの知的財産弁護士であるジョシュア・ワイゲンスバーグ氏は、AIモデルのトレーニングには通常トレーニングデータのコピーが必要であり、ゲームビデオには著作権で保護されたコンテンツが大量に含まれているため、AIトレーニングにゲームビデオを無断で使用することは大きなリスクに直面すると指摘した。
Sora などの生成 AI モデルは確率に基づいています。彼らは大量のデータからパターンを学習し、予測を行います。この能力により、彼らは世界がどのように機能するかを「学ぶ」ことができます。ただし、特定のプロンプトの下では、モデルがそのトレーニング データに非常によく似たコンテンツを生成する可能性もあります。これは、自分の作品が無断で訓練に使用されたと考えたクリエイターの間で強い不満を引き起こしました。
現在、MicrosoftとOpenAIは、自社のAIツールがライセンスコードをコピーした疑いで訴訟を起こされている。 Midjourney、Runway、Stability AIなどのAIアートアプリケーション企業も、アーティストの権利を侵害しているという告発に直面している。大手音楽会社も、AIソングジェネレーターを開発する新興企業のUdioとSunoに対して訴訟を起こしている。
多くのAI企業は長年、自社のモデルが盗作ではなく「変革的な」作品を生み出していると主張し、「フェアユース」原則を主張してきた。しかし、ゲーム内容には独自の特徴があります。 Dorsey & Whitney の著作権弁護士である Evan Everest 氏は、ゲームビデオには少なくとも 2 つの著作権保護層が含まれていると指摘しました。1 つはゲーム開発者が所有するゲームコンテンツの著作権、もう 1 つはプレイヤーまたはビデオが作成した独自のビデオの著作権です。プロデューサー。一部のゲームでは、第 3 層の権利、つまりユーザー作成コンテンツの著作権が存在する場合もあります。
たとえば、Fortnite では、プレイヤーが独自のゲーム マップを作成し、他のユーザーと共有できます。これらのマップに関するゲーム ビデオには、Epic、ゲーマー、マップ作成者という少なくとも 3 人の著作権所有者が関与しています。 AI モデルのトレーニングに著作権責任が伴うと裁判所が判断した場合、これらの著作権所有者が潜在的な原告または認定情報源となる可能性があります。
さらに、ワイゲンスベルク氏は、ゲーム自体にも独自のテクスチャなど、裁判官が知的財産訴訟で考慮する可能性のある「保護可能な」要素が多数含まれているとも指摘した。
現在、エピック、マイクロソフト(Minecraft を所有)、ユービーアイソフト、任天堂、ロブロックス、サイバーパンク 2077 の開発会社 CD Projekt Red を含む複数のゲーム スタジオやパブリッシャーはこの件についてコメントしていません。
たとえAI企業がこうした法的紛争に勝ったとしても、ユーザーは責任を免除されない可能性がある。生成モデルが著作権で保護された作品をコピーした場合、その作品を公開したり他のプロジェクトに組み込んだ人は依然として知的財産侵害の責任を問われる可能性があります。
一部の AI 企業はこのような状況に対処するために補償条項を設けていますが、通常は例外があります。たとえば、OpenAI の規約は企業顧客にのみ適用され、個人ユーザーには適用されません。また、著作権リスクに加えて、出力コンテンツにゲーム内のキャラクターなどマーケティングやブランディングに使用されるアセットが含まれる可能性があるなど、商標権侵害などのリスクもあります。
世界モデルへの関心が高まるにつれて、状況はより複雑になる可能性があります。ワールド モデルの応用例の 1 つは、現実のビデオ ゲームを生成することですが、これらの「合成」ゲームがモデルのトレーニングに使用されたものとあまりにも類似している場合、法的問題が発生する可能性があります。
マックール・スミスの知的財産訴訟弁護士、エイブリー・ウィリアムズ氏は、ゲーム内でAIプラットフォームを訓練するために使用される音声、動き、キャラクター、歌、対話、アートワークなどの要素は著作権侵害に当たると指摘した。生成型 AI 企業に対する多数の訴訟で提起された「フェアユース」に関する疑問は、他のクリエイティブ市場と同様にビデオゲーム業界にも影響を与えるでしょう。
Sora の成功は、コンテンツ作成分野における生成 AI テクノロジーの大きな可能性を浮き彫りにしましたが、データ使用と知的財産権における大きな課題も明らかにしました。今後のAIの発展においては、技術革新と知的財産保護をどのように両立させるかが重要な課題となる。 将来的には、AI モデルのトレーニング データのソースとその合法性がより厳格な調査の対象となり、AI 業界の将来の発展に重大な影響を与えることになります。