最近、ニューヨーク・タイムズとデイリー・ニュースは、OpenAIがその著作物を許可なくAIモデルのトレーニングに使用したとして、OpenAIに対して著作権訴訟を起こした。この訴訟は、OpenAI のエンジニアが訴訟にとって重要と思われる証拠を誤って削除したという事実に焦点を当てており、広く懸念を引き起こしました。この動きは、この事件の裁判プロセスに影響を与えただけでなく、大規模な言語モデルのトレーニング中のデータ処理の潜在的なリスクと倫理的問題も明らかにしました。この記事では、この事件の全容を詳細に分析し、人工知能産業の発展への影響を探ります。
最近、ニューヨーク・タイムズ紙とデイリー・ニュース紙は共同でOpenAIを告訴し、彼らの著作物を許可なく人工知能モデルのトレーニングに使用したとして非難した。
原告の法務チームが最新の法廷文書で、OpenAIのエンジニアが関連データを処理する際に訴訟に重要な影響を与える可能性のある証拠を誤って削除したと指摘したため、訴訟の展開は世間の注目を集めた。
OpenAIは、原告の法務チームが著作権で保護されたコンテンツのトレーニングデータを検索できるように、この秋に2台の仮想マシンを提供することに同意したと報告されている。仮想マシンは、コンピュータ オペレーティング システム内で実行される仮想コンピュータであり、通常はテスト、データ バックアップ、およびアプリケーションの実行に使用されます。ニューヨーク・タイムズとデイリー・ニュースの法律顧問と彼らに雇われた専門家は、11月1日以来、OpenAIのトレーニング・データに150時間以上取り組んできた。
しかし、11 月 14 日、OpenAI エンジニアは仮想マシンの 1 つに保存されていた検索データを誤って消去してしまいました。原告側の弁護士からの書簡によると、OpenAIは失われたデータの復元を試み、ほとんどのケースで成功したが、フォルダー構造やファイル名が異なっていたため、復元されたデータを原告の記事がどのニュースであるかを判断するために使用することはできなかったとしている。 「回復不能。」 OpenAI モデルのトレーニングにどのように使用されるか。
原告側の弁護士は、削除が意図的であったとは考えていないが、今回の事件はOpenAIが「自社のデータセットで侵害の可能性のあるコンテンツを検索するのに最適な立場にある」ことを示していると述べた。これは、OpenAI が独自のツールを使用して、関連する侵害コンテンツをより効率的に見つける必要があることを意味します。
OpenAIは、この件や他の同様の件において、公開されているデータをモデルトレーニングに使用することはフェアユースであると主張している。これは、OpenAI が、これらのモデルから収益を得ているにもかかわらず、これらのサンプルの使用に対してロイヤルティを支払う必要がないと考えていることを意味します。
OpenAIがAP通信、Business Insider、Financial Timesなどを含む、ますます多くの新しいメディアとライセンス契約を結んでいることは言及する価値がありますが、OpenAIはこれらの契約の具体的な条件を明らかにしていません。コンテンツパートナーのDotdashは年間少なくとも1,600万米ドルの報酬を受け取っていると報告されている。
法的係争にもかかわらず、OpenAIは特定の著作物をAIトレーニングに許可なく使用することを肯定も否定もしていない。
ハイライト:
OpenAIは、著作権訴訟で潜在的に重要な証拠を誤って削除したとして告発されている。
原告側の弁護士らは、データの回復に多大な時間と労力を費やしたと述べた。
OpenAI は、モデルをトレーニングするために公的に入手可能なデータを使用することはフェアユースであると主張しています。
この事件は、人工知能モデルのトレーニング データのソースと著作権の問題の複雑さを浮き彫りにし、データのセキュリティと証拠管理に対する懸念も引き起こしています。 OpenAIの行為が侵害に該当するかどうか、また「フェアユース」の境界をどのように定義するかは、今後さらなる議論が必要な重要な問題となるだろう。 この訴訟の最終的な結果は、人工知能産業の発展に大きな影響を与えるでしょう。