最近、メディアは、Nvidia が AI モデルをトレーニングするために密かに YouTube のビデオ データを大規模に取得したことを明らかにし、広範な法的および倫理的な論争を引き起こしました。この動きには、Cosmos 深層学習モデルや自動運転アルゴリズムなど、Nvidia の AI 製品の多くが含まれています。データ取得方法は隠蔽されており、ビデオ作成者と Google の許可は得られていません。 NVIDIA の社内電子メールによると、上級幹部はこの行為について楽観的であり、「完全に承認された」と考えているようですが、この声明は、この行為がプラットフォームの利用規約に違反していると明確に述べた Google の公式声明に反しています。関与する膨大なデータ、秘密の操作方法、各関係者の全く異なる対応により、この事件は懸念事項となっています。
最近、テクノロジー大手エヌビディアによるデータ収集における秘密工作が暴露されました。メディア 404 の報道によると、Nvidia は大量の YouTube 動画データを取得して人工知能モデルをトレーニングしましたが、これは法律と倫理の点で非常に曖昧です。
レポートでは、Nvidia がこれらのビデオ データを使用して、Cosmos 深層学習モデル、自動運転アルゴリズム、デジタル ヒューマン AI アバター製品、3D ワールド構築ツール Omniverse などの複数の AI モデルをトレーニングしていると指摘しました。
Nvidia は、データ スクレイピング行為を隠蔽するために、複数の「仮想マシン」を使用し、YouTube に発見されるのを避けるために IP アドレスを常に変更するなど、多くの秘密措置を講じてきたことがわかっています。さらに、ビデオ作成者および YouTube の親会社である Google は、このデータ スクレイピング活動に対していかなる許可も与えていません。 Nvidia の社内コミュニケーションは、同社の戦略が非常に大胆であることを示しています。ある幹部は電子メールで、人間の生涯に相当する視覚体験データを毎日生成できる「ビデオ データ ファクトリー」を構築していると述べました。
興味深いことに、従業員がそのようなデータ取得の合法性と倫理について懸念を表明したとき、経営陣はこれすべてが高度な決定であると信じて、非常に自信を持っていたようでした。メールには「私たちはすべてのデータを全面的に承認している」と書かれていた。
さらに問題なのは、もともと学術研究のために作成された 1 億 3,000 万本の YouTube ビデオを含む HD-VG-130M データセットを Nvidia が使用していることを以前から知っていたことです。これには多くの専門家が、研究に使われるデータの商用化は不適切だと強い不満を表明している。
AI 業界の中核企業として、NVIDIA は市場で重要な地位を占めており、そのグラフィックス プロセッシング ユニット (GPU) は、多くの計算集約型 AI システムの基盤となっています。 OpenAI、Microsoft、Google など、Nvidia と協力している企業は、この動作について懸念を表明しています。 Googleの広報担当者は、YouTubeのデータを許可なく使用することはプラットフォームの利用規約への明らかな違反であると述べた。
メディアに応じて、Nvidia は、自社の AI トレーニング実践は「著作権法の精神と文言に完全に準拠している」と主張しました。しかし、このコンテンツを利用するクリエイターはこの発言についてどう思うのでしょうか?
ハイライト:
NvidiaはAIトレーニングのために大量のYouTubeビデオデータを密かに収集しており、法的および倫理的な問題に対する懸念が高まっています。
? 内部電子メールによると、NVIDIA 幹部はこの行為が完全に承認されており、その態度は非常に大胆であると信じていました。
? GoogleはYouTubeのデータを許可なく使用することは明らかにプラットフォームの利用規約に違反していると指摘し、Nvidiaの対応は物議を醸した。
NVIDIA のデータ スクレイピング行為は、AI データ取得の倫理と法律について広範な議論を引き起こしましたが、NVIDIA の対応は論争を鎮めることができませんでした。この事件は、大手テクノロジー企業がデータの利用において直面している課題と、関連する法律や規制の改善が急務であることを浮き彫りにしました。今後も同様の事件が引き続き注目を集め、業界の自制強化とデータ利用行動の標準化を促す可能性がある。