Meta Company は、最新の AI チャットボット Llama3 のトレーニング データのソースをめぐって大きな論争を引き起こしました。開示された文書によると、Meta は海賊版電子書籍 Web サイト Library Genesis (LibGen) を使用して Llama3 をトレーニングしましたが、この動きは著作権とデータの所有権に関する広範な懸念を引き起こしました。 Meta社内の従業員は、潜在的な法的リスクやネガティブな評判など、LibGenの使用のリスクについて懸念を表明していたが、それでもCEOのザッカーバーグは、AI競争における大手テクノロジー企業の積極的な戦略と著作権保護を強調し、この決定を承認した。
最近、Meta が著作権集団訴訟で開示した文書が明らかになり、同社は最新の AI チャットボット Llama3 をトレーニングするために Library Genesis (LibGen) と呼ばれる海賊版電子書籍ライブラリを使用したことが広く注目を集めました。文書には、特に著作権とデータの所有権に関する懸念が高まる中、Meta エンジニアが「シャドウ ライブラリ」である LibGen を利用する潜在的なリスクについて議論したことが示されています。潜在的なマイナスの影響と宣伝のリスクにもかかわらず、メタの最高経営責任者(CEO)マーク・ザッカーバーグはこの決定を承認した。
裁判所の要請により、LibGen データセットの使用に関する Meta 内での機密会話の記録が機密解除されたことが文書によって示されており、Meta 幹部が AI 研究チームとの話し合いの中で、LibGen のデータが「我々は知っている」と明言したことが示されています。海賊版になります。」 Llama3 のパフォーマンスを向上させるためにこのデータを使用することに同意します。 Metaの製品管理ディレクターであるSony Theakanath氏は電子メールの中で、LibGenの使用の決定が世論のリスクを引き起こしたものの、他のAI企業も同様のデータを使用しているため、Metaのチームはこの道が孤立したものではないと感じていると指摘した。
さらに憂慮すべきことに、Meta スタッフは、ISBN や著作権表示などの著作権マークを削除するために、LibGen でテキストを処理およびフィルタリングする方法についても議論しました。内部メモによると、LibGenが提供する教材は「高品質かつ長文で、特に専門的な科目の学習に最適」だという。これは、Meta が不正なコンテンツの使用を隠蔽しようとしているようであることを示唆しています。
さらに、Meta の従業員は電子メールの中で、トレントに会社の IP アドレスを直接使用するのは不適切である可能性があるとも言及し、この行為について懸念を表明しました。しかし、ザッカーバーグ氏がLibGenデータセットの使用を「上から押し上げ」たことで、AI競争におけるメタ氏の勝利者のメンタリティーが明らかに明らかになった。この事件は、大手テクノロジー企業の著作権問題に対する注目と疑問を再び引き起こした。
この著作権訴訟の結果は、特に画像、音楽、文学などの創作物の使用に関して、進行中の他の同様の訴訟に重要な影響を与える可能性がある。テクノロジー企業によるオリジナル コンテンツへの需要が高まるにつれ、オリジナル コンテンツ作成者の権利が注目を集めるようになります。
この事件は、著作権問題に対するメタ社の無責任な態度を暴露しただけでなく、AI開発における倫理的および法的問題について人々が深く考えるきっかけとなった。今後は技術開発と知的財産保護をどのように両立させるかが重要な課題となり、業界内外が連携して解決策を模索する必要がある。