404 Media によると、Automattic は、2014 年から 2023 年にかけて、非公開コンテンツを含む Tumblr プラットフォーム上の公開投稿データを、Midjourney や OpenAI などの人工知能企業を含む第三者と共有する予定であるとのことです。この動きは、データのプライバシーとユーザーの知る権利に関する議論を引き起こすと同時に、人工知能企業の大量データに関するトレーニングのニーズとプラットフォーム企業のデータ共有戦略との間の複雑な関係も明らかになった。この「初期データダンプ」は非常に大規模なので、Tumblr プラットフォーム上のすべての公開投稿をカバーしており、人工知能モデルのトレーニングに大きな影響を与えるでしょう。
404 Media のレポートによると、Automattic はユーザーの投稿から取得したトレーニング データを含むデータを第三者と共有する予定です。同社は、2014年から2023年までのTumblr上のすべての公開投稿のコンテンツを含む「初期データダンプ」をスクレイピングした。これには、ブログでは一般公開されないコンテンツも含まれている。このデータのうちどれだけが Midjourney と OpenAI に送信されたかは不明です。これは、Automatticが人工知能企業と交渉中であり、契約が完了に近づいていることを示しています。Automatticの動きにより、データプライバシーとユーザーの同意に関する懸念が生じており、人工知能の発展とユーザーデータ保護のバランスをどう取るかが重要な課題となるだろう。 この事件はまた、ソーシャルメディアプラットフォームを使用する際には個人情報の漏洩に注意する必要があることを私たちに思い出させます。