Tumblrの親会社Automatticは、AIモデルのトレーニングのためにユーザーの投稿データをOpenAIとMidjourneyに販売する計画を立てているが、この動きにはユーザーのプライバシーとデータセキュリティに対する懸念が生じている。 これは、Reddit や Shutterstock などの企業と AI 企業とのこれまでの協力事例と同様であり、どちらもユーザーデータの商業利用に関係しています。 Automatticはユーザーにデータ共有をオプトアウトするための設定を提供すると約束しているが、データ収集の範囲と処理方法、特に誤って収集された非公開投稿の処理に関しては依然として多くの曖昧な点があり、さらなる明確化と説明が必要である。
Tumblrの親会社Automatticは、AIモデルのトレーニング用のユーザー投稿を販売するためにOpenAIおよびMidjourneyと協議している。 Automattic は、ユーザーがサードパーティとのデータ共有をオプトアウトできる設定をリリースする準備を進めています。彼らは、2014 年から 2023 年までの Tumblr 上のすべての公開投稿をクロールしました。エラーには非公開の投稿も含まれていますが、データがどのように処理されるか、モデルのトレーニングにどのデータが使用されるかは明らかではありません。以前、Reddit はユーザー データを使用して Google の AI モデルを毎年トレーニングする契約を Google と締結していましたが、Shutterstock は OpenAI と写真ライブラリを使用してモデルをトレーニングする契約を締結していました。この動きは、大規模な言語モデルのトレーニングが大量のデータに依存しているという現実を改めて浮き彫りにし、データのプライバシーと倫理に対する継続的な懸念も引き起こしています。 Automattic は、ユーザーの信頼とプラットフォームの持続可能な発展を維持するために、データ処理プロセスを透過的に説明し、ユーザーが実際の選択をできるようにする必要があります。 将来的には、同様のデータ共有慣行はより厳格な規制とより広範な国民の監視に直面することになるでしょう。