Tumblr母公司Automattic正計劃將用戶貼文資料出售給OpenAI和Midjourney用於AI模型訓練,此舉引發了對用戶隱私和資料安全的擔憂。 這與Reddit和Shutterstock等公司先前與AI公司合作的案例類似,都涉及用戶資料的商業利用。 Automattic承諾將提供用戶選擇退出資料共享的設置,但目前資料收集範圍及處理方式仍存在諸多不明確之處,特別是關於意外收集的非公開貼文的處理問題,需要進一步的說明和解釋。
Tumblr母公司Automattic與OpenAI和Midjourney進行談判,計劃出售用戶貼文用於訓練AI模型。 Automattic準備發布一個設置,允許用戶選擇退出與第三方的資料共享。他們已經抓取了Tumblr上2014-2023年發布的所有公開帖子,儘管有錯誤包括部分非公開帖子,但尚不清楚如何處理這些數據及哪些數據會被用於訓練模型。先前,Reddit與Google簽訂了協議,每年使用用戶資料培訓Google的AI模型;而Shutterstock則與OpenAI簽署了協議,用其照片庫訓練模型。此舉再次凸顯了大型語言模型訓練對大量資料依賴的現實,也引發了人們對資料隱私和倫理的持續關注。 Automattic需要透明地解釋其資料處理流程,並確保使用者擁有真正的選擇權,以維護使用者信任和平台的永續發展。 未來,類似的數據共享行為將面臨更嚴格的監管和更廣泛的公眾審查。