Tumblr與OpenAI合作出售用戶貼文進行AI訓練

作者：Eve Cole 更新時間：2025-02-05 11:00:03

Tumblr母公司Automattic正計劃將用戶貼文資料出售給OpenAI和Midjourney用於AI模型訓練，此舉引發了對用戶隱私和資料安全的擔憂。這與Reddit和Shutterstock等公司先前與AI公司合作的案例類似，都涉及用戶資料的商業利用。 Automattic承諾將提供用戶選擇退出資料共享的設置，但目前資料收集範圍及處理方式仍存在諸多不明確之處，特別是關於意外收集的非公開貼文的處理問題，需要進一步的說明和解釋。

Tumblr母公司Automattic與OpenAI和Midjourney進行談判，計劃出售用戶貼文用於訓練AI模型。 Automattic準備發布一個設置，允許用戶選擇退出與第三方的資料共享。他們已經抓取了Tumblr上2014-2023年發布的所有公開帖子，儘管有錯誤包括部分非公開帖子，但尚不清楚如何處理這些數據及哪些數據會被用於訓練模型。先前，Reddit與Google簽訂了協議，每年使用用戶資料培訓Google的AI模型；而Shutterstock則與OpenAI簽署了協議，用其照片庫訓練模型。

此舉再次凸顯了大型語言模型訓練對大量資料依賴的現實，也引發了人們對資料隱私和倫理的持續關注。 Automattic需要透明地解釋其資料處理流程，並確保使用者擁有真正的選擇權，以維護使用者信任和平台的永續發展。未來，類似的數據共享行為將面臨更嚴格的監管和更廣泛的公眾審查。