据404 Media报道,Automattic公司计划将Tumblr平台2014年至2023年间的公开帖子数据,甚至包括非公开可见的内容,共享给第三方,其中可能包括Midjourney和OpenAI等人工智能公司。此举引发了关于数据隐私和用户知情权的讨论,同时也揭示了人工智能公司对海量数据进行训练的需求与平台公司数据共享策略之间的复杂关系。这份“初始数据转储”规模庞大,其内容涵盖了Tumblr平台的全部公开帖子,这将对人工智能模型的训练产生显著影响。
据404 Media的报告显示,Automattic计划向第三方共享数据,包括从用户帖子中获得的训练数据。该公司抓取了一份“初始数据转储”,其中包含了2014年至2023年间Tumblr的所有公开帖子内容,其中包括不会在博客上公开可见的内容。目前尚不清楚这些数据已发送到Midjourney和OpenAI。这表明Automattic正与人工智能公司进行谈判,交易即将完成。Automattic此举引发了人们对数据隐私和用户同意问题的关注,未来如何平衡人工智能发展与用户数据保护将成为一个重要议题。 这起事件也提醒我们,在使用社交媒体平台时,需谨慎对待个人信息的公开程度。