Reddit 近日宣布收緊資料保護措施,旨在阻止未經授權的AI 公司及資料抓取工具存取其平台資料。此舉凸顯了社群媒體平台與人工智慧產業之間日益緊張的關係,也反映了平台在保護用戶資料和探索新獲利模式之間的權衡。 Reddit 更新了robots.txt 文件,阻止未經授權的自動抓取,但聲明不會影響合規的研究者和機構。這一舉動或與部分AI 公司繞過robots.txt 協議的報道有關,也暗示著Reddit 未來可能與更多AI 公司達成類似於與Google 和OpenAI 等公司達成的許可協議,從而實現數據利用和商業價值的平衡。
Reddit 計劃更新其機器人排除協議(robots.txt 檔案),以阻止未經授權的平台自動抓取。公司發言人強調,這項更新並非針對特定公司,而是旨在"保護Reddit 的同時保持網路的開放"。 Reddit 表示,這些變化不會影響"誠信行為者",如網路檔案館和研究人員。
此舉似乎是對最近有關AI 公司,如Perplexity,繞過網站robots.txt 協議的報告的回應。 Perplexity 的CEO 曾在接受《Fast Company》採訪時稱該協議"不是一個法律框架",引發了對AI 公司資料取得行為的爭議。
Reddit 的立場很明確:任何使用自動代理訪問其平台的公司都必須遵守其條款和政策,並與Reddit 溝通。這可能暗示了Reddit 希望與AI 公司建立類似於其與Google 和OpenAI 的授權協議。
這並非Reddit 首次在資料存取問題上採取強硬立場。去年,該公司開始向AI 公司收取API 使用費,並與部分AI 公司達成了授權協議,允許它們使用Reddit 的資料訓練模型。這些協議已成為Reddit 重要的收入來源。
Reddit 的這一舉動反映了社群媒體平台在保護用戶生成內容和尋求新的收入模式之間的平衡。隨著AI 技術的快速發展,類似的資料存取爭議可能會在其他平台上演,引發更廣泛的討論關於資料所有權、使用權和價值分配的問題。
Reddit 的強硬立場預示著未來社交媒體平台與AI 公司數據合作模式的轉變,也為數據所有權和利用的討論提供了新的案例。平台間的博弈和資料監管的完善將是未來發展中的重要議題。