Reddit은 최근 승인되지 않은 AI 회사와 데이터 스크래핑 도구가 플랫폼 데이터에 액세스하는 것을 방지하기 위한 데이터 보호 조치를 강화한다고 발표했습니다. 이러한 움직임은 소셜 미디어 플랫폼과 인공 지능 산업 간의 점점 더 긴장되는 관계를 강조하고 사용자 데이터 보호와 새로운 수익 모델 탐색 간의 균형을 반영합니다. Reddit은 무단 자동 크롤링을 차단하기 위해 robots.txt 파일을 업데이트했지만 규정을 준수하는 연구원 및 기관에는 영향을 미치지 않을 것이라고 밝혔습니다. 이러한 움직임은 일부 AI 회사가 robots.txt 계약을 우회했다는 보고와 관련이 있을 수 있습니다. 이는 또한 Reddit이 데이터 활용을 달성하기 위해 Google 및 OpenAI와 같은 회사와 체결한 것과 유사한 미래에 더 많은 AI 회사와 라이선스 계약을 체결할 수 있음을 의미합니다. 그리고 상업적 가치.
Reddit은 플랫폼의 무단 자동 스크래핑을 차단하기 위해 로봇 제외 프로토콜(robots.txt 파일)을 업데이트할 계획입니다. 회사 대변인은 이번 업데이트가 특정 회사에 국한된 것이 아니라 "인터넷을 개방된 상태로 유지하면서 Reddit을 보호"하기 위한 것이라고 강조했습니다. Reddit은 이러한 변경 사항이 Internet Archive 및 연구원과 같은 "무결성 행위자"에게 영향을 미치지 않을 것이라고 말했습니다.
이러한 움직임은 Perplexity와 같은 AI 회사가 웹사이트의 robots.txt 프로토콜을 우회하고 있다는 최근 보고에 따른 것으로 보입니다. 퍼플렉시티의 CEO는 한때 '패스트 컴퍼니(Fast Company)'와의 인터뷰에서 이번 협약은 "법적 틀이 아니다"라고 밝혀 AI 기업의 데이터 수집 관행에 대한 논란을 촉발한 바 있다.
Reddit의 입장은 분명합니다. 자동화된 프록시를 사용하여 플랫폼에 액세스하는 모든 회사는 해당 약관과 정책을 준수하고 Reddit과 소통해야 합니다. 이는 Reddit이 Google 및 OpenAI와 체결한 것과 유사한 AI 회사와 라이선스 계약을 체결하기를 희망한다는 것을 암시할 수 있습니다.
Reddit이 데이터 액세스에 대해 강경한 입장을 취한 것은 이번이 처음이 아닙니다. 작년에 이 회사는 AI 회사에 API 사용에 대한 비용을 청구하기 시작했으며 일부 AI 회사와 라이선스 계약을 체결하여 Reddit 데이터를 사용하여 모델을 교육할 수 있도록 했습니다. 이러한 계약은 Reddit의 중요한 수익원이 되었습니다.
Reddit의 움직임은 사용자 제작 콘텐츠 보호와 새로운 수익 모델 추구 사이의 소셜 미디어 플랫폼의 균형을 반영합니다. AI 기술의 급속한 발전으로 인해 유사한 데이터 액세스 분쟁이 다른 플랫폼에서도 발생할 수 있으며, 이로 인해 데이터 소유권, 사용 권한 및 가치 분배에 대한 광범위한 논의가 촉발될 수 있습니다.
Reddit의 강경한 입장은 소셜 미디어 플랫폼과 AI 기업 간의 미래 데이터 협력 모델의 변화를 예고하고, 데이터 소유권과 활용에 대한 논의의 새로운 사례를 제공합니다. 플랫폼 간 게임과 데이터 감독 개선은 향후 개발에서 중요한 문제가 될 것입니다.