O Reddit anunciou recentemente medidas mais rigorosas de proteção de dados destinadas a impedir que empresas não autorizadas de IA e ferramentas de coleta de dados acessem os dados de sua plataforma. A medida destaca a relação cada vez mais tensa entre as plataformas de redes sociais e a indústria da inteligência artificial, e reflecte o compromisso entre a protecção dos dados dos utilizadores e a exploração de novos modelos de lucro. O Reddit atualizou seu arquivo robots.txt para bloquear o rastreamento automatizado não autorizado, mas afirmou que isso não afetaria pesquisadores e instituições compatíveis. Esta mudança pode estar relacionada a relatos de que algumas empresas de IA contornaram o acordo robots.txt. Isso também implica que o Reddit poderá chegar a acordos de licenciamento com mais empresas de IA no futuro, semelhantes aos alcançados com empresas como Google e OpenAI para obter utilização de dados. e valor comercial.
O Reddit planeja atualizar seu protocolo de exclusão de robôs (arquivo robots.txt) para bloquear a extração automática não autorizada da plataforma. Um porta-voz da empresa enfatizou que a atualização não era específica da empresa, mas tinha como objetivo “proteger o Reddit e ao mesmo tempo manter a Internet aberta”. Reddit disse que as mudanças não afetarão “atores de integridade”, como o Internet Archive e pesquisadores.
A mudança parece ser uma resposta a relatórios recentes de que empresas de IA, como a Perplexity, estão contornando o protocolo robots.txt do site. O CEO da Perplexity disse certa vez em entrevista à “Fast Company” que o acordo “não é uma estrutura legal”, gerando polêmica sobre as práticas de aquisição de dados das empresas de IA.
A posição do Reddit é clara: qualquer empresa que utilize proxies automatizados para acessar sua plataforma deve cumprir seus termos e políticas e comunicar-se com o Reddit. Isso pode sugerir que o Reddit espera estabelecer acordos de licenciamento com empresas de IA semelhantes aos que tem com o Google e a OpenAI.
Esta não é a primeira vez que o Reddit adota uma linha dura no acesso a dados. No ano passado, a empresa começou a cobrar das empresas de IA pelo uso da API e chegou a acordos de licenciamento com algumas empresas de IA para permitir que usassem dados do Reddit para treinar modelos. Esses acordos se tornaram uma importante fonte de receita para o Reddit.
A decisão do Reddit reflete o equilíbrio da plataforma de mídia social entre a proteção do conteúdo gerado pelo usuário e a busca de novos modelos de receita. Com o rápido desenvolvimento da tecnologia de IA, disputas semelhantes de acesso a dados podem ocorrer em outras plataformas, desencadeando discussões mais amplas sobre propriedade de dados, direitos de uso e distribuição de valor.
A postura dura do Reddit anuncia uma mudança no futuro modelo de cooperação de dados entre plataformas de redes sociais e empresas de IA, e também fornece um novo argumento para discussões sobre propriedade e utilização de dados. O jogo entre plataformas e a melhoria da supervisão de dados serão questões importantes no desenvolvimento futuro.