O Reddit anunciou recentemente que restringiria o acesso de mecanismos de pesquisa e bots de IA ao seu conteúdo, uma medida que atraiu atenção generalizada. O cerne desta estratégia está no controle e monetização dos dados da plataforma. O Reddit está tentando criar novas fontes de receita para seu conteúdo por meio de um modelo pago e atrair mais investidores. Esta mudança terá um impacto nos motores de busca e nos desenvolvedores de modelos de IA que dependem de dados do Reddit, e também terá um certo impacto na forma como os usuários comuns obtêm informações.
Recentemente, em um movimento dramático, o Reddit começou a restringir o acesso ao seu conteúdo pelos principais mecanismos de busca e bots de IA. De acordo com a 404Media, o Reddit decidiu não permitir mais que alguns dos principais mecanismos de busca acessem facilmente postagens e comentários recentes, a menos que estejam dispostos a pagar. Isso significa que se você não pesquisar no Google, poderá não encontrar o conteúdo mais recente do Reddit.
O Google é agora o único grande mecanismo de pesquisa que exibe resultados atualizados ao pesquisar “site:reddit.com”. Outros motores de busca como Bing e DuckDuckGo estão excluídos. A razão para isso é principalmente porque o Google assinou um acordo de US$ 60 milhões com o Reddit, permitindo que o Google usasse dados do Reddit para treinar seu modelo de IA. Isso faz com que mecanismos de pesquisa como o Bing observem enquanto o conteúdo se torna inacessível.
O porta-voz do Reddit, Tim Rathschmidt, disse que a decisão não estava diretamente relacionada à parceria com o Google. Na verdade, o Reddit está em negociações com vários mecanismos de busca para tentar chegar a um acordo. No entanto, o compromisso de muitos motores de busca em usar o conteúdo do Reddit não é suficientemente claro, resultando na falha dos dois lados em chegar a um acordo.
Para o Reddit, dar esse passo não é muito surpreendente. Durante o ano passado, o Reddit concentrou-se cada vez mais nos seus dados, na esperança de abrir novas fontes de receitas e atrair novos investidores. O Reddit já aumentou suas taxas de uso de API e ameaçou o Google de que, se continuar a usar os dados do Reddit gratuitamente para treinar IA, o Reddit considerará cortar a cooperação com ele.
Além disso, para fazer cumprir esta política, o Reddit atualizou o arquivo robots.txt de seu site. Este arquivo é uma base importante para os rastreadores da web determinarem se um site pode ser acessado. Ben Lee, diretor jurídico do Reddit, disse que a atualização envia um sinal claro aos rastreadores que não têm um acordo com o Reddit de que não deveriam ter acesso aos dados do Reddit.
Hoje em dia, à medida que os chatbots de IA proliferam online, muitas pessoas estão ansiosas para encontrar conteúdo criado por humanos. Afinal, as opiniões geradas por humanos são mais autênticas do que o conteúdo gerado por robôs. Eu, como muitos, comecei a vasculhar o “Reddit” para encontrar respostas humanas, mas agora ficou muito mais difícil. Para mim, que estou acostumado a usar o Bing, isso é totalmente frustrante.
Destaques:
? **Paywall ativado**: o Reddit restringe o acesso de mecanismos de pesquisa e bots de IA ao conteúdo e exige pagamento para obtê-lo.
**Recurso exclusivo do Google** Somente o Google pode obter os resultados mais recentes através de "site:reddit.com", outros mecanismos de pesquisa estão excluídos.
? **Estratégia de monetização de dados**: Reddit fortalece a proteção de dados, aumenta as taxas de API e busca novas fontes de receita para atrair investidores.
A decisão do Reddit não só reflecte a sua ênfase na monetização de dados, mas também anuncia uma mudança na forma como as plataformas da Internet obtêm dados. No futuro, mais plataformas poderão adotar estratégias semelhantes, o que terá um impacto profundo nos motores de busca e nas indústrias de IA. Poderemos precisar de nos adaptar a novas formas de obter informação e pensar no impacto potencial deste modelo de pagamento no ecossistema da Internet.