Reddit a récemment annoncé un renforcement des mesures de protection des données visant à empêcher les sociétés d'IA et les outils de récupération de données non autorisés d'accéder aux données de sa plateforme. Cette décision met en évidence la relation de plus en plus tendue entre les plateformes de médias sociaux et le secteur de l’intelligence artificielle, et reflète le compromis entre la protection des données des utilisateurs et l’exploration de nouveaux modèles de profit. Reddit a mis à jour son fichier robots.txt pour bloquer l'exploration automatisée non autorisée, mais a déclaré que cela n'affecterait pas les chercheurs et les institutions conformes. Cette décision peut être liée aux informations selon lesquelles certaines sociétés d'IA ont contourné l'accord robots.txt. Cela implique également que Reddit pourrait conclure des accords de licence avec davantage de sociétés d'IA à l'avenir, similaires à ceux conclus avec des sociétés telles que Google et OpenAI pour parvenir à l'utilisation des données. et la valeur commerciale.
Reddit prévoit de mettre à jour son protocole d'exclusion de robots (fichier robots.txt) pour bloquer le scraping automatisé non autorisé de la plateforme. Un porte-parole de l'entreprise a souligné que la mise à jour n'était pas spécifique à l'entreprise mais visait à "protéger Reddit tout en gardant Internet ouvert". Reddit a déclaré que les changements n'affecteraient pas les « acteurs de l'intégrité » tels que Internet Archive et les chercheurs.
Cette décision semble être une réponse à des rapports récents selon lesquels des sociétés d'IA, telles que Perplexity, contournent le protocole robots.txt du site Web. Le PDG de Perplexity a déclaré un jour dans une interview avec « Fast Company » que l'accord « n'est pas un cadre juridique », déclenchant une controverse sur les pratiques d'acquisition de données des sociétés d'IA.
La position de Reddit est claire : toute entreprise qui utilise des proxys automatisés pour accéder à sa plateforme doit se conformer à ses conditions et politiques et communiquer avec Reddit. Cela peut laisser entendre que Reddit espère établir des accords de licence avec des sociétés d'IA similaires à ceux qu'il a conclus avec Google et OpenAI.
Ce n'est pas la première fois que Reddit adopte une ligne dure en matière d'accès aux données. L'année dernière, la société a commencé à facturer aux sociétés d'IA l'utilisation des API et a conclu des accords de licence avec certaines sociétés d'IA pour leur permettre d'utiliser les données Reddit pour former des modèles. Ces accords sont devenus une source de revenus importante pour Reddit.
La décision de Reddit reflète l'équilibre de la plateforme de médias sociaux entre la protection du contenu généré par les utilisateurs et la recherche de nouveaux modèles de revenus. Avec le développement rapide de la technologie de l’IA, des conflits similaires en matière d’accès aux données pourraient se produire sur d’autres plateformes, déclenchant des discussions plus larges sur la propriété des données, les droits d’utilisation et la répartition de la valeur.
La position ferme de Reddit annonce un changement dans le futur modèle de coopération en matière de données entre les plateformes de médias sociaux et les sociétés d'IA, et fournit également de nouveaux arguments pour les discussions sur la propriété et l'utilisation des données. Le jeu entre les plateformes et l’amélioration de la supervision des données seront des enjeux importants des développements futurs.