Reddit anunció recientemente medidas más estrictas de protección de datos destinadas a evitar que empresas de inteligencia artificial no autorizadas y herramientas de extracción de datos accedan a los datos de su plataforma. La medida pone de relieve la relación cada vez más tensa entre las plataformas de redes sociales y la industria de la inteligencia artificial, y refleja el equilibrio entre proteger los datos de los usuarios y explorar nuevos modelos de ganancias. Reddit actualizó su archivo robots.txt para bloquear el rastreo automatizado no autorizado, pero afirmó que no afectaría a los investigadores e instituciones que cumplan con las normas. Esta medida puede estar relacionada con informes de que algunas empresas de IA han eludido el acuerdo de robots.txt. También implica que Reddit puede llegar a acuerdos de licencia con más empresas de IA en el futuro, similares a los alcanzados con empresas como Google y OpenAI para lograr la utilización de datos. y equilibrio comercial.
Reddit planea actualizar su protocolo de exclusión de robots (archivo robots.txt) para bloquear el scraping automatizado no autorizado de la plataforma. Un portavoz de la empresa enfatizó que la actualización no era específica de la empresa, sino que tenía como objetivo "proteger Reddit manteniendo Internet abierto". Reddit dijo que los cambios no afectarán a los "actores de integridad" como Internet Archive y los investigadores.
La medida parece ser una respuesta a informes recientes de que las empresas de inteligencia artificial, como Perplexity, están eludiendo el protocolo robots.txt del sitio web. El director ejecutivo de Perplexity dijo una vez en una entrevista con "Fast Company" que el acuerdo "no es un marco legal", lo que generó controversia sobre las prácticas de adquisición de datos de las empresas de inteligencia artificial.
La posición de Reddit es clara: cualquier empresa que utilice servidores proxy automatizados para acceder a su plataforma debe cumplir con sus términos y políticas y comunicarse con Reddit. Esto puede indicar que Reddit espera establecer acuerdos de licencia con empresas de inteligencia artificial similares a los que tiene con Google y OpenAI.
Esta no es la primera vez que Reddit adopta una línea dura con respecto al acceso a los datos. El año pasado, la compañía comenzó a cobrar a las empresas de inteligencia artificial por el uso de API y llegó a acuerdos de licencia con algunas empresas de inteligencia artificial para permitirles utilizar datos de Reddit para entrenar modelos. Estos acuerdos se han convertido en una importante fuente de ingresos para Reddit.
La medida de Reddit refleja el equilibrio de la plataforma de redes sociales entre proteger el contenido generado por los usuarios y buscar nuevos modelos de ingresos. Con el rápido desarrollo de la tecnología de inteligencia artificial, pueden surgir disputas similares de acceso a datos en otras plataformas, lo que desencadenará debates más amplios sobre la propiedad de los datos, los derechos de uso y la distribución del valor.
La dura postura de Reddit presagia un cambio en el futuro modelo de cooperación de datos entre las plataformas de redes sociales y las empresas de inteligencia artificial, y también proporciona un nuevo caso para las discusiones sobre la propiedad y utilización de los datos. El juego entre plataformas y la mejora de la supervisión de datos serán temas importantes en el desarrollo futuro.