Reddit недавно объявил об ужесточении мер защиты данных, направленных на предотвращение доступа неавторизованных компаний, занимающихся искусственным интеллектом, и инструментов для сбора данных к данным своей платформы. Этот шаг подчеркивает все более напряженные отношения между платформами социальных сетей и индустрией искусственного интеллекта и отражает компромисс между защитой пользовательских данных и изучением новых моделей получения прибыли. Reddit обновил свой файл robots.txt, чтобы заблокировать несанкционированное автоматическое сканирование, но заявил, что это не повлияет на исследователей и учреждения, соответствующих требованиям. Этот шаг может быть связан с сообщениями о том, что некоторые компании, занимающиеся искусственным интеллектом, обошли соглашение robots.txt. Это также означает, что Reddit может заключить в будущем лицензионные соглашения с большим количеством компаний, занимающихся искусственным интеллектом, аналогичные тем, которые были достигнуты с такими компаниями, как Google и OpenAI, для обеспечения использования данных. и коммерческая ценность.
Reddit планирует обновить свой протокол исключения роботов (файл robots.txt), чтобы заблокировать несанкционированное автоматическое сканирование платформы. Представитель компании подчеркнул, что обновление не касалось конкретной компании, а было призвано «защитить Reddit, сохраняя при этом Интернет открытым». Reddit заявил, что изменения не повлияют на «участников честности», таких как Интернет-архив и исследователей.
Судя по всему, этот шаг стал ответом на недавние сообщения о том, что компании, занимающиеся искусственным интеллектом, такие как Perplexity, обходят протокол robots.txt веб-сайта. Генеральный директор Perplexity однажды заявил в интервью Fast Company, что соглашение «не является правовой основой», что вызвало споры по поводу практики сбора данных компаниями, занимающимися искусственным интеллектом.
Позиция Reddit ясна: любая компания, которая использует автоматические прокси-серверы для доступа к своей платформе, должна соблюдать ее условия и политику и общаться с Reddit. Это может намекать на то, что Reddit надеется заключить лицензионные соглашения с компаниями, занимающимися искусственным интеллектом, аналогичные тем, которые он заключил с Google и OpenAI.
Это не первый случай, когда Reddit занимает жесткую позицию в отношении доступа к данным. В прошлом году компания начала взимать плату с компаний, занимающихся ИИ, за использование API и заключила лицензионные соглашения с некоторыми ИИ-компаниями, позволяющие им использовать данные Reddit для обучения моделей. Эти соглашения стали важным источником дохода для Reddit.
Этот шаг Reddit отражает баланс платформы социальных сетей между защитой пользовательского контента и поиском новых моделей дохода. С быстрым развитием технологий искусственного интеллекта аналогичные споры о доступе к данным могут разыгрываться на других платформах, вызывая более широкие дискуссии о владении данными, правах использования и распределении стоимости.
Жесткая позиция Reddit знаменует собой изменение будущей модели сотрудничества в области данных между платформами социальных сетей и компаниями, занимающимися искусственным интеллектом, а также дает новый повод для дискуссий о владении и использовании данных. Игра между платформами и улучшение контроля данных станут важными вопросами будущего развития.