Генеральный директор Meta Марк Цукерберг недавно защищал в суде использование Meta данных, защищенных авторским правом, для обучения искусственного интеллекта, что привлекло широкое внимание. В число истцов по этому делу входят известные авторы, обвиняющие Meta в использовании большого количества пиратских книжных данных при обучении моделей ИИ. Стратегия защиты Цукерберга весьма противоречива. Он сравнил поведение Меты с пиратским контентом на YouTube, пытаясь доказать, что поведение Меты не было умышленным нарушением прав. Будет ли эта стратегия защиты принята судами, еще неизвестно. В этой статье будут подробно проанализированы показания Цукерберга и последние события по делу, а также исследовано их влияние на будущее развитие индустрии искусственного интеллекта.
Генеральный директор Meta Марк Цукерберг использовал борьбу YouTube с пиратским контентом, чтобы защитить использование компанией данных, защищенных авторским правом, в обучении ИИ в недавних судебных разбирательствах. Дело под названием «Кадри против Меты» — один из многих исков об авторских правах против компаний, занимающихся искусственным интеллектом, в судах США. В число истцов входят известные писатели Сара Сильверман и Та-Нахиси Коутс.
Согласно недавно опубликованным выдержкам из показаний Цукерберга, он отметил, что, хотя на YouTube может существовать некоторый пиратский контент, YouTube все еще работает над его удалением. «Большая часть контента на YouTube должна быть легальной, и у них есть соответствующие лицензии», — сказал Цукерберг. Эти замечания намекают на его позицию по поводу использования Meta защищенного авторским правом набора данных электронных книг под названием LibGen для обучения ИИ.
LibGen — это веб-сайт агрегирования ссылок, на котором представлены произведения, защищенные авторским правом, от нескольких издателей, включая Cengage Learning, McGraw-Hill и Pearson Education. Сайту неоднократно предъявляли иск за нарушение авторских прав и штрафовали на десятки миллионов долларов. Судебные документы показывают, что, несмотря на то, что команда Meta по искусственному интеллекту выразила обеспокоенность по поводу юридических рисков использования LibGen, Цукерберг все же одобрил его использование в качестве набора обучающих данных.
Во время допроса Цукерберг заявил, что не знаком с LibGen, но заявил, что запрещать такую платформу, как YouTube, было бы неразумно. «Нет, я бы не хотел устанавливать политику для людей, использующих YouTube, потому что некоторый контент может быть защищен авторским правом», — сказал он. Он также признал, что Мета должна быть осторожной при использовании материалов, защищенных авторским правом, для обучения.
Согласно последнему утверждению адвокатов истцов, Meta сравнила некоторые пиратские книги на LibGen с книгами, защищенными авторским правом, доступными для лицензирования, чтобы определить, следует ли заключать лицензионное соглашение с издателем. Кроме того, истец также обвинил Meta в использовании набора данных LibGen при обучении своей последней модели Llama и загрузке электронных книг из другого пиратского источника, Z-Library, для обучения.
Z-Library также стала объектом многочисленных судебных исков из-за проблем с авторскими правами, а ее защитникам были предъявлены обвинения в нарушении авторских прав, онлайн-мошенничестве и отмывании денег в 2022 году.
Выделять:
Цукерберг сослался на дело YouTube в суде, чтобы защитить использование Meta материалов, защищенных авторским правом, в обучении ИИ.
Истец обвинил Meta в использовании пиратского набора данных книг LibGen для обучения модели Llama и сокрытии соответствующей информации.
Meta столкнулась с многочисленными исками об авторских правах, и связанные с этим юридические риски вызвали внутренние дискуссии и опасения.
Окончательное решение по этому делу окажет глубокое влияние на индустрию искусственного интеллекта. Оно предоставит важную юридическую ссылку на то, как компании ИИ используют данные, защищенные авторским правом, для обучения моделей в будущем, и может побудить отрасль разработать более строгие меры защиты авторских прав.