O CEO da Meta, Mark Zuckerberg, defendeu recentemente o uso de dados protegidos por direitos autorais pela Meta para treinar IA em tribunal, atraindo atenção generalizada. Os demandantes neste caso incluem autores conhecidos, acusando a Meta de usar uma grande quantidade de dados de livros piratas no treinamento de modelos de IA. A estratégia de defesa de Zuckerberg é bastante controversa. Ele comparou o comportamento do Meta com o conteúdo pirata no YouTube, tentando provar que o comportamento do Meta não foi uma violação intencional. Resta saber se esta estratégia de defesa será adoptada pelos tribunais. Este artigo analisará detalhadamente o testemunho de Zuckerberg e os últimos desenvolvimentos no caso, e explorará seu impacto no desenvolvimento futuro da indústria de inteligência artificial.
O CEO da Meta, Mark Zuckerberg, usou a luta do YouTube contra o conteúdo pirata para defender o uso de dados protegidos por direitos autorais pela empresa no treinamento de IA em processos judiciais recentes. O caso, denominado "Kadrey v. Meta", é um dos muitos processos de direitos autorais contra empresas de IA nos tribunais dos EUA. Os demandantes incluem os conhecidos escritores Sarah Silverman e Ta-Nahisi Coates.
De acordo com trechos recentemente divulgados do depoimento de Zuckerberg, ele observou que, embora possa existir algum conteúdo pirata no YouTube, o YouTube ainda está trabalhando para removê-lo. “A maior parte do conteúdo do YouTube deveria ser legal e ter licenças relevantes”, disse Zuckerberg. Os comentários sugerem sua posição sobre o uso pela Meta de um conjunto de dados de e-books protegidos por direitos autorais chamado LibGen para treinamento de IA.
LibGen é um site de agregação de links que fornece trabalhos protegidos por direitos autorais de várias editoras, incluindo Cengage Learning, McGraw-Hill e Pearson Education. O site foi processado diversas vezes por violação de direitos autorais e multado em dezenas de milhões de dólares. Documentos judiciais mostram que, apesar da equipe de IA da Meta expressar preocupações sobre os riscos legais do uso do LibGen, Zuckerberg ainda aprovou seu uso como conjunto de dados de treinamento.
Durante o interrogatório, Zuckerberg afirmou que não estava familiarizado com a LibGen, mas disse que proibir uma plataforma como o YouTube não seria razoável. “Não, eu não gostaria de estabelecer políticas para as pessoas que usam o YouTube porque algum conteúdo pode estar protegido por direitos autorais”, disse ele. Ele também reconheceu que a Meta precisa ser cautelosa ao usar material protegido por direitos autorais para treinamento.
De acordo com a última alegação dos advogados dos demandantes, a Meta cruzou referências de certos livros piratas na LibGen com livros protegidos por direitos autorais disponíveis para licenciamento para determinar se deveria chegar a um acordo de licenciamento com a editora. Além disso, o autor também acusou a Meta de usar o conjunto de dados da LibGen ao treinar seu mais recente modelo Llama e baixar e-books de outra fonte pirata, a Z-Library, para treinamento.
A Z-Library também foi objeto de diversas ações legais devido a questões de direitos autorais, e seus defensores foram acusados de violação de direitos autorais, fraude online e lavagem de dinheiro em 2022.
Destaque:
Zuckerberg citou o caso do YouTube no tribunal para defender o uso de material protegido por direitos autorais pela Meta no treinamento de IA.
O demandante acusou Meta de usar o conjunto de dados de livros piratas LibGen para treinar o modelo Llama e ocultar informações relevantes.
A Meta enfrentou vários processos judiciais de direitos autorais e os riscos legais relacionados desencadearam discussões e preocupações internas.
O julgamento final deste caso terá um impacto profundo na indústria da inteligência artificial. Fornecerá uma referência jurídica importante sobre a forma como as empresas de IA utilizam dados protegidos por direitos de autor para treinar modelos no futuro e poderá levar a indústria a desenvolver medidas mais rigorosas de protecção dos direitos de autor.