Le PDG de Meta, Mark Zuckerberg, a récemment défendu l'utilisation par Meta de données protégées par le droit d'auteur pour former l'IA devant les tribunaux, attirant ainsi une large attention. Les plaignants dans cette affaire comprennent des auteurs bien connus, accusant Meta d'utiliser une grande quantité de données de livres piratés dans la formation de modèles d'IA. La stratégie de défense de Zuckerberg est assez controversée. Il a comparé le comportement de Meta avec du contenu piraté sur YouTube, essayant de prouver que le comportement de Meta n'était pas une infraction intentionnelle. Reste à savoir si cette stratégie de défense sera adoptée par les tribunaux. Cet article analysera en détail le témoignage de Zuckerberg et les derniers développements de l’affaire, et explorera son impact sur le développement futur de l’industrie de l’intelligence artificielle.
Le PDG de Meta, Mark Zuckerberg, a utilisé la lutte de YouTube contre le contenu piraté pour défendre l'utilisation par l'entreprise de données protégées par le droit d'auteur dans la formation à l'IA lors de récentes procédures judiciaires. L'affaire, appelée "Kadrey v. Meta", est l'une des nombreuses poursuites en matière de droits d'auteur contre des sociétés d'IA devant les tribunaux américains. Parmi les plaignants figurent les écrivains bien connus Sarah Silverman et Ta-Nahisi Coates.
Selon des extraits récemment publiés du témoignage de Zuckerberg, il a noté que même si certains contenus piratés peuvent exister sur YouTube, YouTube s'efforce toujours de les supprimer. "La plupart des contenus sur YouTube devraient être légaux et disposer des licences appropriées", a déclaré Zuckerberg. Ces remarques font allusion à sa position sur l'utilisation par Meta d'un ensemble de données de livres électroniques protégé par le droit d'auteur appelé LibGen pour la formation en IA.
LibGen est un site Web d'agrégation de liens qui fournit des œuvres protégées par le droit d'auteur de plusieurs éditeurs, notamment Cengage Learning, McGraw-Hill et Pearson Education. Le site a été poursuivi à plusieurs reprises pour violation du droit d'auteur et condamné à une amende de plusieurs dizaines de millions de dollars. Des documents judiciaires montrent que malgré les inquiétudes de l'équipe d'IA de Meta concernant les risques juridiques liés à l'utilisation de LibGen, Zuckerberg a quand même approuvé son utilisation comme ensemble de données de formation.
Lors de son interrogatoire, Zuckerberg a affirmé qu'il ne connaissait pas LibGen, mais a déclaré qu'interdire une plateforme comme YouTube serait déraisonnable. "Non, je ne voudrais pas imposer de règles aux utilisateurs de YouTube, car certains contenus peuvent être protégés par le droit d'auteur", a-t-il déclaré. Il a également reconnu que Meta doit être prudent lorsqu'il utilise du matériel protégé par le droit d'auteur à des fins de formation.
Selon la dernière allégation des avocats des plaignants, Meta a recoupé certains livres piratés sur LibGen avec des livres protégés par le droit d'auteur disponibles sous licence afin de déterminer s'il devait conclure un accord de licence avec l'éditeur. En outre, le plaignant a également accusé Meta d'utiliser l'ensemble de données de LibGen lors de la formation de son dernier modèle Llama et de télécharger des livres électroniques à partir d'une autre source piratée, Z-Library, à des fins de formation.
Z-Library a également fait l'objet de multiples actions en justice en raison de problèmes de droits d'auteur, et ses défenseurs ont été accusés de violation du droit d'auteur, de fraude en ligne et de blanchiment d'argent en 2022.
Souligner:
Zuckerberg a cité l'affaire YouTube devant le tribunal pour défendre l'utilisation par Meta de matériel protégé par le droit d'auteur dans la formation à l'IA.
Le plaignant a accusé Meta d'avoir utilisé l'ensemble de données de livres piratés LibGen pour entraîner le modèle Llama et cacher des informations pertinentes.
Meta a fait face à de multiples poursuites en matière de droits d'auteur, et les risques juridiques associés ont déclenché des discussions et des préoccupations internes.
Le jugement final de cette affaire aura un impact profond sur l'industrie de l'intelligence artificielle. Il fournira une référence juridique importante sur la manière dont les entreprises d'IA utiliseront à l'avenir des données protégées par le droit d'auteur pour former des modèles, et pourrait inciter l'industrie à élaborer des mesures de protection des droits d'auteur plus strictes.