Ces dernières années, le développement rapide de la technologie de l'intelligence artificielle a attiré une grande attention, mais les problèmes juridiques et éthiques qui ont suivi sont devenus de plus en plus importants. Récemment, les pratiques de Meta dans la formation de l'intelligence artificielle ont été remises en question, accusées de télécharger illégalement de grandes quantités de données piratées pour la formation des modèles, un incident qui a déclenché de profondes discussions sur le droit d'auteur et l'utilisation des données.
Récemment, l'approche de Meta à la formation de l'intelligence artificielle a attiré une grande attention. Selon un procès, la société est accusée d'avoir téléchargé un grand nombre de livres électroniques piratés et d'articles sans autorisation pour former ses modèles d'intelligence artificielle. Au cœur de l'incident se trouvaient plusieurs e-mails divulgués qui ont fourni des preuves supplémentaires des actions de Meta.
Meta a admis avoir téléchargé un grand ensemble de données controversé appelé Libgen qui contient des dizaines de millions de livres piratés, a indiqué l'e-mail. Selon les documents judiciaires déposés par le demandeur, Meta a téléchargé au moins 81,7 To de données de plusieurs bibliothèques Shadow, dont au moins 35,7 To de données de Z-Library et Libgen via un site Web appelé Archive d'Anna. De plus, Meta a précédemment téléchargé 80,6 To de données de Libgen. Ces chiffres montrent que l'échelle de Meta dans cet acte illégal est incroyable. Le demandeur a souligné que si d'autres piratage à petite échelle ont conduit à des poursuites judiciaires, le comportement de Meta est devenu plus grave.
Dans le contenu de l'e-mail, les méta-employés ont également exprimé des préoccupations concernant les risques juridiques de leurs actions. En avril 2023, Nikolai Bashlikov, ingénieur de recherche de la société, a déclaré: "Il est inapproprié d'utiliser l'ordinateur portable de l'entreprise pour obtenir BT." D'ici septembre 2023, l'opposition de Bashlikov à cette équipe plus évidente et consultée par l'équipe juridique. Il a noté que «l'utilisation de torrents signifie« semence »le fichier, c'est-à-dire partager du contenu en externe. Ce n'est pas légalement autorisé." "Comportement en modifiant les paramètres.
Meta aurait également tenté de réduire le risque d'être retracé à ses serveurs en téléchargeant des ensembles de données sur des serveurs non-métaux. Cette série de comportements a déclenché des réflexions profondes sur l'utilisation des données de Meta et le droit d'auteur.
Points clés:
Meta est accusé d'avoir téléchargé illégalement 81,7 To de livres piratés, soupçonné d'être utilisé pour la formation d'IA.
Les employés ont exprimé leurs préoccupations concernant les risques juridiques et avaient averti que le téléchargement pourrait violer la loi.
Meta tente d'échapper à la responsabilité juridique en cachant et en utilisant des serveurs sans entreprise.
Cet incident a non seulement exposé les problèmes d'utilisation des données de Meta, mais a également semblé un réveil pour l'ensemble de l'industrie de l'IA. Comment trouver un équilibre entre le développement technologique et la conformité juridique sera un problème important qui doit être résolu à l'avenir.