Récemment, les médias ont révélé que Nvidia avait secrètement récupéré des données vidéo YouTube à grande échelle pour entraîner son modèle d'IA, déclenchant une vaste controverse juridique et éthique. Cette décision implique de nombreux produits d'IA de Nvidia, notamment le modèle d'apprentissage profond Cosmos, les algorithmes de conduite autonome, etc. La méthode d'acquisition des données est cachée et sans autorisation du créateur de la vidéo et de Google. Les e-mails internes de NVIDIA montrent que les dirigeants sont optimistes quant à ce comportement et estiment qu'il a été "entièrement approuvé". Cette déclaration est contraire à la déclaration officielle de Google, qui indiquait clairement que ce comportement violait les conditions de service de la plateforme. L’énorme quantité de données impliquées, les méthodes opérationnelles secrètes et les réponses complètement différentes de toutes les parties ont rendu cet incident préoccupant.
Récemment, une opération secrète du géant de la technologie Nvidia en matière d'acquisition de données a été révélée. Selon les rapports du média 404, Nvidia a entraîné son modèle d'intelligence artificielle en récupérant des quantités massives de données vidéo YouTube, ce qui est assez ambigu en termes de loi et d'éthique.
Le rapport souligne que Nvidia utilise ces données vidéo pour entraîner ses multiples modèles d'IA, notamment les modèles d'apprentissage en profondeur Cosmos, les algorithmes de conduite autonome, les produits d'avatars d'IA humaine numérique et l'outil de création de monde 3D Omniverse.
Il est entendu que Nvidia a pris de nombreuses mesures secrètes pour dissimuler son comportement de récupération de données, en utilisant plusieurs « machines virtuelles » et en changeant constamment les adresses IP pour éviter d'être découvert par YouTube. De plus, le créateur de la vidéo et la société mère de YouTube, Google, n'ont donné aucune autorisation pour cette activité de grattage de données. Les communications internes de Nvidia montrent que leur stratégie est assez audacieuse. Un dirigeant a mentionné dans un e-mail qu’ils construisaient une « usine de données vidéo » capable de générer chaque jour des données d’expérience visuelle équivalentes à une vie humaine.
Il est intéressant de noter que lorsque les employés ont exprimé leurs inquiétudes quant à la légalité et à l'éthique d'une telle acquisition de données, la direction a semblé assez confiante, estimant qu'il s'agissait d'une décision de haut niveau. "Nous avons une approbation globale de toutes les données", indique l'e-mail.
Ce qui est encore plus troublant, c'est que Nvidia savait depuis un certain temps qu'il utilisait l'ensemble de données HD-VG-130M contenant 130 millions de vidéos YouTube, créé à l'origine pour la recherche universitaire. De nombreux experts ont exprimé leur profond mécontentement à ce sujet, arguant que la commercialisation des données utilisées pour la recherche est inappropriée.
En tant qu'acteur principal de l'industrie de l'IA, NVIDIA occupe une position de premier plan sur le marché et ses unités de traitement graphique (GPU) constituent la base de nombreux systèmes d'IA à forte intensité de calcul. Les entreprises travaillant avec Nvidia, telles qu'OpenAI, Microsoft et Google, ont exprimé leur inquiétude face à ce comportement. Un porte-parole de Google a mentionné que l'utilisation des données YouTube sans autorisation constitue une violation flagrante des conditions d'utilisation de la plateforme.
En réponse aux médias, Nvidia a affirmé que ses pratiques de formation en IA étaient « entièrement conformes à l’esprit et à la lettre de la loi sur le droit d’auteur ». Cependant, que pensent les créateurs qui utilisent ces contenus de cette affirmation ?
Souligner:
Nvidia a secrètement récupéré une grande quantité de données vidéo YouTube pour la formation en IA, soulevant des inquiétudes sur des questions juridiques et éthiques.
Des courriels internes montrent que les dirigeants de Nvidia pensaient que ce comportement était pleinement approuvé et que leur attitude était assez audacieuse.
? Google a souligné que l'utilisation des données YouTube sans autorisation violait clairement les conditions d'utilisation de la plateforme, et la réponse de Nvidia a suscité la controverse.
Le comportement de NVIDIA en matière de récupération de données a déclenché de nombreuses discussions sur l'éthique et les lois de l'acquisition de données par l'IA, et sa réponse n'a pas réussi à apaiser la controverse. Cet incident met en évidence les défis auxquels sont confrontées les grandes entreprises technologiques dans l'utilisation des données et le besoin urgent d'améliorer les lois et réglementations pertinentes. À l’avenir, des incidents similaires pourraient continuer à attirer l’attention et inciter le secteur à renforcer son autodiscipline et à normaliser ses comportements en matière d’utilisation des données.