Recientemente, los medios revelaron que Nvidia tomó en secreto datos de videos de YouTube a gran escala para entrenar su modelo de inteligencia artificial, lo que generó una controversia legal y ética generalizada. Este movimiento involucra muchos de los productos de inteligencia artificial de Nvidia, incluido el modelo de aprendizaje profundo Cosmos, algoritmos de conducción autónoma, etc. El método de adquisición de datos está oculto y sin la autorización del creador del video y de Google. Los correos electrónicos internos de NVIDIA muestran que los altos ejecutivos son optimistas sobre este comportamiento y creen que ha sido "totalmente aprobado". Esta declaración es contraria a la declaración oficial de Google, que establece claramente que este comportamiento viola los términos de servicio de la plataforma. La enorme cantidad de datos involucrados, los métodos operativos encubiertos y las respuestas completamente diferentes de todas las partes han hecho de este incidente una preocupación.
Recientemente, se reveló una operación secreta del gigante tecnológico Nvidia en la adquisición de datos. Según informes del medio 404, Nvidia entrenó su modelo de inteligencia artificial recopilando cantidades masivas de datos de vídeos de YouTube, lo cual es bastante ambiguo en términos de ley y ética.
El informe señaló que Nvidia está utilizando estos datos de video para entrenar sus múltiples modelos de IA, incluidos los modelos de aprendizaje profundo Cosmos, algoritmos de conducción autónoma, productos de avatar de IA humana digital y la herramienta de construcción de mundos 3D Omniverse.
Se entiende que Nvidia ha tomado muchas medidas encubiertas para encubrir su comportamiento de extracción de datos, utilizando múltiples "máquinas virtuales" y cambiando constantemente las direcciones IP para evitar ser descubierta por YouTube. Además, el creador del vídeo y empresa matriz de YouTube, Google, no dio ninguna autorización para esta actividad de extracción de datos. Las comunicaciones internas de Nvidia muestran que su estrategia es bastante audaz. Un ejecutivo mencionó en un correo electrónico que están construyendo una “fábrica de datos de video” que puede generar datos de experiencias visuales equivalentes a la vida humana todos los días.
Curiosamente, cuando los empleados expresaron su preocupación sobre la legalidad y la ética de dicha adquisición de datos, la gerencia pareció bastante confiada, creyendo que todo esto era una decisión de alto nivel. "Tenemos una aprobación general de todos los datos", decía el correo electrónico.
Aún más preocupante es que Nvidia sabía desde hacía algún tiempo que estaba utilizando el conjunto de datos HD-VG-130M que contiene 130 millones de vídeos de YouTube, que se creó originalmente para investigaciones académicas. Muchos expertos han expresado su gran descontento con esto, argumentando que la comercialización de los datos utilizados para la investigación es inapropiada.
Como actor central en la industria de la IA, NVIDIA ocupa una posición destacada en el mercado y sus unidades de procesamiento de gráficos (GPU) son la base de muchos sistemas de IA con uso intensivo de computación. Las empresas que trabajan con Nvidia, como OpenAI, Microsoft y Google, han expresado su preocupación por este comportamiento. Un portavoz de Google mencionó que utilizar datos de YouTube sin permiso es una clara violación de los términos de servicio de la plataforma.
En respuesta a los medios, Nvidia afirmó que sus prácticas de formación en IA "cumplen plenamente con el espíritu y la letra de la ley de derechos de autor". Sin embargo, ¿qué opinan los creadores que utilizan este contenido sobre esta afirmación?
Destacar:
Nvidia extrajo en secreto una gran cantidad de datos de vídeos de YouTube para el entrenamiento de IA, lo que generó preocupaciones sobre cuestiones legales y éticas.
Los correos electrónicos internos muestran que los ejecutivos de Nvidia creían que este comportamiento estaba totalmente aprobado y su actitud fue bastante audaz.
Google señaló que el uso de datos de YouTube sin permiso violaba claramente los términos de servicio de la plataforma y la respuesta de Nvidia causó controversia.
El comportamiento de extracción de datos de NVIDIA desencadenó debates generalizados sobre la ética y las leyes de la adquisición de datos de IA, y su respuesta no logró sofocar la controversia. Este incidente pone de relieve los desafíos que enfrentan las grandes empresas de tecnología en el uso de datos y la necesidad urgente de mejorar las leyes y regulaciones pertinentes. En el futuro, incidentes similares pueden seguir atrayendo la atención e impulsar a la industria a fortalecer la autodisciplina y estandarizar los comportamientos de uso de datos.