En los últimos años, el rápido desarrollo de la tecnología de inteligencia artificial ha atraído una atención generalizada, pero los problemas legales y éticos que han seguido se han vuelto cada vez más prominentes. Recientemente, las prácticas de Meta en la capacitación de inteligencia artificial han sido cuestionadas, acusadas de descargar ilegalmente grandes cantidades de datos pirateados para capacitación modelo, un incidente que ha provocado discusiones profundas sobre los derechos de autor y el uso de datos.
Recientemente, el enfoque de Meta para el entrenamiento de inteligencia artificial ha atraído una atención generalizada. Según una demanda, la compañía está acusada de descargar una gran cantidad de libros electrónicos pirateados y artículos sin autorización para capacitar a sus modelos de inteligencia artificial. En el corazón del incidente había varios correos electrónicos filtrados que proporcionaron más pruebas de las acciones de Meta.
Meta admitió descargar un controvertido gran conjunto de datos llamado Libgen que contiene decenas de millones de libros pirateados, mostró el correo electrónico. Según los documentos judiciales presentados por el demandante, Meta descargó al menos 81.7TB de datos de múltiples bibliotecas de sombras, incluidos al menos 35.7TB de datos de Z-Bibrary y LibGen a través de un sitio web llamado Anna's Archive. Además, Meta descargó previamente 80.6tb de datos de LibGen. Estas cifras muestran que la escala de Meta en este acto ilegal es sorprendente. El demandante señaló que, si bien otra piratería a pequeña escala ha llevado al enjuiciamiento legal, el comportamiento de Meta se ha vuelto más grave.
En el contenido del correo electrónico, los meta empleados también expresaron su preocupación por los riesgos legales de sus acciones. En abril de 2023, Nikolai Bashlikov, un ingeniero de investigación de la compañía, dijo: "Se siente inapropiado usar la computadora portátil de la compañía para obtener BT". Señaló que "usar torrents significa 'semilla' el archivo, es decir, compartir contenido externamente. Esto no está legalmente permitido". "Comportamiento mediante la edición de la configuración.
También se dice que Meta intentó reducir el riesgo de ser rastreado a sus servidores descargando conjuntos de datos a servidores no meta. Esta serie de comportamientos ha provocado reflexiones profundas sobre el uso de datos de Meta y los derechos de autor.
Puntos clave:
Meta está acusado de descargar ilegalmente 81.7TB de libros pirateados, sospechoso de ser utilizado para la capacitación de IA.
Los empleados expresaron su preocupación por los riesgos legales y habían advertido que la descarga podría violar la ley.
Meta intenta evadir la responsabilidad legal ocultando y utilizando servidores que no sean de compañía.
Este incidente no solo expuso los problemas de uso de datos de Meta, sino que también sonó una llamada de atención para toda la industria de IA. Cómo encontrar un equilibrio entre el desarrollo tecnológico y el cumplimiento legal será un tema importante que debe resolverse en el futuro.