Zuckerberg sabe que Meta usa el artículo de capacitación en datos de la biblioteca pirata

Autor：Eve Cole Fecha de actualización：2025-01-26 14:32:01

Meta ha causado una gran controversia debido a su última fuente de datos de entrenamiento de AI Chat Robot Llama3. Según los archivos divulgados, Meta utiliza la Biblioteca de Biblioteca E -Book Pirated Genesis (LibGen) para capacitar a Llama3, que ha despertado amplias preocupaciones sobre los derechos de autor y la propiedad de datos. Aunque los empleados internos de Meta han expresado su preocupación sobre el uso de los riesgos de Libgen, incluidos los riesgos legales potenciales y la opinión pública negativa, el CEO Zuckerberg todavía aprueba esta decisión, destacando la estrategia radical de las grandes empresas tecnológicas en las competiciones de IA y los derechos de autor de los derechos de autor indiferentes.

Recientemente, con los documentos de Meta revelados en una demanda colectiva sobre los derechos de autor, la compañía utilizó una biblioteca de libro electrónico pirateado llamada Biblioteca Genesis (LibGen) para capacitar a su último Robot de chat Ai Llama3 ha atraído una atención generalizada. Estos archivos muestran que los ingenieros de Meta han discutido los riesgos potenciales de usar LibGen, una "biblioteca de sombra", especialmente en el contexto de los derechos de autor y la propiedad de datos cada vez más prominentes. A pesar del potencial impacto negativo y el riesgo de opinión pública, Mark Zuckerberg, CEO de Meta, aún aprobó la decisión.

图书馆书房阅读 (3)

A solicitud de la corte, los registros de diálogo confidencial interno de Meta sobre el uso del conjunto de datos de LibGen fueron descifrados. de Llama3. En un correo electrónico, Sony Theakanath, director de gestión de productos de Meta, señaló que aunque la decisión de usar LibGen ha desencadenado el riesgo de la opinión pública, otras compañías de IA también están utilizando datos similares, lo que hace que Meta Team sienta que este camino no es solo.

Lo que es aún más preocupante es que los meta empleados también han discutido cómo procesar y filtrar el texto en LibGen para eliminar los logotipos de derechos de autor, como ISBN y la declaración de derechos de autor. La nota interna establece que los materiales proporcionados por LibGen son "documentación de alta calidad y larga, que es muy adecuada para aprender conocimiento profesional especial". Esto muestra que Meta parece tratar de ocultar su contenido no autorizado.

Además, los meta empleados también mencionaron en el correo electrónico que puede ser inapropiado utilizar la dirección IP de la compañía para descargas de semillas directamente y expresar preocupaciones sobre este comportamiento. Sin embargo, en ausencia del uso de Zuckerberg del conjunto de datos Libgen, se reveló la mentalidad ganadora de Meta en la competencia de IA. Este incidente ha provocado una vez más la atención y las dudas sobre los temas de las grandes empresas de tecnología en temas de derechos de autor.

Los resultados de esta demanda por derechos de autor pueden tener un impacto importante en otros casos similares, especialmente en el uso de obras creativas como imágenes, música y literatura. Con la creciente demanda de contenido original de las compañías de tecnología, los derechos e intereses de los creadores de contenido original se convertirán en el foco de atención.

Este incidente no solo expuso la actitud irresponsable de Meta en temas de derechos de autor, sino que también hizo que las personas pensaran profundamente sobre cuestiones éticas y legales en el desarrollo de la IA. En el futuro, cómo equilibrar el desarrollo científico y tecnológico y la protección de la propiedad intelectual se convertirá en un tema importante, que requiere esfuerzos conjuntos dentro y fuera de la industria para buscar soluciones.