El último modelo de generación de vídeo de OpenAI, Sora, ha atraído una gran atención por sus potentes funciones, pero también conlleva riesgos legales que no se pueden ignorar. Sora puede generar vídeos de alta calidad basados en texto o imágenes, y los videoclips que genera incluso se parecen a algunos juegos conocidos, como "Super Mario Bros.", "Call of Duty", etc. Sin embargo, la fuente de los datos de entrenamiento de Sora no se divulga en su totalidad y puede contener una gran cantidad de contenido del juego protegido por derechos de autor, lo que lo expone a posibles litigios por derechos de autor.
OpenAI lanzó recientemente su modelo de generación de video Sora, pero los datos de entrenamiento del modelo pueden contener una gran cantidad de contenido de juego protegido por derechos de autor, lo que ha generado preocupaciones sobre problemas legales. Sora puede generar un video de hasta 20 segundos basado en las indicaciones de texto o imágenes del usuario y admite una variedad de formatos y resoluciones. En el momento del lanzamiento, OpenAI mencionó que los datos de entrenamiento de Sora incluían videos de Minecraft, lo que despertó curiosidad sobre otros contenidos de juegos que podrían usarse.
En pruebas del mundo real, Sora pudo generar videos que se parecían a varios juegos conocidos, incluido lo que parecía un clon de Super Mario Bros., un juego de disparos en primera persona inspirado en Call of Duty y Counter-Strike, y el estilo es similar a un clip del juego arcade de lucha Teenage Mutant Ninja Turtles de los 90. Además, Sora también parece haber dominado la interpretación de las transmisiones en vivo de Twitch y es capaz de generar personajes similares a los populares streamers Auronplay y Pokimane.
Sin embargo, OpenAI no detalló las fuentes de datos utilizadas por Sora. Si bien OpenAI dice que utiliza datos "disponibles públicamente" y obtiene datos con licencia de bibliotecas de medios de archivo como Shutterstock, eso no elimina los riesgos legales. El abogado de propiedad intelectual Joshua Weigensberg señaló que si los datos de entrenamiento de Sora contienen vídeo en vivo del juego, es probable que esto implique la duplicación de material protegido por derechos de autor.
Las características de los modelos generativos de IA como Sora se basan en el aprendizaje probabilístico, identificando patrones a través de grandes cantidades de datos. Sin embargo, esto también puede conducir a la generación de resultados que se aproximan a los datos de capacitación, lo que genera insatisfacción entre los creadores, y un número cada vez mayor de personas busca soluciones por medios legales.
Tratar el contenido del juego es particularmente complejo porque la reproducción de vídeo implica no sólo los derechos de autor del desarrollador del juego, sino también vídeos potencialmente únicos producidos por los jugadores. Si el tribunal determina que se han infringido los derechos de autor al entrenar un modelo de IA, los desarrolladores enfrentarán más riesgos legales.
Aunque las empresas de IA pueden prevalecer en algunas disputas legales, esto no significa que los usuarios de estos modelos estén completamente exentos de responsabilidad. El contenido generado puede involucrar múltiples áreas legales, como derechos de autor, derechos de marca registrada y derechos de retrato. Por lo tanto, los desarrolladores deben extremar las precauciones al entrenar modelos de IA.
El surgimiento de Sora demuestra el rápido desarrollo de la tecnología de generación de videos de IA, pero sus problemas de derechos de autor también son una advertencia para el desarrollo de la tecnología de IA. En el futuro, la capacitación y el uso de modelos de IA deben prestar más atención a la protección de la propiedad intelectual y. equilibrar la innovación y el cumplimiento legal.