O modelo de geração de vídeo Sora da OpenAI atraiu a atenção generalizada. Seus poderosos recursos de geração de vídeo são incríveis, mas sua fonte de dados de treinamento tem sido confusa. Este artigo irá aprofundar as possíveis fontes de dados de treinamento de Sora, especialmente o papel desempenhado pelas transmissões ao vivo de jogos e vídeos de estratégia, e analisar as questões jurídicas que podem surgir e o impacto no desenvolvimento futuro da IA.
O artefato de geração de vídeo da OpenAI, Sora, atraiu muita atenção desde seu lançamento, mas de onde aprendeu sempre foi um mistério. Agora, parte do mistério parece ter sido revelada: é provável que os dados de treinamento de Sora contenham um grande número de transmissões ao vivo de jogos e vídeos de estratégia do Twitch!
Sora é como um habilidoso "mestre da imitação", capaz de gerar vídeos de até 20 segundos de duração apenas com instruções de texto ou imagens, e pode controlar múltiplas proporções e resoluções. Em fevereiro deste ano, quando a OpenAI revelou Sora pela primeira vez, deu a entender que seu modelo estava “concentrado na prática” no vídeo do “Minecraft”. Então, além do "Minecraft", que outros tesouros do jogo estão escondidos nos "Segredos das Artes Marciais" de Sora?
Os resultados são surpreendentes, pois Sora parece estar familiarizado com vários tipos de jogos. Ele pode gerar um vídeo de jogo clone com a sombra de "Mario", embora existam algumas "pequenas falhas", mas também pode simular uma emocionante tela de jogo de tiro em primeira pessoa, como se fosse "Call of Duty" e "Counter-Strike"; são "combinados" "; Também pode recriar as cenas de luta do jogo de arcade "Teenage Mutant Ninja Turtles" da década de 1990, fazendo as pessoas se sentirem imersas em memórias de infância.
O que é ainda mais surpreendente é que Sora também conhece bem a forma de transmissão ao vivo do Twitch, o que implica que ele “assistiu” uma grande quantidade de conteúdo transmitido ao vivo. As capturas de tela do vídeo geradas por Sora não apenas capturaram com precisão a estrutura do quadro da transmissão ao vivo, mas também restauraram vividamente a imagem do conhecido âncora Auronplay, incluindo a tatuagem em seu braço esquerdo.
Além disso, Sora também “conhece” outra âncora do Twitch, Pokimane, e gerou um vídeo de uma personagem que se parece com ela. Claro, para evitar problemas de direitos autorais, a OpenAI configurou um mecanismo de filtragem para evitar que Sora gere vídeos contendo personagens de marca registrada.
Embora a OpenAI seja discreta sobre a fonte de seus dados de treinamento, há indicações de que o conteúdo do jogo provavelmente está incluído no conjunto de treinamento de Sora. Em entrevista ao Wall Street Journal em março, Mira Mulati, ex-CTO da OpenAI, não negou diretamente que Sora usou conteúdo do YouTube, Instagram e Facebook para treinamento. A OpenAI também admite nas especificações técnicas da Sora que usa dados “disponíveis publicamente”, bem como dados licenciados de bibliotecas de mídia como a Shutterstock.
Se o conteúdo do jogo for realmente usado para treinar Sora, isso poderá desencadear uma série de questões legais, especialmente quando a OpenAI desenvolver uma experiência mais interativa baseada em Sora. O advogado de propriedade intelectual de Pryor Cashman, Joshua Weigensberg, apontou que o uso não autorizado de vídeos de jogos para treinamento de IA enfrentará enormes riscos, porque o treinamento de modelos de IA geralmente requer a cópia de dados de treinamento, e os vídeos de jogos contêm uma grande quantidade de conteúdo protegido por direitos autorais.
Modelos generativos de IA, como Sora, são baseados em probabilidade. Eles aprendem padrões a partir de grandes quantidades de dados e fazem previsões. Essa habilidade lhes permite “aprender” como o mundo funciona. Mas também existem perigos ocultos. Sob certas instruções, o modelo pode gerar conteúdo muito semelhante aos seus dados de treinamento. Isso causou forte insatisfação entre os criadores, que acreditavam que suas obras eram utilizadas para treinamento sem autorização.
Atualmente, a Microsoft e a OpenAI estão sendo processadas por suas ferramentas de IA que supostamente copiam código licenciado. Empresas de aplicação de arte de IA, como Midjourney, Runway e Stability AI, também enfrentaram acusações de violação dos direitos dos artistas. Grandes gravadoras também entraram com ações judiciais contra Udio e Suno, startups que desenvolvem geradores de músicas com IA.
Muitas empresas de IA há muito defendem princípios de “utilização justa”, argumentando que os seus modelos criam trabalhos “transformadores” em vez de plágio. Mas o conteúdo do jogo tem suas particularidades. Evan Everest, advogado de direitos autorais da Dorsey & Whitney, apontou que os vídeos de jogos envolvem pelo menos duas camadas de proteção de direitos autorais: os direitos autorais do conteúdo do jogo de propriedade do desenvolvedor do jogo e os direitos autorais do vídeo exclusivo criado pelo jogador ou vídeo. produtor. Para alguns jogos, pode também existir um terceiro nível de direitos, nomeadamente direitos de autor sobre conteúdo gerado pelo utilizador.
Por exemplo, Fortnite permite que os jogadores criem seus próprios mapas de jogo e os compartilhem com outras pessoas. Um vídeo de jogo sobre esses mapas envolve pelo menos três proprietários de direitos autorais: Epic, jogadores e criadores de mapas. Se o tribunal determinar que o treinamento do modelo de IA envolve responsabilidade por direitos autorais, esses proprietários de direitos autorais poderão se tornar potenciais demandantes ou fontes autorizadas.
Além disso, Weigensberg também destacou que o jogo em si também possui muitos elementos “protegíveis”, como texturas proprietárias, que os juízes podem considerar em litígios de propriedade intelectual.
Atualmente, vários estúdios e editores de jogos, incluindo Epic, Microsoft (dona do Minecraft), Ubisoft, Nintendo, Roblox e CD Projekt Red, desenvolvedor do Cyberpunk 2077, não comentaram o assunto.
Mesmo que as empresas de IA ganhem estas disputas legais, os utilizadores não poderão estar isentos de responsabilidade. Se um modelo generativo copiar uma obra protegida por direitos autorais, a pessoa que publica a obra ou a incorpora em outros projetos ainda pode ser responsabilizada por violação de propriedade intelectual.
Algumas empresas de IA possuem cláusulas de compensação para lidar com tais situações, mas geralmente há exceções. Por exemplo, os termos da OpenAI aplicam-se apenas a clientes empresariais, não a utilizadores individuais. Além dos riscos de direitos autorais, também existem riscos como violações de marcas registradas, por exemplo, o conteúdo de saída pode conter ativos usados para marketing e branding, incluindo personagens do jogo.
À medida que cresce o interesse pelos modelos mundiais, a situação pode tornar-se mais complexa. Uma aplicação dos modelos mundiais é a geração de videogames da vida real, o que pode causar problemas jurídicos se esses jogos "sintéticos" forem muito semelhantes aos que o modelo foi treinado.
Avery Williams, advogada de litígios de propriedade intelectual da McKool Smith, apontou que elementos como vozes, movimentos, personagens, músicas, diálogos e obras de arte usados para treinar a plataforma de IA em jogos constituem violação de direitos autorais. As questões sobre o “uso justo” levantadas em numerosos processos judiciais contra empresas de IA generativa terão o mesmo impacto na indústria dos videojogos que outros mercados criativos.
O sucesso de Sora também destaca o enorme potencial da tecnologia generativa de IA no campo da criação de conteúdos, mas também expõe os seus enormes desafios na utilização de dados e direitos de propriedade intelectual. Como equilibrar a inovação tecnológica e a protecção da propriedade intelectual será uma questão fundamental que precisa de ser resolvida no futuro desenvolvimento da IA. No futuro, a fonte de dados de formação para modelos de IA e a sua legalidade estarão sujeitas a um escrutínio mais rigoroso, o que terá um impacto profundo no desenvolvimento futuro da indústria de IA.