Le modèle de génération vidéo Sora d'OpenAI a attiré une large attention. Ses puissantes capacités de génération vidéo sont étonnantes, mais sa source de données de formation prête à confusion. Cet article se penchera sur les sources de données de formation possibles de Sora, en particulier le rôle joué par les diffusions de jeux en direct et les vidéos de stratégie, et analysera les problèmes juridiques qui peuvent survenir et leur impact sur le développement futur de l'IA.
L'artefact de génération vidéo d'OpenAI, Sora, a attiré beaucoup d'attention depuis son lancement, mais les enseignements qu'il a tirés ont toujours été un mystère. Désormais, une partie du mystère semble avoir été révélée : les données d'entraînement de Sora contiennent probablement un grand nombre de retransmissions de jeux en direct et de vidéos de stratégie de Twitch !
Sora est comme un "maître de l'imitation" qualifié, capable de générer des vidéos d'une durée maximale de 20 secondes avec uniquement des invites textuelles ou des images, et peut contrôler plusieurs formats d'image et résolutions. En février de cette année, lorsque OpenAI a dévoilé Sora pour la première fois, il a laissé entendre que son modèle « se concentrait sur la pratique » dans la vidéo de « Minecraft ». Alors, en plus de « Minecraft », quels autres trésors du jeu sont cachés dans les « Secrets d'arts martiaux » de Sora ?
Les résultats sont surprenants, car Sora semble être familier avec une variété de types de jeux. Il peut générer une vidéo de jeu clone avec l'ombre de "Mario", bien qu'il y ait quelques "défauts mineurs", il peut également simuler un écran de jeu de tir à la première personne passionnant, comme si "Call of Duty" et "Counter-Strike" ; sont "combinés" ; Il peut également recréer les scènes de combat du jeu d'arcade "Teenage Mutant Ninja Turtles" dans les années 1990, donnant aux gens l'impression d'être plongés dans des souvenirs d'enfance.
Ce qui est encore plus surprenant, c'est que Sora connaît également bien la forme des diffusions en direct sur Twitch, ce qui implique qu'il a « regardé » une grande quantité de contenu diffusé en direct. Les captures d'écran vidéo générées par Sora ont non seulement capturé avec précision la structure de l'image de la diffusion en direct, mais ont également restitué de manière vivante l'image du célèbre présentateur Auronplay, y compris le tatouage sur son bras gauche.
Non seulement cela, Sora "connaît" également un autre présentateur de Twitch, Pokimane, et a généré une vidéo d'un personnage qui lui ressemble. Bien entendu, afin d'éviter les problèmes de droits d'auteur, OpenAI a mis en place un mécanisme de filtrage pour empêcher Sora de générer des vidéos contenant des caractères déposés.
Bien qu’OpenAI reste discret sur la source de ses données d’entraînement, certains éléments indiquent que le contenu du jeu est très probablement inclus dans l’ensemble d’entraînement de Sora. Dans une interview accordée au Wall Street Journal en mars, Mira Mulati, ancienne CTO d'OpenAI, n'a pas directement nié que Sora utilisait le contenu de YouTube, Instagram et Facebook pour se former. OpenAI admet également dans les spécifications techniques de Sora qu'il utilise des données « accessibles au public » ainsi que des données sous licence provenant de médiathèques telles que Shutterstock.
Si le contenu du jeu est effectivement utilisé pour entraîner Sora, cela pourrait déclencher une série de problèmes juridiques, notamment lorsque OpenAI développe une expérience plus interactive basée sur Sora. L'avocat en propriété intellectuelle de Pryor Cashman, Joshua Weigensberg, a souligné que l'utilisation non autorisée de vidéos de jeux pour la formation en IA comporterait d'énormes risques, car la formation des modèles d'IA nécessite généralement la copie des données de formation et les vidéos de jeux contiennent une grande quantité de contenu protégé par le droit d'auteur.
Les modèles d’IA générative tels que Sora sont basés sur des probabilités. Ils apprennent des modèles à partir de grandes quantités de données et font des prédictions. Cette capacité leur permet « d’apprendre » comment fonctionne le monde. Mais il existe également des dangers cachés. Sous certaines invites, le modèle peut générer un contenu très similaire à ses données d'entraînement. Cela a provoqué un fort mécontentement parmi les créateurs, qui estimaient que leurs œuvres étaient utilisées à des fins de formation sans autorisation.
Actuellement, Microsoft et OpenAI sont poursuivis en justice pour leurs outils d'IA qui auraient copié du code sous licence. Les sociétés d'application artistique de l'IA telles que Midjourney, Runway et Stability AI ont également été accusées de violation des droits des artistes. De grandes sociétés de musique ont également intenté des poursuites contre Udio et Suno, des startups qui développent des générateurs de chansons IA.
De nombreuses entreprises d’IA défendent depuis longtemps les principes de « l’utilisation équitable », arguant que leurs modèles créent des œuvres « transformatrices » plutôt que du plagiat. Mais le contenu du jeu a ses propres particularités. Evan Everest, avocat spécialisé en droits d'auteur chez Dorsey & Whitney, a souligné que les vidéos de jeux impliquent au moins deux niveaux de protection des droits d'auteur : le droit d'auteur du contenu du jeu appartenant au développeur du jeu et le droit d'auteur de la vidéo unique créée par le joueur ou la vidéo. producteur. Pour certains jeux, il peut également exister un troisième niveau de droits, à savoir le droit d'auteur sur le contenu généré par l'utilisateur.
Par exemple, Fortnite permet aux joueurs de créer leurs propres cartes de jeu et de les partager avec d'autres. Une vidéo de jeu sur ces cartes implique au moins trois titulaires de droits d'auteur : Epic, les joueurs et les créateurs de cartes. Si le tribunal détermine que la formation sur des modèles d’IA implique une responsabilité en matière de droits d’auteur, ces titulaires de droits d’auteur pourraient devenir des plaignants potentiels ou des sources autorisées.
En outre, Weigensberg a également souligné que le jeu lui-même comporte également de nombreux éléments « protégeables », tels que des textures exclusives, que les juges peuvent prendre en compte dans un litige en matière de propriété intellectuelle.
Actuellement, plusieurs studios et éditeurs de jeux, dont Epic, Microsoft (qui possède Minecraft), Ubisoft, Nintendo, Roblox et le développeur de Cyberpunk 2077, CD Projekt Red, n'ont pas commenté la question.
Même si les sociétés d’IA gagnent ces litiges juridiques, les utilisateurs ne peuvent pas être exonérés de leur responsabilité. Si un modèle génératif copie une œuvre protégée par le droit d'auteur, la personne qui publie l'œuvre ou l'incorpore dans d'autres projets peut toujours être tenue responsable de violation de la propriété intellectuelle.
Certaines sociétés d’IA ont mis en place des clauses d’indemnisation pour faire face à de telles situations, mais il existe généralement des exceptions. Par exemple, les conditions d'OpenAI s'appliquent uniquement aux entreprises clientes, et non aux utilisateurs individuels. En outre, outre les risques liés aux droits d'auteur, il existe également des risques tels que la violation des marques déposées. Par exemple, le contenu final peut contenir des actifs utilisés à des fins de marketing et de stratégie de marque, y compris des personnages du jeu.
À mesure que l’intérêt pour les modèles mondiaux augmente, la situation pourrait devenir plus complexe. Une application des modèles mondiaux consiste à générer des jeux vidéo réels, ce qui peut entraîner des problèmes juridiques si ces jeux « synthétiques » ressemblent trop à ceux sur lesquels le modèle a été formé.
Avery Williams, avocat spécialisé en propriété intellectuelle chez McKool Smith, a souligné que des éléments tels que les voix, les mouvements, les personnages, les chansons, les dialogues et les œuvres d'art utilisés pour entraîner la plate-forme d'IA dans les jeux constituent une violation du droit d'auteur. Les questions de « fair use » soulevées dans de nombreux procès contre des sociétés d’IA générative auront le même impact sur l’industrie du jeu vidéo que sur les autres marchés créatifs.
Le succès de Sora met également en évidence l’énorme potentiel de la technologie de l’IA générative dans le domaine de la création de contenu, mais expose également ses énormes défis en matière d’utilisation des données et de droits de propriété intellectuelle. Comment concilier innovation technologique et protection de la propriété intellectuelle sera une question clé qui devra être résolue dans le développement futur de l’IA. À l'avenir, la source des données de formation pour les modèles d'IA et leur légalité seront soumises à un examen plus strict, ce qui aura un impact profond sur le développement futur de l'industrie de l'IA.