Récemment, le géant de la technologie Google a annoncé la création d'une toute nouvelle équipe d'IA pour se concentrer sur le développement de modèles d'intelligence artificielle qui peuvent simuler le monde physique. L'équipe sera dirigée par Tim Brooks, qui a une fois co-amené le modèle de génération de vidéos Sora à Openai. Brooks a révélé sur la plate-forme sociale X que l'équipe sera affiliée à Google Deepmind, un laboratoire de recherche sur l'IA sous Google, marquant une étape importante pour Google dans le domaine de l'IA.
Brooks a déclaré dans l'annonce que l'objectif de Deepmind était de développer des modèles génératifs à grande échelle pour simuler le monde réel. Il a mentionné que la nouvelle équipe travaillera en étroite collaboration avec les équipes Gémeaux, Veo et Genie de Google pour résoudre les problèmes techniques clés et améliorer la puissance de calcul du modèle à l'extrême. Gemini est le modèle phare de Google, principalement utilisé pour l'analyse d'image et la génération de texte;
Brooks a en outre révélé que la nouvelle équipe travaillera sur le développement d'outils de "génération interactive en temps réel" et explorera comment intégrer ces modèles avec des modèles multimodaux existants tels que les Gémeaux. La description du travail de l'équipe a mentionné: "Nous pensons que la formation à l'échelle de l'IA basée sur les données vidéo et multimodales est le chemin clé de la mise en œuvre de l'intelligence générale artificielle (AGI)." L'objectif à long terme de Google dans le domaine de l'IA.
En plus de Google, de nombreuses startups et grandes entreprises technologiques développent également activement des modèles mondiaux. Par exemple, World Labs, dirigé par le célèbre chercheur d'IA Fei-Fei Lee, les startups israéliennes Decart et Odyssey, etc. Ces entreprises estiment que les futurs modèles mondiaux seront largement utilisés dans les médias interactifs tels que les jeux vidéo et les films, ainsi que dans les simulations du monde réel telles que la formation des robots.
Cependant, les attitudes à l'égard de la technologie de l'IA dans le domaine créatif ne sont pas cohérentes. Une récente enquête sur les magazines Wired a montré que les sociétés de développement de jeux telles qu'Activision Blizzard utilisent l'IA pour réduire les coûts et augmenter la productivité, mais cela a également conduit un grand nombre d'employés à licencier. Selon une recherche en 2024 Union d'animation, on estime qu'en 2026, plus de 100 000 emplois dans l'industrie américaine du cinéma, de la télévision et de l'animation seront affectés par l'IA.
Pourtant, certaines startups mondiales émergentes telles que Odyssey promettent de travailler avec des professionnels créatifs plutôt que de les remplacer. Il reste à voir si Google adoptera une approche similaire. De plus, les problèmes de droit d'auteur n'ont pas encore été résolus. Certains modèles mondiaux ont peut-être utilisé des clips de jeux vidéo en direct non autorisés, ce qui fait que les entreprises impliquées sont confrontées à des risques de litige.
Google a déclaré qu'il avait formé des modèles sur YouTube pour obtenir une autorisation en fonction des conditions d'utilisation de la plate-forme, mais n'a pas divulgué les vidéos utilisées. Avec le développement continu de la technologie de l'IA, comment trouver un équilibre entre l'innovation et la protection des droits d'auteur deviendra un problème important dans l'industrie technologique future.