Google DeepMind a récemment publié un modèle mondial de base appelé Genie, un environnement interactif généré virtuellement avec 11 milliards de paramètres. Contrairement à l'IA traditionnelle, qui nécessite une annotation manuelle des données pour la formation, Genie utilise directement les données vidéo Internet pour apprendre, et peut identifier par lui-même les caractéristiques et les modèles de différentes actions, et générer des photos, des croquis et même des mondes virtuels contrôlables. Les vidéos qu'il génère sont de style dessin animé et peuvent simuler des mouvements de robots et des objets déformés, montrant de puissantes capacités d'apprentissage et des capacités de contrôle fines, ce qui constitue une étape importante dans le domaine de l'IA.
L’émergence de Genie marque une avancée majeure dans la manière de former des modèles d’IA. Sa puissante capacité d’apprentissage et sa capacité à percevoir des mouvements subtils ouvrent une nouvelle direction pour le développement futur de l’IA. Comparé à d'autres modèles similaires, Genie a démontré de plus grandes capacités en matière d'apprentissage et de génération autonomes, offrant de nouvelles possibilités pour la construction de mondes virtuels et l'interaction avec l'IA.