O Google DeepMind lançou recentemente um modelo mundial básico chamado Genie, um ambiente interativo gerado virtualmente com 11 bilhões de parâmetros. Ao contrário da IA tradicional, que requer anotação manual de dados para treinamento, o Genie usa diretamente dados de vídeo da Internet para aprender e pode identificar por conta própria as características e padrões de diferentes ações e gerar fotos, esboços e até mesmo mundos virtuais controláveis. Os vídeos gerados são em estilo cartoon e podem simular movimentos de robôs e objetos deformados, mostrando poderosas capacidades de aprendizagem e capacidades de controle refinado, o que é um marco no campo da IA.
O surgimento do Genie marca um grande avanço na forma de treinamento de modelos de IA. Sua poderosa capacidade de aprendizagem e de perceber movimentos sutis fornecem uma nova direção para o desenvolvimento futuro da IA. Em comparação com outros modelos semelhantes, o Genie demonstrou capacidades mais fortes em aprendizagem e geração autónomas, proporcionando novas possibilidades para a construção de mundos virtuais e interação de IA.