谷歌DeepMind近日发布了名为Genie的基础世界模型,这是一个拥有110亿参数的虚拟生成可交互环境。不同于传统AI需要人工标注数据进行训练,Genie直接利用互联网视频数据进行学习,并能自行识别不同动作的特征和模式,生成照片、草图甚至可操控的虚拟世界。其生成的视频风格卡通化,可模拟机器人动作和变形物体,展现出强大的学习能力和细粒度控制能力,在AI领域具有里程碑式的意义。
Genie的出现标志着AI模型训练方式的重大突破,其强大的学习能力和对细微动作的感知能力为未来AI发展提供了新的方向。 相比其他同类模型,Genie在自主学习和生成方面展现了更强的能力,为虚拟世界构建和AI交互提供了新的可能性。