谷歌发布基础世界模型Genie，110亿参数

作者：Eve Cole 更新时间：2025-02-04 03:48:01

谷歌DeepMind近日发布了名为Genie的基础世界模型，这是一个拥有110亿参数的虚拟生成可交互环境。不同于传统AI需要人工标注数据进行训练，Genie直接利用互联网视频数据进行学习，并能自行识别不同动作的特征和模式，生成照片、草图甚至可操控的虚拟世界。其生成的视频风格卡通化，可模拟机器人动作和变形物体，展现出强大的学习能力和细粒度控制能力，在AI领域具有里程碑式的意义。

Genie的出现标志着AI模型训练方式的重大突破，其强大的学习能力和对细微动作的感知能力为未来AI发展提供了新的方向。相比其他同类模型，Genie在自主学习和生成方面展现了更强的能力，为虚拟世界构建和AI交互提供了新的可能性。