近日,科技巨头谷歌宣布成立一支全新的AI团队,专注于开发能够模拟物理世界的人工智能模型。这支团队将由曾在OpenAI担任视频生成模型Sora共同负责人的Tim Brooks领导。Brooks在社交平台X上透露,该团队将隶属于谷歌旗下的AI研究实验室Google DeepMind,标志着谷歌在AI领域迈出了重要的一步。
Brooks在公告中表示,DeepMind的目标是开发大规模的生成模型来模拟现实世界。他提到,新团队将与谷歌的Gemini、Veo和Genie团队紧密合作,解决关键的技术难题,并将模型的计算能力提升到极致。Gemini是谷歌的旗舰级AI模型,主要用于图像分析和文本生成;Veo则是谷歌自主开发的视频生成模型;而Genie则是谷歌在实时模拟游戏和3D环境方面的尝试。
Brooks进一步透露,新团队将致力于开发“实时互动生成”工具,并探索如何将这些模型与现有的多模态模型如Gemini进行整合。团队的工作描述中提到:“我们相信,基于视频和多模态数据的AI训练规模化是实现人工通用智能(AGI)的关键路径。”AGI是指能够完成任何人类能完成的任务的人工智能,这也是谷歌在AI领域的长期目标。
除了谷歌,许多初创公司和大型科技企业也在积极开发世界模型。例如,由著名AI研究员Fei-Fei Lee领导的World Labs、以色列初创企业Decart和Odyssey等。这些公司认为,未来世界模型将广泛应用于互动媒体,如视频游戏和电影,以及真实世界的模拟,如机器人训练等。
然而,创意领域对AI技术的态度却并不一致。最近《连线》杂志的一项调查显示,游戏开发公司如动视暴雪正在利用AI技术来降低成本并提高生产效率,但这也导致了大量员工被裁。根据2024年动画工会的研究,预计到2026年,美国电影、电视和动画行业将有超过10万个工作岗位受到AI的影响。
尽管如此,一些新兴的世界建模初创企业如Odyssey承诺将与创意专业人士合作,而不是取代他们。谷歌是否会采取类似的做法,仍有待观察。此外,关于版权的问题也尚未得到解决。部分世界模型的训练可能使用了未经授权的视频游戏实况片段,导致相关公司面临诉讼风险。
谷歌方面表示,其在YouTube上训练模型是依据平台的服务条款获得了许可,但尚未透露具体使用了哪些视频。随着AI技术的不断发展,如何在创新与版权保护之间找到平衡,将成为未来科技行业的重要议题。