近日,科技巨頭谷歌宣布成立一支全新的AI團隊,專注於開發能夠模擬物理世界的人工智能模型。這支團隊將由曾在OpenAI擔任視頻生成模型Sora共同負責人的Tim Brooks領導。 Brooks在社交平台X上透露,該團隊將隸屬於谷歌旗下的AI研究實驗室Google DeepMind,標誌著谷歌在AI領域邁出了重要的一步。
Brooks在公告中表示,DeepMind的目標是開發大規模的生成模型來模擬現實世界。他提到,新團隊將與穀歌的Gemini、Veo和Genie團隊緊密合作,解決關鍵的技術難題,並將模型的計算能力提升到極致。 Gemini是谷歌的旗艦級AI模型,主要用於圖像分析和文本生成;Veo則是谷歌自主開發的視頻生成模型;而Genie則是谷歌在實時模擬遊戲和3D環境方面的嘗試。
Brooks進一步透露,新團隊將致力於開發“實時互動生成”工具,並探索如何將這些模型與現有的多模態模型如Gemini進行整合。團隊的工作描述中提到:“我們相信,基於視頻和多模態數據的AI訓練規模化是實現人工通用智能(AGI)的關鍵路徑。”AGI是指能夠完成任何人類能完成的任務的人工智能,這也是谷歌在AI領域的長期目標。
除了谷歌,許多初創公司和大型科技企業也在積極開發世界模型。例如,由著名AI研究員Fei-Fei Lee領導的World Labs、以色列初創企業Decart和Odyssey等。這些公司認為,未來世界模型將廣泛應用於互動媒體,如視頻遊戲和電影,以及真實世界的模擬,如機器人訓練等。
然而,創意領域對AI技術的態度卻並不一致。最近《連線》雜誌的一項調查顯示,遊戲開發公司如動視暴雪正在利用AI技術來降低成本並提高生產效率,但這也導致了大量員工被裁。根據2024年動畫工會的研究,預計到2026年,美國電影、電視和動畫行業將有超過10萬個工作崗位受到AI的影響。
儘管如此,一些新興的世界建模初創企業如Odyssey承諾將與創意專業人士合作,而不是取代他們。谷歌是否會採取類似的做法,仍有待觀察。此外,關於版權的問題也尚未得到解決。部分世界模型的訓練可能使用了未經授權的視頻遊戲實況片段,導致相關公司面臨訴訟風險。
谷歌方面表示,其在YouTube上訓練模型是依據平台的服務條款獲得了許可,但尚未透露具體使用了哪些視頻。隨著AI技術的不斷發展,如何在創新與版權保護之間找到平衡,將成為未來科技行業的重要議題。