谷歌DeepMind近日發布了名為Genie的基礎世界模型,這是一個擁有110億個參數的虛擬生成可交互環境。有別於傳統AI需要人工標註資料進行訓練,Genie直接利用網路影片資料進行學習,並能自行辨識不同動作的特徵和模式,產生照片、草圖甚至可操控的虛擬世界。其生成的影片風格卡通化,可模擬機器人動作和變形物體,展現出強大的學習能力和細粒度控制能力,在AI領域具有里程碑式的意義。
Genie的出現標誌著AI模型訓練方式的重大突破,其強大的學習能力和對細微動作的感知能力為未來AI發展提供了新的方向。 相較於其他同類模型,Genie在自主學習和生成方面展現了更強的能力,為虛擬世界建構和AI互動提供了新的可能性。