史丹佛大學開發！對口型視訊模型PROTEUS可讓圖片開口唱歌

作者：Eve Cole 更新時間：2025-01-01 13:32:01

史丹佛大學研究人員與Apparate Labs合作推出了一個名為PROTEUS的革命性AI模型。該模型能夠透過單張照片生成逼真、富有表現力的虛擬人物，並支援即時唱歌和說話，其技術突破性地實現了高幀率視訊串流和多模態互動。 PROTEUS不僅僅是一個虛擬人物生成器，它更是一個高度可自訂的平台，擁有廣泛的應用前景，從個人化虛擬助理到影視娛樂，都能找到它的身影。接下來，我們將深入了解PROTEUS的特點、技術架構以及潛在的應用場景。

站長之家(ChinaZ.com) 6月14日訊息:史丹佛大學研究人員與Apparate Labs聯合推出了一款名為PROTEUS的AI模型，它能夠透過單張照片產生逼真、具有表現力的虛擬人物，並實現即時的唱歌和說話。

主要特點:

即時生成逼真人物:PROTEUS能從單一影像生成笑、饒舌、唱歌、眨眼、微笑、說話等效果，展現複雜的臉部表情和身體動作。

高幀率視訊串流:支援100+ FPS的視訊串流，實現即時處理，確保互動的流暢性與自然性。

多模態互動:相容於語音、文字和圖像等多種資料形式，能在不同場景中進行自然和直覺的互動。

自訂和應用:高度可自訂的架構設計，適用於多個領域和應用場景，滿足個人化需求。

技術架構:

PROTEUS採用了潛在擴散模型和先進的Transformer架構，透過在潛在空間中進行資料處理，高效產生複雜影像。

進一步改進的架構和演算法實現了每秒超過100幀的生成速度。

應用場景:

個人化虛擬助理:提供日常事務處理、行程管理、資訊查詢等服務。

虛擬寵物:創造具有逼真外觀和豐富情感的虛擬寵物。

情緒支持:生成情緒支持型虛擬人物，提供心理安慰與支持。

客戶服務:產生虛擬客服代表，提供即時高效的客戶支援。

教育和培訓:生成虛擬教師或培訓師，提供個人化教育和培訓。

電玩角色自訂:為遊戲開發者提供高度可自訂的遊戲角色。

影視與娛樂:用於產生逼真的虛擬演員和角色，降低製作成本。

行銷和廣告:產生虛擬代言人，進行產品推廣和品牌宣傳。

社群媒體與虛擬社群:在社群平台上產生虛擬形象，豐富社群體驗。

PROTEUS的願景是提供一個可透過語音控制的視覺化體現，作為人工對話實體的直覺接口，使用戶能夠與虛擬形象進行自然的對話和互動。這項技術的安全提供和早期API存取權將向選定的開發者開放。

PROTEUS在Twitch直播中已有多個應用案例，展現了其在即時互動場景中的應用潛力。透過API，PROTEUS可以在任何應用中呼叫使用，為各行業帶來創新的虛擬人物互動體驗。

官網：https://apparate.ai/stream.html

總而言之，PROTEUS AI模型憑藉其強大的即時生成能力、多模態互動以及廣泛的應用前景，有望在虛擬人物互動領域掀起一場革命，為用戶帶來全新的互動體驗。其未來發展值得期待。