世界首個1000億AI智能體文明誕生！北大校友打造真實版西部世界

作者：Eve Cole 更新時間：2025-01-31 05:24:02

人類世界的一切日常活動，都在《我的世界》中被1:1復刻了。 1000億AI智能體構成的文明，竟是這樣的。

世界首個「AI智能體文明」，終於揭密了！

2個月前，1000+多個智能體在虛擬世界中，一同協作建構起自己的經濟、文化、宗教和政府…

網友紛紛驚呼，堪稱現實版「西方世界」。

如今，這個文明再次進化了，1000億AI智能體文明的世界又是怎麼樣的呢？

它們是一個個體，也是一個群體。

人類日常生活中的一切活動，將在「我的世界」中實現1:1復刻。

‍這位北大校友RoBERT Yang分享了團隊最新的研究，首次對外介紹了背後PIANO全新的「認知架構」。

PIANO（平行資訊聚合神經協調），是一個能讓AI智能體實現多方互動的架構，同時在多個輸出流中保持連貫性。

專案地址：https://github.com/altera-al/project-sid

AI智能體如何同時思考和行動，在多個時間尺度上，以有意識和潛意識的方式運作？

好比鋼琴的琴鍵，代表不同的大腦模組。當它們一起演奏時，可以產生優美的和弦。而在智能體中，同樣產生了類人的特質。

這些智能體，會構築了一個「文明」。納稅、貿易、政府、國家、宗教….，一切人類世界所有的日常，AI智能體也有。 ‍

而且，AI智能體也能夠準確推論他人的情感，建立友誼，甚至會樹敵的關係。一些內向的智能體，與「社恐」的人類一樣，比外向智能體有著較少的社交連結。

有網友表示，我們生活在模擬矩陣中，未來就是現在。

接下來，一起看看AI智能體的「世界」，是怎樣的全貌？

為什麼需要AI智能體文明？

為了讓AI智能體能夠與人類共存並融入我們的社會，它們不僅需要具備自主性，還需要具備協作能力。

近年來，大型語言模型（LLM）在推理和決策方面的進步顯著增強了智能體的自主性。

然而，僅僅擁有自主性是不夠的。智能體也必須在人類文明中與人類和其他智能體共存。

正如論文作者所言：

以智能體共存和推廣非人類文明的能力來衡量文明進步，代表了人工智慧智能體能力的最終基準。

但建構AI文明，並非易事。

首先，基於LLM的智能體通常難以在行動和推理中保持現實感。

即使配備了用於規劃和反思的模組，智能體也常常陷入重複的行為模式或透過幻覺累積錯誤，導致無法取得有意義的進展。

其次，錯誤傳達思想和意圖的智能體會誤導其他智能體，導致進一步的幻覺和循環。這種溝通不良經常發生在智能體群體中，會導致功能失調行為，並會惡化群體中的個人表現。

最後，目前智能體的基準測試主要集中在自主智能體在各種領域的表現，如網路搜尋、程式設計、搜尋和查詢以及推理。

那麼，建構AI智能體的最優解是什麼呢？

全新PIANO架構

為了解決現有問題，全新的PIANO架構應運而生。

PIANO架構是一個綜合性的、高度靈活的智慧體設計架構。

其中，P代表感知模組，I代表智慧核心，A則是行動模組。 PIANO架構最顯著的特點之一便是允許智能體同時思考和行動。

這項特性打破了傳統架構中可能存在的行動與思考相互制約的限制。

在複雜多變的環境中，智能體面臨著各種各樣的情況，其中既包括需要快速應對的即時威脅，也有需要深思熟慮的長期規劃。

在行為連貫性方面，引入認知控制器（CC）模組。

認知控制器（CC）模組則像是智能體的「大腦中樞」，負責進行高級決策——透過接收和綜合各個模組的訊息，認知控制器將這些資訊轉化為一個統一的、協調的決策，並將其進一步轉換為每個馬達模組中的適當輸出。

確保了各個模組之間的和諧協作，避免了因不同模組各自為政而產生的不一致問題。

基於上述兩個架構原則，PIANO架構系統由10個並發運作的不同模組組成，其核心模組包括：

-記憶：

記憶模組堪稱智能體的「智慧寶庫」，無論是簡短的日常問候、深入的技術討論，還是充滿情感的交流，每一個字詞、每一個語調變化都被精確存儲。

除此之外，智能體不僅能記住每個步驟的描述，甚至還能記住對話中的提問、回答的順序以及雙方強調的重點內容。

-行動意識：

它就像一個全面的體檢系統。智能體透過這個模組可以精確掌握自己的能量儲備情況，知道剩餘電量還能支援多長時間的運行，或是燃料儲備是否足夠完成下一個階段的任務。

同時，它能對各個零件進行即時監測，例如偵測感測器是否正常運作、機械關節的彈性程度、資料處理單元的運算速度等。任何一個微小的異常都逃不過它的「眼睛」。

-目標生成：

它基於智能體豐富的經驗和與環境的深度交互，不斷孕育出新的目標，推動智能體向前發展。

例如，在一個多智能體合作的物流場景中，智能體發現貨物運輸過程中某個區域經常出現擁堵（環境交互），而之前它有過參與優化運輸路線的經驗（過往經驗），那麼目標生成模組可能會產生一個新的目標：與其他智慧體合作，設計一種新的避開擁塞區域的運輸路線方案。

這種目標生成機制賦予了智能體主動探索和創新的能力，使其不僅僅是被動地執行預設任務，並且能夠根據實際情況積極拓展自己的行動領域。

-社交意識：

它為智能體開啟了理解和融入群體的大門。

簡單理解，它能夠對特定的動作訊息做出快速反應。

例如一個簡單的手勢（舉起手臂可能表示請求幫助或引起注意）、特定的身體姿態（微微前傾可能表示友好和關注），社交意識模組能夠準確識別並理解其含義。

當然，如果識別到其他智能體的求助訊號，它可以根據自身能力和當前任務情況決定是否提供幫助。

-對話：

對話模組是智能體的「語言中樞」，是其與外界有效溝通的關鍵所在。

對話模組擁有強大的語法分析和語義理解能力。對於接收到的各種類型的語言輸入，無論是簡潔明了的指令、富有情感的表達還是複雜抽象的概念描述，它都能準確解析。

並且，對於模糊不清或有歧義的語言，它也能透過上下文和語言習慣進行合理推論。

在生成語言方面，對話模組能夠根據智能體的內在狀態和意圖，準確地表達自己的想法。

-技能執行：

技能執行模組是智慧體與外界環境互動的直接執行者。當智能體需要在環境中執行特定技能或行動時，技能執行模組會有條不紊地協調各個相關部分。

單智能體—多智能體進化

以《我的世界》為例，研究人員選取了1000種物品的能力來評估，試圖觀察並衡量智慧文明體的進步。

單一智能體

首先，透過智能體在《我的世界》裡獲取物品的情況來評估它的性能。

研究人員設定了25個智能體，一開始它們的背包都是空的，而且它們出生的地方離得很遠，互相沒辦法交流，這些智能體都被設定成以探索和收集物品為目標的「探險家」。

它們在不同的地方出生，像地表、洞穴、森林或其他不同的環境。不同的出生點意味著它們能拿到的資源不一樣，完成收集物品這個目標的難度也不同。

例如在資源多的地表出生的智能體，周圍可能有很多木材、石頭這些基礎材料，能方便地做初級工具；但在洞穴裡出生的智能體，雖然可能有很多礦物，但有黑暗、怪物這些危險，而且得往外探索才能拿到更多種類的東西。

研究人員發現用完整PIANO架構的智能體玩了30分鐘後，平均能拿到17種不同的物品。不過，它們的表現差異很大，這主要是因為出生位置不同。

有些智能體只能拿不到5種物品，而表現最好的智能體能拿到30-40種，這和有一定《我的世界》經驗的人類玩家差不多了。

那麼，單一智能體發展的上限是多少呢？

研究人員發現，在同樣條件下增加智能體數量到49個，讓它們玩4個小時。經過多次試驗，發現所有智能體收集的不同物品數量穩定在《我的世界》所有物品的三分之一（大概320種）。

多智能體

多智能體顧名思義即多個智能體組成的群體，他們在同一環境中可以互相交流或競爭。

小群體：

要讓智能體在群體裡能合作並發展，它們得能理解其他智能體的行動和想法，這種既能理解自己又能理解別人的能力，能讓智能體在社交環境裡根據情況調整自己的行為。

例如和盟友合作的時候建立信任，和對手相處的時候應對競爭和衝突。研究人員透過實驗發現，智能體不僅具有社交能力，並且可以在多達50個智能體的大規模模擬中形成有意義的社會關係。

研究人員主要透過兩組實驗對智能體在群體中的角色和意識進行了研究。

-有社交意識的智能體能否透過聊天推斷別人的情緒呢？

在《我的世界》中的3個角色和智能體的聊天實驗中，可以看到，當遊戲中的角色表達喜愛-生氣-喜愛等情緒變化時，智能體完全能夠理解這些情緒變化並做出相應的反應。

-智能體是否能感知情緒並做出相應行動？

在另一個實驗裡，透過遊戲中的角色對同一智能體的喜歡或討厭程度來推斷智能體的行為，研究人員發現，智能體不僅準確推斷遊戲角色的意圖，並且在決策時通過意圖做出自己的行動。

社會：

隨後，研究人員將50個智能體放在隨機生成的《我的世界》地圖裡，並賦予每個智能體獨特的個性，它們可以在這個世界裡隨意行動，也可以隨意和其他智能體交流。

在這種自由的場景下，研究人員發現智能體不僅能準確判斷其他智能體的角色，而且參與判斷的智能體越多、它們交流時間越長，判斷就越準確。

此外，在這個實驗中，研究人員也發現了幾個重要的現象：

-社交模組的重要性：

如果把社交模組去掉，這時候智能體之間的關係就比較平淡了，這說明社交模組對長期關係的發展（不管是好的還是不好的方向）都很重要。

-個性對社群網路的影響：

研究人員發現，根據個性不同，有些智能體的社交連結模式不一樣。

例如內向的智能體明顯比外向的社交智能體收到的聯繫少，這說明個性在大型複雜社交網絡裡也能體現出來。

而且，雖然大多數時候情緒是相互的，但也不總是這樣。一個智能體可能對另一個不理它的智能體有好感，這和現實世界裡人際關係複雜、不總是相互的情況一樣。

文明誕生了

經過單智能體，到多智能體的進化，接下來，就是文明的誕生了。

為了評估智能體的文明進步能力，研究人員評估了它們在幾種情況下的行為：

– 智能體在集體規則下的行為（著重在稅法的遵守和修訂）

– 透過meme自發性生成，和單一宗教結構化傳播來探索文化傳播

各司其職，專業分工

正是人類的專業化分工推動了文明進步，促進了農業、治理、文化和技術的進步。為了複製這些新興的文明品質，智能體也應具備這些特質。

為此，作者提出了智能體專業化的三個基本標準：

首先，在角色選擇和轉換方面，擁有自主性。其次，它們的專業化應該透過互動和經驗來體現，沒有明確的方向和限制。最後，它們所選擇的角色，應該體現在與其專業一致的行為。

如下圖所示，研究人員把智能體放在一個村莊中，它們會自行發展出不同的職業，例如農民、工程師。

移除社會意識，導致了智能體選擇更多的同質角色，這些角色不會隨著時間而持續下去。

以下是30個智能體在一個村莊中，行為的模擬分佈。

遵守稅法，修改法律

AI智能體可以製定和修改自己的法律嗎。

接下來，研究人員透過實施稅收制度來測試了智能體。結果發現，它們不僅遵守稅法，還會根據公眾情緒民主投票修改稅率。

宗教傳播，鄉鎮不同

最後，AI智能體可以發展出自己的文化嗎？

研究人員具體觀察了meme的有機傳播，並追蹤了智能體如何形成一個虛構的宗教，並透過智能體協會傳播。

比較有趣的是，農村地區與城鎮呈現不同的文化模式。

北大校友創業，打造有同理心AI

之所以開展Project Sid這個項目，是因為Altera AI團隊希望，透過探索這些問題，最終讓數位人無縫整合到人類社會中。

Robert Yang是Altera的共同創辦人兼CEO。

此前，他分別在紐約大學和耶魯大學獲得計算神經科學博士學位，並在北大獲得物理學學士學位。

他曾是MIT腦與認知科學系和電子工程與電腦科學系教授，以及MIT MetaConscious小組負責人。

2023年，他關閉了實驗室並離開了麻省理工學院的終身教職，創立了Altera。

Altera的團隊雖小，但人才密度極高——

由來自麻省理工學院電子工程與電腦科學系、史丹佛自然語言處理小組、Google X、Citadel、Supercell等的計算神經科學家、物理奧林匹克選手和工程師組成。

這家成立半年多的公司，年初就獲得了200萬美金的種子融資，由Andreessen Horowitz領投。

三個月後，又再融資900萬美元，由Google前CEO艾瑞克‧施密特的First Spark Ventures、Patron VC、天使投資人Mitch Lasky等人領投。

今年5月，Altera在Menlo Park設立了分店，並致力於成為第一個智能體消費產品的供應商。