Downcodes小編獲悉,史丹佛大學、華盛頓大學和GoogleDeepMind的研究團隊共同研發了一種新型AI智能體,該智能體能夠精準模擬人類行為,並在社會實驗中取得令人矚目的成果。這項研究為經濟學、社會學、組織學和政治學等社會科學領域的理論測試提供了強大的實驗室工具,為深入理解人類行為提供了新的途徑。研究團隊利用超過1000名美國選民的訪談數據,並結合GPT-4o模型,訓練出了能夠高度還原人類反應的AI智能體。此項研究的成果及數據已公開發布,為全球科學家提供了寶貴的資源。
近日,來自史丹佛大學、華盛頓大學和GoogleDeepMind 的研究團隊開發了一種新型的人工智慧(AI)智能體,這些智能體可以在社會實驗中精準模擬人類行為。根據他們的研究,這種模擬技術有望為經濟學、社會學、組織學和政治學等領域的理論測試提供實驗室基礎。
研究者建構這些AI 智能體的過程中,使用了超過1,000名美國選民的訪談資料。這些受訪者的年齡、性別、教育背景和政治觀點都代表了美國社會的多元性。 AI 智能體透過分析這些訪談記錄,利用GPT-4o 模型,在使用者提問時再現受訪者的真實反應。
在具體實現上,研究團隊為每位參與者進行了兩小時的深度訪談,並使用OpenAI 的Whisper 模型將訪談內容轉換為文字。這項方法大大提高了AI 智能體的準確性。在對人類行為的預測測試中,基於訪談資料的AI智能體以85% 的準確率成功預測了人類在一般社會調查中的回答,表現明顯優於僅依賴基本人口統計資訊的AI 代理。
研究者們也進行了五項社會科學實驗,結果顯示在四項實驗中,AI 智能體所產生的結果與人類參與者的反應高度一致,相關係數達到了0.98。這說明基於訪談的方法在不同政治意識形態和種族群體的回應分析中表現出更高的準確性和更好的平衡性。
為了促進後續研究,研究團隊將其創建的1,000個AI 智能體的資料集上傳至GitHub,供其他科學家使用。為了保護參與者隱私,團隊採用了兩級存取系統。
科學家可以自由獲取某些特定任務的綜合響應數據,而對開放式研究中個別響應數據的存取則需要特殊權限。這個系統旨在保護原始訪談參與者隱私的同時,幫助研究人員更好地研究人類行為。
專案入口:https://github.com/joonspk-research/genagents
這項研究的突破性意義在於其對人類行為模擬的精確度和對社會科學研究的潛在貢獻。透過公開資料集,該研究有望推動更多關於人類行為和社會現象的研究,為更準確地理解和預測社會發展提供新的視角。 Downcodes小編期待這項技術在未來能帶來更多令人驚喜的成果。