史丹佛大學、華盛頓大學和GoogleDeepMind 的研究團隊,利用超過1,000名美國選民的訪談數據,發展出能夠精確模擬人類行為的AI智能體。這些AI智能體是基於GPT-4o模型,能夠在使用者提問時再現受訪者的真實反應,為經濟學、社會學、組織學和政治學等領域的理論測試提供新的可能性。研究團隊在GitHub上公開了包含1000個AI智能體的資料集,以促進進一步的研究,同時採用了嚴格的存取控制機制來保護參與者的隱私。這項研究為理解和預測人類行為提供了強大的新工具,並有望推動社會科學研究的重大進步。
研究者建構這些AI 智能體的過程中,使用了超過1,000名美國選民的訪談資料。這些受訪者的年齡、性別、教育背景和政治觀點都代表了美國社會的多元性。 AI 智能體透過分析這些訪談記錄,利用GPT-4o 模型,在使用者提問時再現受訪者的真實反應。
在具體實現上,研究團隊為每位參與者進行了兩小時的深度訪談,並使用OpenAI 的Whisper 模型將訪談內容轉換為文字。這項方法大大提高了AI 智能體的準確性。在對人類行為的預測測試中,基於訪談資料的AI智能體以85% 的準確率成功預測了人類在一般社會調查中的回答,表現明顯優於僅依賴基本人口統計資訊的AI 代理。
研究者們也進行了五項社會科學實驗,結果顯示在四項實驗中,AI 智能體所產生的結果與人類參與者的反應高度一致,相關係數達到了0.98。這說明基於訪談的方法在不同政治意識形態和種族群體的回應分析中表現出更高的準確性和更好的平衡性。
為了促進後續研究,研究團隊將其創建的1,000個AI 智能體的資料集上傳至GitHub,供其他科學家使用。為了保護參與者隱私,團隊採用了兩級存取系統。
科學家可以自由獲取某些特定任務的綜合響應數據,而對開放式研究中個別響應數據的存取則需要特殊權限。這個系統旨在保護原始訪談參與者隱私的同時,幫助研究人員更好地研究人類行為。
專案入口:https://github.com/joonspk-research/genagents
劃重點:
研究團隊開發的AI 智能體基於訪談數據,能夠精確模擬人類行為,提升社會科學研究的準確性。
AI 智能體在社會調查中的預測準確率達到85%,明顯優於僅依賴人口統計資訊的智能體。
資料集已公開,其他研究人員可透過GitHub 訪問,促進人類行為研究,同時保護參與者隱私。
這項研究的突破性成果,為社會科學研究提供了一個強大的新工具,也為未來人工智慧在社會科學領域的應用指明了方向,值得關注和進一步探索。