斯坦福大学、华盛顿大学和谷歌 DeepMind 的研究团队,利用超过1000名美国选民的访谈数据,开发出能够精准模拟人类行为的AI智能体。这些AI智能体基于GPT-4o模型,能够在用户提问时再现受访者的真实反应,为经济学、社会学、组织学和政治学等领域的理论测试提供新的可能性。研究团队在GitHub上公开了包含1000个AI智能体的数据集,以促进进一步的研究,同时采用了严格的访问控制机制来保护参与者的隐私。这项研究为理解和预测人类行为提供了强大的新工具,并有望推动社会科学研究的重大进步。
研究人员构建这些 AI 智能体的过程中,使用了超过1,000名美国选民的访谈数据。这些被访者的年龄、性别、教育背景和政治观点均代表了美国社会的多样性。AI 智能体通过分析这些访谈记录,利用 GPT-4o 模型,在用户提问时再现受访者的真实反应。
在具体实现上,研究团队为每位参与者进行了两小时的深度访谈,并使用 OpenAI 的 Whisper 模型将访谈内容转换为文本。这一方法极大地提高了 AI 智能体的准确性。在对人类行为的预测测试中,基于访谈数据的 AI智能体以85% 的准确率成功预测了人类在一般社会调查中的回答,表现明显优于仅依赖基本人口统计信息的 AI 代理。
研究者们还进行了五项社会科学实验,结果显示在四项实验中,AI 智能体所产生的结果与人类参与者的反应高度一致,相关系数达到了0.98。这说明基于访谈的方法在不同政治意识形态和种族群体的响应分析中表现出更高的准确性和更好的平衡性。
为了促进后续研究,研究团队将其创建的1,000个 AI 智能体的数据集上传至 GitHub,供其他科学家使用。为了保护参与者隐私,团队采用了两级访问系统。
科学家可以自由获取某些特定任务的综合响应数据,而对开放式研究中个体响应数据的访问则需要特殊权限。这一系统旨在在保护原始访谈参与者隐私的同时,帮助研究人员更好地研究人类行为。
项目入口:https://github.com/joonspk-research/genagents
划重点:
研究团队开发的 AI 智能体基于访谈数据,能够准确模拟人类行为,提升社会科学研究的准确性。
AI 智能体在社会调查中的预测准确率达到85%,明显优于仅依赖人口统计信息的智能体。
数据集已公开,其他研究人员可通过 GitHub 访问,促进人类行为研究,同时保护参与者隐私。
这项研究的突破性成果,为社会科学研究提供了一个强大的新工具,也为未来人工智能在社会科学领域的应用指明了方向,值得关注和进一步探索。