Downcodes小编获悉,斯坦福大学、华盛顿大学和谷歌DeepMind的研究团队共同研发了一种新型AI智能体,该智能体能够精准模拟人类行为,并在社会实验中取得令人瞩目的成果。这项研究为经济学、社会学、组织学和政治学等社会科学领域的理论测试提供了强大的实验室工具,为深入理解人类行为提供了新的途径。研究团队利用超过1000名美国选民的访谈数据,并结合GPT-4o模型,训练出了能够高度还原人类反应的AI智能体。此项研究的成果及数据已公开发布,为全球科学家提供了宝贵的资源。
近日,来自斯坦福大学、华盛顿大学和谷歌 DeepMind 的研究团队开发了一种新型的人工智能(AI)智能体,这些智能体可以在社会实验中精准模拟人类行为。根据他们的研究,这种模拟技术有望为经济学、社会学、组织学和政治学等领域的理论测试提供实验室基础。
研究人员构建这些 AI 智能体的过程中,使用了超过1,000名美国选民的访谈数据。这些被访者的年龄、性别、教育背景和政治观点均代表了美国社会的多样性。AI 智能体通过分析这些访谈记录,利用 GPT-4o 模型,在用户提问时再现受访者的真实反应。
在具体实现上,研究团队为每位参与者进行了两小时的深度访谈,并使用 OpenAI 的 Whisper 模型将访谈内容转换为文本。这一方法极大地提高了 AI 智能体的准确性。在对人类行为的预测测试中,基于访谈数据的 AI智能体以85% 的准确率成功预测了人类在一般社会调查中的回答,表现明显优于仅依赖基本人口统计信息的 AI 代理。
研究者们还进行了五项社会科学实验,结果显示在四项实验中,AI 智能体所产生的结果与人类参与者的反应高度一致,相关系数达到了0.98。这说明基于访谈的方法在不同政治意识形态和种族群体的响应分析中表现出更高的准确性和更好的平衡性。
为了促进后续研究,研究团队将其创建的1,000个 AI 智能体的数据集上传至 GitHub,供其他科学家使用。为了保护参与者隐私,团队采用了两级访问系统。
科学家可以自由获取某些特定任务的综合响应数据,而对开放式研究中个体响应数据的访问则需要特殊权限。这一系统旨在在保护原始访谈参与者隐私的同时,帮助研究人员更好地研究人类行为。
项目入口:https://github.com/joonspk-research/genagents
这项研究的突破性意义在于其对人类行为模拟的精准度和对社会科学研究的潜在贡献。通过公开数据集,该研究有望推动更多关于人类行为和社会现象的研究,为更准确地理解和预测社会发展提供新的视角。Downcodes小编期待这项技术在未来能够带来更多令人惊喜的成果。