Downcodes의 편집자는 스탠포드 대학, 워싱턴 대학 및 Google DeepMind의 연구팀이 인간 행동을 정확하게 시뮬레이션하고 사회 실험에서 인상적인 결과를 얻을 수 있는 새로운 유형의 AI 에이전트를 공동 개발했다는 사실을 알게 되었습니다. 이 연구는 경제학, 사회학, 조직학, 정치학 등 사회과학 분야의 이론 테스트를 위한 강력한 실험실 도구를 제공하여 인간 행동에 대한 더 깊은 이해를 위한 새로운 길을 제공합니다. 연구팀은 1000명 이상의 미국 유권자 인터뷰 데이터를 활용해 GPT-4o 모델과 결합해 인간의 반응을 고도로 복원할 수 있는 AI 에이전트를 훈련시켰다. 본 연구의 결과와 데이터는 공개되어 전 세계 과학자들에게 귀중한 자원을 제공합니다.
최근 스탠포드대, 워싱턴대, 구글 딥마인드 연구팀은 사회적 실험에서 인간의 행동을 정확하게 시뮬레이션할 수 있는 새로운 유형의 인공지능(AI) 에이전트를 개발했습니다. 그들의 연구에 따르면, 이 시뮬레이션 기술은 경제학, 사회학, 조직, 정치학과 같은 분야의 이론 테스트를 위한 실험실 기반을 제공할 것을 약속합니다.
연구원들은 1,000명이 넘는 미국 유권자의 인터뷰 데이터를 사용하여 이러한 AI 에이전트를 구축했습니다. 인터뷰 대상자들의 연령, 성별, 학력, 정치적 견해는 미국 사회의 다양성을 대변합니다. AI 에이전트는 이러한 인터뷰 기록을 분석하고 GPT-4o 모델을 사용해 사용자가 질문을 하면 인터뷰 대상자의 실제 반응을 재현한다.
구체적인 구현 측면에서 연구팀은 참여자별로 2시간 동안 심층 인터뷰를 진행했으며 OpenAI의 Whisper 모델을 사용해 인터뷰 내용을 텍스트로 변환했다. 이 방법은 AI 에이전트의 정확도를 크게 향상시킵니다. 인간 행동 예측 테스트에서 인터뷰 데이터를 기반으로 한 AI 에이전트는 일반적인 사회 조사에 대한 인간의 반응을 85% 정확도로 성공적으로 예측했는데, 이는 기본적인 인구통계 정보에만 의존한 AI 에이전트보다 훨씬 더 나은 결과였습니다.
연구진은 5번의 사회과학 실험도 진행했는데, 그 결과 4번의 실험에서 AI 에이전트가 생성한 결과는 상관계수 0.98로 인간 참여자의 반응과 매우 일치하는 것으로 나타났다. 이는 인터뷰 기반 방법이 다양한 정치적 이념과 인종 집단의 반응 분석에서 더 높은 정확성과 더 나은 균형을 보여준다는 것을 의미합니다.
후속 연구를 촉진하기 위해 연구팀은 다른 과학자들이 사용할 수 있도록 자신이 만든 1,000개의 AI 에이전트 데이터 세트를 GitHub에 업로드했습니다. 참가자의 개인 정보를 보호하기 위해 팀은 2단계 액세스 시스템을 채택했습니다.
과학자들은 특정 작업에 대한 집계된 응답 데이터에 무료로 액세스할 수 있는 반면, 공개 연구의 개별 응답 데이터에 액세스하려면 특별한 권한이 필요합니다. 이 시스템은 원래 인터뷰 참가자의 개인 정보를 보호하면서 연구자가 인간 행동을 더 잘 연구할 수 있도록 설계되었습니다.
프로젝트 입구: https://github.com/joonspk-research/genagents
이 연구의 획기적인 중요성은 인간 행동을 시뮬레이션하는 정확성과 사회과학 연구에 대한 잠재적인 기여에 있습니다. 본 연구는 데이터 세트를 공개함으로써 인간 행동과 사회 현상에 대한 더 많은 연구를 촉진하고, 사회 발전을 보다 정확하게 이해하고 예측할 수 있는 새로운 관점을 제시할 것으로 기대됩니다. 다운코드 편집자는 이 기술이 앞으로 더욱 놀라운 결과를 가져올 것으로 기대하고 있습니다.