스탠포드 대학, 워싱턴 대학, 구글 딥마인드 연구팀은 1000명 이상의 미국 유권자 인터뷰 데이터를 사용해 인간 행동을 정확하게 시뮬레이션할 수 있는 AI 에이전트를 개발했습니다. 이러한 AI 에이전트는 GPT-4o 모델을 기반으로 하며 사용자가 질문할 때 응답자의 실제 응답을 재현할 수 있어 경제, 사회학, 조직 및 정치학과 같은 분야의 이론 테스트에 대한 새로운 가능성을 제공합니다. 연구팀은 추가 연구를 촉진하기 위해 1,000명의 AI 에이전트가 포함된 데이터 세트를 GitHub에 공개했으며 참가자의 개인 정보를 보호하기 위해 엄격한 액세스 제어 메커니즘을 사용했습니다. 이 연구는 인간 행동을 이해하고 예측하기 위한 강력하고 새로운 도구를 제공하며 사회과학 연구에 상당한 발전을 가져올 것으로 기대됩니다.
연구원들은 1,000명이 넘는 미국 유권자의 인터뷰 데이터를 사용하여 이러한 AI 에이전트를 구축했습니다. 인터뷰 대상자들의 연령, 성별, 학력, 정치적 견해는 미국 사회의 다양성을 대변합니다. AI 에이전트는 이러한 인터뷰 기록을 분석하고 GPT-4o 모델을 사용해 사용자가 질문을 하면 인터뷰 대상자의 실제 반응을 재현한다.
구체적인 구현 측면에서 연구팀은 참여자별로 2시간 동안 심층 인터뷰를 진행했으며 OpenAI의 Whisper 모델을 사용해 인터뷰 내용을 텍스트로 변환했다. 이 방법은 AI 에이전트의 정확도를 크게 향상시킵니다. 인간 행동 예측 테스트에서 인터뷰 데이터를 기반으로 한 AI 에이전트는 일반적인 사회 조사에 대한 인간의 반응을 85% 정확도로 성공적으로 예측했는데, 이는 기본적인 인구통계 정보에만 의존한 AI 에이전트보다 훨씬 더 나은 결과였습니다.
연구진은 5번의 사회과학 실험도 진행했는데, 그 결과 4번의 실험에서 AI 에이전트가 생성한 결과는 상관계수 0.98로 인간 참여자의 반응과 매우 일치하는 것으로 나타났다. 이는 인터뷰 기반 방법이 다양한 정치적 이념과 인종 집단의 반응 분석에서 더 높은 정확성과 더 나은 균형을 보여준다는 것을 의미합니다.
후속 연구를 촉진하기 위해 연구팀은 다른 과학자들이 사용할 수 있도록 자신이 만든 1,000개의 AI 에이전트 데이터 세트를 GitHub에 업로드했습니다. 참가자의 개인 정보를 보호하기 위해 팀은 2단계 액세스 시스템을 채택했습니다.
과학자들은 특정 작업에 대한 집계된 응답 데이터에 무료로 액세스할 수 있는 반면, 공개 연구의 개별 응답 데이터에 액세스하려면 특별한 권한이 필요합니다. 이 시스템은 원래 인터뷰 참가자의 개인 정보를 보호하면서 연구자가 인간 행동을 더 잘 연구할 수 있도록 설계되었습니다.
프로젝트 입구: https://github.com/joonspk-research/genagents
가장 밝은 부분:
연구팀이 개발한 AI 에이전트는 인터뷰 데이터를 기반으로 인간의 행동을 정확하게 시뮬레이션해 사회과학 연구의 정확도를 높일 수 있다.
사회조사에서 AI 에이전트의 예측 정확도는 85%에 달해 인구통계학적 정보에만 의존한 에이전트보다 월등히 뛰어났다.
데이터세트는 공개적으로 이용 가능하며 GitHub를 통해 다른 연구자들이 접근할 수 있어 참가자의 개인 정보를 보호하는 동시에 인간 행동에 대한 연구를 촉진합니다.
이 연구의 획기적인 결과는 사회과학 연구를 위한 강력하고 새로운 도구를 제공하며 사회과학 분야에서 인공지능을 미래에 적용할 수 있는 길을 제시합니다.