スタンフォード大学、ワシントン大学、Google DeepMind の研究チームは、1,000 人を超えるアメリカの有権者からのインタビュー データを使用して、人間の行動を正確にシミュレートできる AI エージェントを開発しました。これらの AI エージェントは GPT-4o モデルに基づいており、ユーザーが質問したときの回答者の実際の応答を再現することができ、経済学、社会学、組織、政治学などの分野での理論テストに新たな可能性をもたらします。研究チームは、参加者のプライバシーを保護するために厳格なアクセス制御メカニズムを採用しながら、さらなる研究を促進するために、1,000 人の AI エージェントを含むデータセットを GitHub で公開しました。この研究は、人間の行動を理解して予測するための強力な新しいツールを提供し、社会科学研究の大幅な進歩を促進することが期待されています。
研究者らは、1,000 人を超える米国の有権者からのインタビュー データを使用してこれらの AI エージェントを構築しました。これらのインタビュー対象者の年齢、性別、学歴、政治的見解は、アメリカ社会の多様性を表しています。 AI エージェントはこれらのインタビュー記録を分析し、GPT-4o モデルを使用して、ユーザーが質問したときのインタビュー対象者の本当の反応を再現します。
具体的な実装に関して、研究チームは各参加者に対して2時間の詳細なインタビューを実施し、OpenAIのWhisperモデルを使用してインタビュー内容をテキストに変換しました。この方法により、AI エージェントの精度が大幅に向上します。人間の行動を予測するテストでは、インタビュー データに基づいた AI エージェントが、一般的な社会調査に対する人間の反応を 85% の精度で予測することに成功しました。これは、基本的な人口統計情報のみに依存した AI エージェントよりも大幅に優れています。
研究者らはまた、5つの社会科学実験を実施し、その結果、4つの実験において、AIエージェントによって生成された結果は人間の参加者の反応と非常に一致しており、相関係数は0.98であったことが示された。これは、インタビューベースの方法が、さまざまな政治イデオロギーや民族グループからの反応の分析において、より高い精度とより優れたバランスを実証していることを示唆しています。
追跡調査を促進するために、研究チームは作成した 1,000 個の AI エージェントのデータ セットを GitHub にアップロードし、他の科学者が使用できるようにしました。参加者のプライバシーを保護するために、チームは 2 層のアクセス システムを採用しました。
科学者は特定のタスクの集計回答データに自由にアクセスできますが、公開研究での個別の回答データにアクセスするには特別な許可が必要です。このシステムは、元のインタビュー参加者のプライバシーを保護しながら、研究者が人間の行動をよりよく研究できるように設計されています。
プロジェクトの入り口: https://github.com/joonspk-research/genagents
ハイライト:
研究チームが開発したAIエージェントはインタビューデータに基づいており、人間の行動を正確にシミュレートし、社会科学研究の精度を向上させることができます。
社会調査における AI エージェントの予測精度は 85% に達し、人口統計情報のみに依存するエージェントよりも大幅に優れていました。
データセットは公開されており、GitHub 経由で他の研究者がアクセスできるため、参加者のプライバシーを保護しながら人間の行動に関する研究が促進されます。
この研究の画期的な結果は、社会科学研究に強力な新しいツールを提供し、社会科学分野における人工知能の将来の応用への道を指し示すものであり、注目とさらなる探求に値します。