Downcodes の編集者は、スタンフォード大学、ワシントン大学、Google DeepMind の研究チームが、人間の行動を正確にシミュレートし、社会実験で印象的な結果を達成できる新しいタイプの AI エージェントを共同開発したことを知りました。この研究は、経済学、社会学、組織、政治学などの社会科学分野の理論を検証するための強力な実験ツールを提供し、人間の行動をより深く理解するための新たな道を提供します。研究チームは、1,000 人を超えるアメリカの有権者からのインタビュー データを使用し、それを GPT-4o モデルと組み合わせて、人間の反応を高度に復元できる AI エージェントをトレーニングしました。この研究の結果とデータは一般に公開されており、世界中の科学者に貴重なリソースを提供しています。
最近、スタンフォード大学、ワシントン大学、Google DeepMindの研究チームは、社会実験において人間の行動を正確にシミュレートできる新しいタイプの人工知能(AI)エージェントを開発した。彼らの研究によると、このシミュレーション技術は、経済学、社会学、組織、政治学などの分野で理論をテストするための実験室基盤を提供することが期待されています。
研究者らは、1,000 人を超える米国の有権者からのインタビュー データを使用してこれらの AI エージェントを構築しました。これらのインタビュー対象者の年齢、性別、学歴、政治的見解は、アメリカ社会の多様性を表しています。 AI エージェントはこれらのインタビュー記録を分析し、GPT-4o モデルを使用して、ユーザーが質問したときのインタビュー対象者の本当の反応を再現します。
具体的な実装に関して、研究チームは各参加者に対して2時間の詳細なインタビューを実施し、OpenAIのWhisperモデルを使用してインタビュー内容をテキストに変換しました。この方法により、AI エージェントの精度が大幅に向上します。人間の行動を予測するテストでは、インタビュー データに基づいた AI エージェントが、一般的な社会調査に対する人間の反応を 85% の精度で予測することに成功しました。これは、基本的な人口統計情報のみに依存した AI エージェントよりも大幅に優れています。
研究者らはまた、5つの社会科学実験を実施し、その結果、4つの実験において、AIエージェントによって生成された結果は人間の参加者の反応と非常に一致しており、相関係数は0.98であったことが示された。これは、インタビューベースの方法が、さまざまな政治イデオロギーや民族グループからの反応の分析において、より高い精度とより優れたバランスを実証していることを示唆しています。
追跡調査を促進するために、研究チームは作成した 1,000 個の AI エージェントのデータ セットを GitHub にアップロードし、他の科学者が使用できるようにしました。参加者のプライバシーを保護するために、チームは 2 層のアクセス システムを採用しました。
科学者は特定のタスクの集計回答データに自由にアクセスできますが、公開研究での個別の回答データにアクセスするには特別な許可が必要です。このシステムは、元のインタビュー参加者のプライバシーを保護しながら、研究者が人間の行動をよりよく研究できるように設計されています。
プロジェクトの入り口: https://github.com/joonspk-research/genagents
この研究の画期的な意義は、人間の行動をシミュレーションする精度と、社会科学研究への潜在的な貢献にあります。この研究はデータセットを一般に公開することで、人間の行動や社会現象に関する研究をさらに促進し、社会の発展をより正確に理解して予測するための新たな視点を提供することが期待されます。 Downcodes の編集者は、このテクノロジーが将来さらに驚くべき結果をもたらすことを楽しみにしています。