L'éditeur de Downcodes a appris que des équipes de recherche de l'Université de Stanford, de l'Université de Washington et de Google DeepMind ont développé conjointement un nouveau type d'agent d'IA capable de simuler avec précision le comportement humain et d'obtenir des résultats impressionnants dans les expériences sociales. Cette recherche constitue un outil de laboratoire puissant pour tester la théorie dans les domaines des sciences sociales tels que l’économie, la sociologie, les organisations et les sciences politiques, ouvrant de nouvelles voies pour une compréhension plus approfondie du comportement humain. L’équipe de recherche a utilisé les données d’entretiens de plus de 1 000 électeurs américains et les a combinées avec le modèle GPT-4o pour former un agent d’IA capable de restaurer fortement les réactions humaines. Les résultats et les données de cette recherche ont été rendus publics, constituant une ressource précieuse pour les scientifiques du monde entier.
Récemment, une équipe de recherche de l'Université de Stanford, de l'Université de Washington et de Google DeepMind a développé un nouveau type d'agent d'intelligence artificielle (IA) capable de simuler avec précision le comportement humain dans des expériences sociales. Selon leurs recherches, cette technique de simulation promet de fournir une base de laboratoire pour tester la théorie dans des domaines tels que l'économie, la sociologie, les organisations et les sciences politiques.
Les chercheurs ont construit ces agents IA à partir des données d’entretiens de plus de 1 000 électeurs américains. L'âge, le sexe, la formation et les opinions politiques de ces personnes interrogées représentent la diversité de la société américaine. L'agent IA analyse ces enregistrements d'entretien et utilise le modèle GPT-4o pour reproduire les véritables réactions des personnes interrogées lorsque les utilisateurs posent des questions.
En termes de mise en œuvre spécifique, l'équipe de recherche a mené un entretien approfondi de deux heures pour chaque participant et a utilisé le modèle Whisper d'OpenAI pour convertir le contenu de l'entretien en texte. Cette méthode améliore considérablement la précision des agents IA. Dans un test de prédiction du comportement humain, un agent d’IA basé sur des données d’entretiens a réussi à prédire les réponses humaines à des enquêtes sociales générales avec une précision de 85 %, bien mieux qu’un agent d’IA qui s’appuyait uniquement sur des informations démographiques de base.
Les chercheurs ont également mené cinq expériences en sciences sociales et les résultats ont montré que dans quatre expériences, les résultats produits par les agents d'IA étaient très cohérents avec les réponses des participants humains, avec un coefficient de corrélation de 0,98. Cela suggère que les méthodes basées sur les entretiens démontrent une plus grande précision et un meilleur équilibre dans l’analyse des réponses des différentes idéologies politiques et groupes ethniques.
Pour faciliter les recherches de suivi, l’équipe de recherche a téléchargé l’ensemble de données de 1 000 agents d’IA qu’elle a créés sur GitHub pour qu’ils puissent être utilisés par d’autres scientifiques. Pour protéger la vie privée des participants, l'équipe a adopté un système d'accès à deux niveaux.
Les scientifiques ont libre accès aux données de réponses globales pour certaines tâches, tandis que l’accès aux données de réponses individuelles dans les études ouvertes nécessite des autorisations spéciales. Ce système est conçu pour aider les chercheurs à mieux étudier le comportement humain tout en protégeant la vie privée des participants initiaux aux entretiens.
Entrée du projet : https://github.com/joonspk-research/genagents
L’importance révolutionnaire de cette recherche réside dans sa précision dans la simulation du comportement humain et dans sa contribution potentielle à la recherche en sciences sociales. En rendant l'ensemble de données accessible au public, cette recherche devrait promouvoir davantage de recherches sur le comportement humain et les phénomènes sociaux, offrant ainsi de nouvelles perspectives pour une compréhension et une prévision plus précises du développement social. L'éditeur de Downcodes espère que cette technologie apportera des résultats encore plus surprenants dans le futur.