El editor de Downcodes se enteró de que equipos de investigación de la Universidad de Stanford, la Universidad de Washington y Google DeepMind desarrollaron conjuntamente un nuevo tipo de agente de inteligencia artificial que puede simular con precisión el comportamiento humano y lograr resultados impresionantes en experimentos sociales. Esta investigación proporciona una poderosa herramienta de laboratorio para probar teorías en campos de las ciencias sociales como la economía, la sociología, las organizaciones y las ciencias políticas, proporcionando nuevas vías para una comprensión más profunda del comportamiento humano. El equipo de investigación utilizó datos de entrevistas de más de 1.000 votantes estadounidenses y los combinó con el modelo GPT-4o para entrenar un agente de inteligencia artificial que puede restaurar en gran medida las reacciones humanas. Los resultados y datos de esta investigación se han hecho públicos, proporcionando un recurso valioso para científicos de todo el mundo.
Recientemente, un equipo de investigación de la Universidad de Stanford, la Universidad de Washington y Google DeepMind desarrolló un nuevo tipo de agente de inteligencia artificial (IA) que puede simular con precisión el comportamiento humano en experimentos sociales. Según su investigación, esta técnica de simulación promete proporcionar una base de laboratorio para comprobar teorías en campos como la economía, la sociología, las organizaciones y las ciencias políticas.
Los investigadores construyeron estos agentes de IA utilizando datos de entrevistas de más de 1.000 votantes estadounidenses. La edad, el género, la formación académica y las opiniones políticas de estos entrevistados representan la diversidad de la sociedad estadounidense. El agente de IA analiza estos registros de entrevistas y utiliza el modelo GPT-4o para reproducir las verdaderas reacciones de los entrevistados cuando los usuarios hacen preguntas.
En términos de implementación específica, el equipo de investigación realizó una entrevista en profundidad de dos horas para cada participante y utilizó el modelo Whisper de OpenAI para convertir el contenido de la entrevista en texto. Este método mejora enormemente la precisión de los agentes de IA. En una prueba de predicción del comportamiento humano, un agente de IA basado en datos de entrevistas predijo con éxito las respuestas humanas a encuestas sociales generales con un 85% de precisión, significativamente mejor que un agente de IA que se basó únicamente en información demográfica básica.
Los investigadores también realizaron cinco experimentos de ciencias sociales y los resultados mostraron que en cuatro experimentos, los resultados producidos por los agentes de IA fueron muy consistentes con las respuestas de los participantes humanos, con un coeficiente de correlación de 0,98. Esto sugiere que los métodos basados en entrevistas demuestran una mayor precisión y un mejor equilibrio en el análisis de las respuestas de diferentes ideologías políticas y grupos étnicos.
Para facilitar la investigación de seguimiento, el equipo de investigación cargó en GitHub el conjunto de datos de 1000 agentes de IA que creó para que lo utilicen otros científicos. Para proteger la privacidad de los participantes, el equipo adoptó un sistema de acceso de dos niveles.
Los científicos tienen acceso gratuito a datos de respuesta agregados para determinadas tareas, mientras que el acceso a datos de respuesta individuales en estudios abiertos requiere permisos especiales. Este sistema está diseñado para ayudar a los investigadores a estudiar mejor el comportamiento humano y al mismo tiempo proteger la privacidad de los participantes de la entrevista original.
Entrada del proyecto: https://github.com/joonspk-research/genagents
La importancia revolucionaria de esta investigación radica en su precisión al simular el comportamiento humano y su contribución potencial a la investigación en ciencias sociales. Al hacer que el conjunto de datos esté disponible públicamente, se espera que esta investigación promueva más investigaciones sobre el comportamiento humano y los fenómenos sociales, proporcionando nuevas perspectivas para comprender y predecir con mayor precisión el desarrollo social. El editor de Downcodes espera que esta tecnología aporte resultados más sorprendentes en el futuro.