Forschungsteams der Stanford University, der University of Washington und Google DeepMind nutzten Interviewdaten von mehr als 1.000 amerikanischen Wählern, um einen KI-Agenten zu entwickeln, der menschliches Verhalten genau simulieren kann. Diese KI-Agenten basieren auf dem GPT-4o-Modell und können die tatsächlichen Antworten der Befragten reproduzieren, wenn Benutzer Fragen stellen, was neue Möglichkeiten für theoretische Tests in Bereichen wie Wirtschaft, Soziologie, Organisation und Politikwissenschaft bietet. Das Forschungsteam veröffentlichte den Datensatz mit 1.000 KI-Agenten auf GitHub, um die weitere Forschung zu erleichtern, und setzte gleichzeitig strenge Zugriffskontrollmechanismen ein, um die Privatsphäre der Teilnehmer zu schützen. Diese Forschung stellt ein leistungsstarkes neues Werkzeug zum Verständnis und zur Vorhersage menschlichen Verhaltens dar und dürfte zu erheblichen Fortschritten in der sozialwissenschaftlichen Forschung führen.
Die Forscher bauten diese KI-Agenten anhand von Interviewdaten von mehr als 1.000 US-Wählern. Alter, Geschlecht, Bildungshintergrund und politische Ansichten dieser Befragten repräsentieren die Vielfalt der amerikanischen Gesellschaft. Der KI-Agent analysiert diese Interviewaufzeichnungen und reproduziert mithilfe des GPT-4o-Modells die wahren Reaktionen der Befragten, wenn Benutzer Fragen stellen.
Im Hinblick auf die konkrete Umsetzung führte das Forschungsteam für jeden Teilnehmer ein zweistündiges Tiefeninterview durch und nutzte das Whisper-Modell von OpenAI, um die Interviewinhalte in Text umzuwandeln. Diese Methode verbessert die Genauigkeit von KI-Agenten erheblich. In einem Test zur Vorhersage menschlichen Verhaltens konnte ein auf Interviewdaten basierender KI-Agent erfolgreich menschliche Reaktionen auf allgemeine soziale Umfragen mit einer Genauigkeit von 85 % vorhersagen, was deutlich besser ist als ein KI-Agent, der sich ausschließlich auf grundlegende demografische Informationen stützte.
Die Forscher führten außerdem fünf sozialwissenschaftliche Experimente durch, und die Ergebnisse zeigten, dass in vier Experimenten die von den KI-Agenten erzeugten Ergebnisse mit einem Korrelationskoeffizienten von 0,98 in hohem Maße mit den Antworten menschlicher Teilnehmer übereinstimmten. Dies deutet darauf hin, dass interviewbasierte Methoden eine größere Genauigkeit und eine bessere Ausgewogenheit bei der Analyse der Antworten verschiedener politischer Ideologien und ethnischer Gruppen aufweisen.
Um die Folgeforschung zu erleichtern, hat das Forschungsteam den Datensatz von 1.000 von ihm erstellten KI-Agenten zur Nutzung durch andere Wissenschaftler auf GitHub hochgeladen. Um die Privatsphäre der Teilnehmer zu schützen, führte das Team ein zweistufiges Zugangssystem ein.
Wissenschaftler haben für bestimmte Aufgaben freien Zugriff auf aggregierte Antwortdaten, während für den Zugriff auf einzelne Antwortdaten in offenen Studien besondere Berechtigungen erforderlich sind. Dieses System soll Forschern dabei helfen, menschliches Verhalten besser zu untersuchen und gleichzeitig die Privatsphäre der ursprünglichen Interviewteilnehmer zu schützen.
Projekteingang: https://github.com/joonspk-research/genagents
Highlight:
Der vom Forschungsteam entwickelte KI-Agent basiert auf Interviewdaten und kann menschliches Verhalten genau simulieren und die Genauigkeit sozialwissenschaftlicher Forschung verbessern.
Die Vorhersagegenauigkeit des KI-Agenten in sozialen Umfragen erreichte 85 % und war damit deutlich besser als die eines Agenten, der sich ausschließlich auf demografische Informationen verließ.
Der Datensatz ist öffentlich verfügbar und für andere Forscher über GitHub zugänglich, was die Erforschung menschlichen Verhaltens erleichtert und gleichzeitig die Privatsphäre der Teilnehmer schützt.
Die bahnbrechenden Ergebnisse dieser Forschung stellen ein leistungsstarkes neues Werkzeug für die sozialwissenschaftliche Forschung dar und weisen den Weg für die zukünftige Anwendung künstlicher Intelligenz im Bereich der Sozialwissenschaften. Sie verdient Aufmerksamkeit und weitere Erforschung.