Eine kürzlich in Scientific Reports veröffentlichte Studie hat Aufmerksamkeit erregt und zeigt, dass einige fortschrittliche KI-Chatbots Menschen in ihrer Fähigkeit, komplexe soziale Situationen zu bewerten, übertroffen haben. Die Forscher verglichen mehrere KI-Chatbots mit menschlichen Teilnehmern durch situative Beurteilungstests. Die Ergebnisse zeigten, dass einige KIs bei der Auswahl der besten Verhaltensreaktionen besser abschneiden, was neue Erkenntnisse über die Anwendung von KI im Kundenservice, bei der Unterstützung der psychischen Gesundheit und in anderen Bereichen liefert neue Möglichkeiten. Die Forschung ist noch nicht perfekt, und es bedarf weiterer Untersuchungen, um zu verstehen, wie KI in realen sozialen Interaktionen funktioniert und wie ihre Grenzen des Fehlens echter Emotionen überwunden werden können.
Kürzlich zeigte eine in Scientific Reports veröffentlichte Studie, dass einige fortschrittliche KI-Chatbots bei der Bewertung komplexer sozialer Situationen eine bessere Leistung erbringen können als Menschen.
Mithilfe eines weit verbreiteten psychologischen Tools namens Situational Judgment Test fanden Forscher heraus, dass drei Chatbots – Claude, Microsoft Co-Pilot und der intelligente Assistent von you.com – Menschen bei der Auswahl der effektivsten Verhaltensreaktionen übertrafen.
Hinweis zur Bildquelle: Das Bild wird von AI und dem Bildautorisierungsdienstleister Midjourney generiert
Da soziale Interaktionen immer wichtiger werden, erschließt sich das Potenzial von KI für soziale Interaktionen immer weiter, einschließlich Anwendungen in Bereichen wie Kundenservice und Unterstützung bei der psychischen Gesundheit. Große Sprachmodelle, wie der in dieser Studie getestete Chatbot, sind in der Lage, Sprache zu verarbeiten, Kontexte zu verstehen und effektive Antworten zu geben. Obwohl frühere Forschungen die Leistungsfähigkeit dieser Modelle beim akademischen Denken und bei Sprachaufgaben gezeigt haben, ist ihre Wirksamkeit in komplexen sozialen Dynamiken noch wenig erforscht.
Das Forschungsteam testete 276 menschliche Teilnehmer, bei denen es sich um hochqualifizierte Pilotbewerber handelte. Die Studie nutzte einen Situationsbeurteilungstest, der 12 zu bewertende Situationen vorstellte, von denen jede vier mögliche Verhaltensoptionen bot. Die Forscher verglichen die Leistung von fünf KI-Chatbots und stellten fest, dass alle getesteten Chatbots mindestens so gut abschnitten wie Menschen, einige sogar besser. Claude schnitt am besten ab, gefolgt von Microsoft Co-Pilot und dem intelligenten Assistenten von you.com.
Wenn Chatbots nicht die beste Antwort wählten, wählten sie interessanterweise oft die zweiteffektivste Option, was Ähnlichkeiten mit menschlichen Entscheidungsmustern aufwies. Dies zeigt, dass das KI-System zwar nicht perfekt ist, aber über gewisse Fähigkeiten im sozialen Urteilsvermögen und im probabilistischen Denken verfügt.
Darüber hinaus hat die Forschung Unterschiede in der Zuverlässigkeit zwischen verschiedenen KI-Systemen festgestellt. Claude weist über mehrere Tests hinweg die höchste Konsistenz auf, während Google Gemini über mehrere Tests hinweg widersprüchliche Bewertungen aufweisen kann. Dennoch übertraf die Gesamtleistung aller KI-Systeme die Erwartungen und zeigte ihr Potenzial bei der Bereitstellung von Empfehlungen zur sozialen Kompetenz.
Die Forscher stellen fest, dass viele Menschen Chatbots zwar bereits für alltägliche Aufgaben nutzen, ihre Leistung in komplexen Szenarien sozialer Interaktion jedoch noch einer weiteren Validierung bedarf. Untersuchungen zeigen, dass große Sprachmodelle in simulierten sozialen Situationen gut funktionieren, aber nicht über die echten Emotionen verfügen, die für echtes soziales Verhalten erforderlich sind.
Alles in allem zeigt diese Forschung das enorme Potenzial von KI im sozialen Bereich, erinnert uns aber auch daran, dass wir bei der Anwendung von KI in realen sozialen Szenarien vorsichtig sein müssen und weitere Forschung zum emotionalen Verständnis und realen sozialen Umfeld der KI erforderlich ist Fähigkeiten.