Внимание привлекло недавнее исследование, опубликованное в Scientific Reports, которое показывает, что некоторые продвинутые чат-боты с искусственным интеллектом превзошли людей в своей способности оценивать сложные социальные ситуации. Исследователи сравнили несколько чат-ботов с искусственным интеллектом с участниками с помощью ситуационных тестов. Результаты показали, что некоторые ИИ лучше справлялись с выбором лучших поведенческих реакций, что дает новое понимание применения ИИ в обслуживании клиентов, поддержке психического здоровья и других областях. новые возможности. Исследование не является идеальным, и необходимы дальнейшие исследования, чтобы понять, как ИИ работает в реальных социальных взаимодействиях и как преодолеть ограничения, связанные с отсутствием реальных эмоций.
Недавно исследование, опубликованное в журнале Scientific Reports, показало, что некоторые продвинутые чат-боты с искусственным интеллектом могут лучше людей оценивать сложные социальные ситуации.
Используя широко используемый психологический инструмент под названием «Тест на ситуационное суждение», исследователи обнаружили, что три чат-бота — Клод, второй пилот Microsoft и интеллектуальный помощник you.com — превзошли людей в выборе наиболее эффективных поведенческих реакций участников.
Примечание к источнику изображения: изображение генерируется искусственным интеллектом и поставщиком услуг авторизации изображений Midjourney.
Поскольку социальные взаимодействия становятся все более важными, потенциал ИИ в социальных взаимодействиях продолжает проявляться, включая приложения в таких областях, как обслуживание клиентов и поддержка психического здоровья. Большие языковые модели, такие как чат-бот, протестированный в этом исследовании, способны обрабатывать язык, понимать контекст и предоставлять эффективные ответы. Хотя предыдущие исследования продемонстрировали возможности этих моделей в академических рассуждениях и языковых задачах, их эффективность в сложной социальной динамике остается недостаточно изученной.
Исследовательская группа протестировала 276 участников-людей, которые были высококвалифицированными кандидатами на пилотный проект. В исследовании использовался тест на ситуационное суждение, в котором предлагалось оценить 12 ситуаций, каждая из которых предлагала четыре потенциальных варианта поведения. Исследователи сравнили производительность пяти чат-ботов с искусственным интеллектом и обнаружили, что все протестированные чат-боты работали как минимум так же хорошо, как люди, а некоторые даже лучше. Лучше всех выступил Клод, за ним следовал пилот Microsoft Co и умный помощник you.com.
Интересно, что когда чат-боты не выбирали лучший ответ, они часто выбирали второй по эффективности вариант, демонстрируя сходство с человеческими моделями принятия решений. Это показывает, что хотя система ИИ не идеальна, она обладает определенными способностями к социальному суждению и вероятностному рассуждению.
Кроме того, исследования выявили различия в надежности между различными системами ИИ. Клод демонстрирует высочайшую согласованность в нескольких тестах, в то время как Google Gemini может иметь противоречивые оценки в разных тестах. Тем не менее, общая производительность всех систем искусственного интеллекта превзошла ожидания, продемонстрировав их потенциал в предоставлении рекомендаций по социальной компетентности.
Исследователи отмечают, что, хотя многие люди уже используют чат-ботов в повседневных задачах, их эффективность в сложных сценариях социального взаимодействия все еще нуждается в дальнейшей проверке. Исследования показывают, что большие языковые модели хорошо работают в моделируемых социальных ситуациях, но они не обладают реальными эмоциями, необходимыми для реального социального поведения.
В целом, это исследование раскрывает огромный потенциал ИИ в социальной сфере, но оно также напоминает нам, что нам нужно быть осторожными в применении ИИ в реальных социальных сценариях, и необходимы дальнейшие исследования эмоционального понимания ИИ и реальных социальных ситуаций. возможности.