Ha llamado la atención un estudio reciente publicado en Scientific Reports, que muestra que algunos chatbots de IA avanzados han superado a los humanos en su capacidad para evaluar situaciones sociales complejas. Los investigadores compararon varios chatbots de IA con participantes humanos a través de pruebas de juicio situacional. Los resultados mostraron que algunas IA obtuvieron mejores resultados en la selección de las mejores respuestas de comportamiento, lo que proporciona nuevos conocimientos sobre la aplicación de la IA en el servicio al cliente, el apoyo a la salud mental y otros campos. nuevas posibilidades. La investigación no es perfecta y se necesita más exploración para comprender cómo se desempeña la IA en interacciones sociales reales y cómo superar sus limitaciones de falta de emociones reales.
Recientemente, un estudio publicado en Scientific Reports mostró que algunos chatbots avanzados de IA pueden funcionar mejor que los humanos al evaluar situaciones sociales complejas.
Utilizando una herramienta psicológica ampliamente utilizada llamada Prueba de juicio situacional, los investigadores descubrieron que tres chatbots (Claude, Microsoft Co-pilot y el Asistente inteligente de you.com) superaron a los humanos en la selección de las respuestas conductuales más efectivas de los participantes.
Nota sobre la fuente de la imagen: la imagen es generada por IA y el proveedor de servicios de autorización de imágenes Midjourney
A medida que las interacciones sociales se vuelven cada vez más importantes, el potencial de la IA en las interacciones sociales continúa emergiendo, incluidas aplicaciones en áreas como el servicio al cliente y el apoyo a la salud mental. Los modelos de lenguaje grandes, como el chatbot probado en este estudio, son capaces de procesar el lenguaje, comprender el contexto y proporcionar respuestas efectivas. Aunque investigaciones anteriores han demostrado las capacidades de estos modelos en el razonamiento académico y las tareas lingüísticas, su eficacia en dinámicas sociales complejas sigue sin explorarse.
El equipo de investigación probó a 276 participantes humanos, que eran aspirantes a piloto altamente calificados. El estudio utilizó una prueba de juicio situacional que presentó 12 situaciones para ser evaluadas, cada una de las cuales proporcionaba cuatro posibles opciones de comportamiento. Los investigadores compararon el rendimiento de cinco chatbots de IA y descubrieron que todos los chatbots probados funcionaron al menos tan bien como los humanos, y algunos incluso funcionaron mejor. Claude tuvo el mejor desempeño, seguido por el piloto de Microsoft Co y el asistente inteligente de you.com.
Curiosamente, cuando los chatbots no eligieron la mejor respuesta, a menudo eligieron la segunda opción más efectiva, lo que muestra similitudes con los patrones de toma de decisiones humanos. Esto muestra que, aunque el sistema de IA no es perfecto, tiene ciertas habilidades de juicio social y razonamiento probabilístico.
Además, las investigaciones han encontrado diferencias en la confiabilidad entre los diferentes sistemas de IA. Claude muestra la mayor coherencia en múltiples pruebas, mientras que Google Gemini puede tener calificaciones contradictorias entre las pruebas. No obstante, el rendimiento general de todos los sistemas de IA superó las expectativas, lo que demuestra su potencial para proporcionar recomendaciones de competencia social.
Los investigadores señalan que, si bien muchas personas ya utilizan chatbots en sus tareas diarias, su desempeño en escenarios complejos de interacción social aún necesita una mayor validación. Las investigaciones muestran que los modelos de lenguaje grandes funcionan bien en situaciones sociales simuladas, pero no poseen las emociones reales necesarias para el comportamiento social real.
En definitiva, esta investigación revela el enorme potencial de la IA en el campo social, pero también nos recuerda que debemos ser cautelosos con la aplicación de la IA en escenarios sociales reales, y que se necesita más investigación sobre la comprensión emocional y las relaciones sociales reales de la IA. capacidades.