Um estudo recente publicado na Scientific Reports atraiu a atenção, mostrando que alguns chatbots avançados de IA ultrapassaram os humanos na capacidade de avaliar situações sociais complexas. Os pesquisadores compararam vários chatbots de IA com participantes humanos por meio de testes de julgamento situacional. Os resultados mostraram que algumas IAs tiveram melhor desempenho na seleção das melhores respostas comportamentais, o que fornece novos insights sobre a aplicação da IA no atendimento ao cliente, suporte de saúde mental e outras áreas. novas possibilidades. A investigação não é perfeita e é necessária uma exploração mais aprofundada para compreender como a IA funciona em interações sociais reais e como superar as suas limitações de falta de emoções reais.
Recentemente, um estudo publicado na Scientific Reports mostrou que alguns chatbots avançados de IA podem ter um desempenho melhor do que os humanos na avaliação de situações sociais complexas.
Usando uma ferramenta psicológica amplamente utilizada chamada Teste de Julgamento Situacional, os pesquisadores descobriram que três chatbots – Claude, Microsoft Co-pilot e o Assistente Inteligente do you.com – superaram os humanos na seleção das respostas comportamentais mais eficazes.
Nota sobre a fonte da imagem: a imagem é gerada pela IA e pelo provedor de serviços de autorização de imagem Midjourney
À medida que as interações sociais se tornam cada vez mais importantes, o potencial da IA nas interações sociais continua a emergir, incluindo aplicações em áreas como o atendimento ao cliente e o apoio à saúde mental. Grandes modelos de linguagem, como o chatbot testado neste estudo, são capazes de processar a linguagem, compreender o contexto e fornecer respostas eficazes. Embora investigações anteriores tenham demonstrado as capacidades destes modelos no raciocínio académico e nas tarefas linguísticas, a sua eficácia em dinâmicas sociais complexas permanece pouco explorada.
A equipe de pesquisa testou 276 participantes humanos, candidatos a pilotos altamente qualificados. O estudo utilizou um teste de julgamento situacional que apresentou 12 situações a serem avaliadas, cada uma fornecendo quatro possíveis opções comportamentais. Os pesquisadores compararam o desempenho de cinco chatbots de IA e descobriram que todos os chatbots testados tiveram um desempenho pelo menos tão bom quanto os humanos, e alguns até tiveram um desempenho melhor. Claude teve o melhor desempenho, seguido pelo piloto da Microsoft Co e pelo assistente inteligente do you.com.
Curiosamente, quando os chatbots não escolhem a melhor resposta, muitas vezes escolhem a segunda opção mais eficaz, mostrando semelhanças com os padrões humanos de tomada de decisão. Isso mostra que embora o sistema de IA não seja perfeito, ele possui certas habilidades de julgamento social e raciocínio probabilístico.
Além disso, a investigação encontrou diferenças na fiabilidade entre diferentes sistemas de IA. Claude mostra a maior consistência em vários testes, enquanto o Google Gemini pode ter classificações conflitantes em todos os testes. No entanto, o desempenho global de todos os sistemas de IA excedeu as expectativas, demonstrando o seu potencial no fornecimento de recomendações de competências sociais.
Os investigadores observam que embora muitas pessoas já utilizem chatbots em tarefas diárias, o seu desempenho em cenários complexos de interação social ainda necessita de maior validação. A pesquisa mostra que grandes modelos de linguagem funcionam bem em situações sociais simuladas, mas não possuem as emoções reais necessárias para um comportamento social real.
Em suma, esta investigação revela o enorme potencial da IA no campo social, mas também nos lembra que precisamos de ser cautelosos sobre a aplicação da IA em cenários sociais reais, e são necessárias mais pesquisas sobre a compreensão emocional e as relações sociais reais da IA. capacidades.