Scientific Reports に掲載された最近の研究が注目を集めています。この研究は、一部の高度な AI チャットボットが、複雑な社会状況を評価する能力において人間を超えていることを示しています。研究者らは、状況判断テストを通じて複数の AI チャットボットと人間の参加者を比較した結果、一部の AI が最適な行動応答を選択するパフォーマンスが優れていることが示され、顧客サービス、メンタルヘルス サポートなどの分野での AI の応用について新たな洞察が得られました。新たな可能性。この研究は完璧ではなく、実際の社会的相互作用において AI がどのように機能するか、また、現実の感情が欠けているという限界を克服する方法を理解するには、さらなる調査が必要です。
最近、Scientific Reports に掲載された研究では、一部の高度な AI チャットボットが、複雑な社会状況の評価において人間よりも優れたパフォーマンスを発揮できることが示されました。
研究者らは、状況判断テストと呼ばれる広く使用されている心理ツールを使用して、3 つのチャットボット (クロード、マイクロソフトの副操縦士、you.com のインテリジェント アシスタント) が、最も効果的な参加者の行動応答を選択する点で人間よりも優れていることを発見しました。
画像出典注:画像はAIにより生成され、画像認証サービスプロバイダMidjourney
社会的交流の重要性が高まるにつれ、顧客サービスやメンタルヘルスサポートなどの分野での応用を含め、社会的交流における AI の可能性が生まれ続けています。この研究でテストされたチャットボットなどの大規模な言語モデルは、言語を処理し、コンテキストを理解し、効果的な応答を提供することができます。これまでの研究では、学術的推論や言語タスクにおけるこれらのモデルの機能が実証されてきましたが、複雑な社会力学におけるその有効性はまだ解明されていません。
研究チームは、高度な資格を持つパイロット志願者である人間の参加者 276 人をテストしました。この研究では、評価対象となる 12 の状況を提示する状況判断テストが使用され、それぞれの状況で 4 つの潜在的な行動オプションが提供されました。研究者らは 5 つの AI チャットボットのパフォーマンスを比較したところ、テストされたすべてのチャットボットが少なくとも人間と同等のパフォーマンスを発揮し、一部のチャットボットはそれより優れたパフォーマンスを発揮したことさえわかりました。 Claude のパフォーマンスが最も高く、Microsoft Co のパイロットと you.com のスマート アシスタントがそれに続きました。
興味深いことに、チャットボットは最適な応答を選択しなかった場合、2 番目に効果的なオプションを選択することが多く、人間の意思決定パターンとの類似性が示されています。これは、AI システムが完璧ではないものの、社会的判断と確率的推論において一定の能力を備えていることを示しています。
さらに、研究により、異なる AI システム間の信頼性の違いが判明しました。 Claude は複数のテストにわたって最高の一貫性を示していますが、Google Gemini はテスト間で矛盾する評価が得られる可能性があります。それにもかかわらず、すべての AI システムの全体的なパフォーマンスは期待を上回っており、社会的能力に関する推奨事項を提供する可能性を示しています。
研究者らは、多くの人がすでに日常業務でチャットボットを使用しているものの、社会的相互作用の複雑なシナリオにおけるチャットボットのパフォーマンスはまださらなる検証が必要であると指摘しています。研究によると、大規模な言語モデルはシミュレートされた社会的状況ではうまく機能しますが、実際の社会的行動に必要な実際の感情を備えていないことがわかっています。
全体として、この研究は社会分野における AI の大きな可能性を明らかにしていますが、実際の社会シナリオでの AI の適用には注意が必要であること、そして AI の感情理解と実際の社会的状況についてはさらなる研究が必要であることも思い出させます。能力。