جذبت دراسة حديثة نُشرت في مجلة Scientific Reports الاهتمام، والتي أظهرت أن بعض روبوتات الدردشة المتقدمة المعتمدة على الذكاء الاصطناعي قد تفوقت على البشر في قدرتها على تقييم المواقف الاجتماعية المعقدة. وقام الباحثون بمقارنة عدة روبوتات دردشة تعمل بالذكاء الاصطناعي مع مشاركين بشريين من خلال اختبارات الحكم الظرفي، وأظهرت النتائج أن بعض الذكاء الاصطناعي كان أداؤه أفضل في اختيار أفضل الاستجابات السلوكية، مما يوفر رؤى جديدة حول تطبيق الذكاء الاصطناعي في خدمة العملاء ودعم الصحة العقلية وغيرها من المجالات إمكانيات جديدة. البحث ليس مثاليًا، وهناك حاجة إلى مزيد من الاستكشاف لفهم كيفية أداء الذكاء الاصطناعي في التفاعلات الاجتماعية الحقيقية وكيفية التغلب على قيوده المتمثلة في الافتقار إلى المشاعر الحقيقية.
أظهرت دراسة نُشرت مؤخرًا في مجلة Scientific Reports أن بعض روبوتات الدردشة المتقدمة المعتمدة على الذكاء الاصطناعي يمكن أن تؤدي أداءً أفضل من البشر في تقييم المواقف الاجتماعية المعقدة.
باستخدام أداة نفسية مستخدمة على نطاق واسع تسمى اختبار الحكم الظرفي، وجد الباحثون أن ثلاثة روبوتات دردشة - كلود، ومساعد الطيار من مايكروسوفت، والمساعد الذكي لموقع you.com - تفوقت على البشر في اختيار الاستجابات السلوكية الأكثر فعالية للمشاركين.
ملاحظة لمصدر الصورة: يتم إنشاء الصورة بواسطة الذكاء الاصطناعي وموفر خدمة ترخيص الصورة Midjourney
مع تزايد أهمية التفاعلات الاجتماعية، تستمر إمكانات الذكاء الاصطناعي في التفاعلات الاجتماعية في الظهور، بما في ذلك التطبيقات في مجالات مثل خدمة العملاء ودعم الصحة العقلية. نماذج اللغات الكبيرة، مثل برنامج الدردشة الآلي الذي تم اختباره في هذه الدراسة، قادرة على معالجة اللغة وفهم السياق وتقديم استجابات فعالة. على الرغم من أن الأبحاث السابقة أظهرت قدرات هذه النماذج في التفكير الأكاديمي والمهام اللغوية، إلا أن فعاليتها في الديناميكيات الاجتماعية المعقدة لا تزال غير مستكشفة.
قام فريق البحث باختبار 276 مشاركًا بشريًا، والذين كانوا من المتقدمين الطيارين المؤهلين تأهيلاً عاليًا. استخدمت الدراسة اختبار الحكم الظرفي الذي قدم 12 موقفًا ليتم تقييمها، كل منها يقدم أربعة خيارات سلوكية محتملة. قارن الباحثون أداء خمس روبوتات دردشة تعمل بالذكاء الاصطناعي، ووجدوا أن جميع روبوتات الدردشة التي تم اختبارها كانت تؤدي أداءً جيدًا على الأقل مثل أداء البشر، بل إن بعضها كان أداؤه أفضل. كان أداء كلود هو الأفضل، يليه طيار Microsoft Co والمساعد الذكي لموقع you.com.
ومن المثير للاهتمام أنه عندما لم تختر روبوتات الدردشة الاستجابة الأفضل، فإنها غالبًا ما اختارت الخيار الثاني الأكثر فعالية، مما يظهر أوجه تشابه مع أنماط اتخاذ القرار البشري. وهذا يوضح أنه على الرغم من أن نظام الذكاء الاصطناعي ليس مثاليًا، إلا أنه يتمتع بقدرات معينة في الحكم الاجتماعي والتفكير الاحتمالي.
بالإضافة إلى ذلك، وجدت الأبحاث اختلافات في الموثوقية بين أنظمة الذكاء الاصطناعي المختلفة. يُظهر كلود أعلى مستوى من الاتساق عبر اختبارات متعددة، بينما يمكن أن يحصل Google Gemini على تقييمات متضاربة عبر الاختبارات. ومع ذلك، تجاوز الأداء العام لجميع أنظمة الذكاء الاصطناعي التوقعات، مما يدل على قدرتها على تقديم توصيات تتعلق بالكفاءة الاجتماعية.
لاحظ الباحثون أنه على الرغم من أن العديد من الأشخاص يستخدمون بالفعل برامج الدردشة الآلية في المهام اليومية، إلا أن أدائهم في السيناريوهات المعقدة للتفاعل الاجتماعي لا يزال بحاجة إلى مزيد من التحقق من الصحة. تظهر الأبحاث أن النماذج اللغوية الكبيرة تؤدي أداءً جيدًا في محاكاة المواقف الاجتماعية، لكنها لا تمتلك المشاعر الحقيقية اللازمة للسلوك الاجتماعي الحقيقي.
بشكل عام، يكشف هذا البحث عن الإمكانات الهائلة للذكاء الاصطناعي في المجال الاجتماعي، ولكنه يذكرنا أيضًا أننا بحاجة إلى توخي الحذر بشأن تطبيق الذكاء الاصطناعي في السيناريوهات الاجتماعية الحقيقية، وهناك حاجة إلى مزيد من البحث حول الفهم العاطفي والتفاعل الاجتماعي الحقيقي للذكاء الاصطناعي. القدرات.