في الآونة الأخيرة، أثارت تجربة المستخدم لروبوت الدردشة الآلي كلود من Anthropic مناقشات ساخنة. ظهر عدد كبير من تعليقات المستخدمين على موقع Reddit، قائلين إن أداء كلود قد انخفض، وتجلى ذلك على وجه التحديد في فقدان الذاكرة وانخفاض القدرة على البرمجة. أثارت هذه الحادثة مناقشات واسعة النطاق حول تقييم الأداء وتجربة المستخدم لنماذج اللغات الكبيرة، وسلطت الضوء مرة أخرى على التحديات التي تواجهها شركات الذكاء الاصطناعي في الحفاظ على استقرار النماذج.
في الآونة الأخيرة، شارك روبوت المحادثة كلود الذي يعمل بالذكاء الاصطناعي التابع لشركة Anthropic مرة أخرى في جدل حول الأداء. منشور على موقع Reddit يدعي أن كلود أصبح أكثر غباءًا قد اجتذب مؤخرًا اهتمامًا واسع النطاق، حيث أفاد العديد من المستخدمين أنهم عانوا من انخفاض في قدرات كلود، بما في ذلك فقدان الذاكرة وانخفاض القدرة على البرمجة.
ردًا على ذلك، رد أليكس ألبرت، المدير التنفيذي لشركة Anthropic، بأن تحقيقات الشركة لم تجد أي مشكلات شائعة وأكد أنه لم يتم إجراء أي تغييرات على نموذج Claude3.5Sonnet أو خط أنابيب الاستدلال. لتحسين الشفافية، نشرت Anthropic مطالبات النظام الخاصة بنموذج كلود على موقعها الرسمي على الإنترنت.
ليست هذه هي المرة الأولى التي أبلغ فيها المستخدمون عن تدهور الذكاء الاصطناعي، وهو ما نفته الشركة. وفي نهاية عام 2023، واجه ChatGPT التابع لشركة OpenAI أيضًا شكوكًا مماثلة. وفقًا للمطلعين على الصناعة، قد تشمل أسباب هذه الظاهرة ما يلي: زيادة توقعات المستخدم بمرور الوقت، والتغيرات الطبيعية في مخرجات الذكاء الاصطناعي، والقيود المؤقتة على موارد الحوسبة، وما إلى ذلك.
ومع ذلك، قد تؤدي هذه العوامل إلى تدهور الأداء المدرك للمستخدم حتى لو لم يخضع النموذج الأساسي لتغييرات كبيرة. أشار OpenAI ذات مرة إلى أن سلوك الذكاء الاصطناعي في حد ذاته لا يمكن التنبؤ به، وأن الحفاظ على أداء الذكاء الاصطناعي التوليدي على نطاق واسع وتقييمه يمثل تحديًا كبيرًا.
قالت Anthropic إنها ستستمر في الاهتمام بتعليقات المستخدمين والعمل الجاد لتحسين استقرار أداء Claude. يسلط الحادث الضوء على التحديات التي تواجهها شركات الذكاء الاصطناعي في الحفاظ على اتساق النماذج، فضلاً عن أهمية زيادة الشفافية في تقييم أداء الذكاء الاصطناعي والتواصل.
يعكس الجدل الدائر حول أداء كلود مدى تعقيد تطوير ونشر نماذج اللغة الكبيرة، فضلاً عن الفجوة بين توقعات المستخدم والتطبيقات الفعلية. في المستقبل، تحتاج شركات الذكاء الاصطناعي إلى زيادة تحسين استقرار النماذج والحفاظ على تواصل أكثر فعالية مع المستخدمين لضمان قدرة تكنولوجيا الذكاء الاصطناعي على الاستمرار في تقديم الخدمات للمستخدمين بشكل موثوق.