لقد أدى ظهور نماذج اللغات الكبيرة (LLM)، وخاصة الاستخدام الواسع النطاق لتطبيقات مثل ChatGPT، إلى تغيير نموذج التفاعل بين الإنسان والحاسوب بشكل كامل. تُظهر LLM قدرة رائعة على إنشاء نص متماسك وشامل. ومع ذلك، وجد محرر Downcodes أن LLM تعاني أيضًا من مشكلة "الهلوسة"، أي أنها تولد محتوى يبدو حقيقيًا ولكنه وهمي أو لا معنى له أو غير متوافق مع المطالبات. أجرى الباحثون في جامعة هارفارد بحثًا متعمقًا حول هذا الأمر، محاولين الكشف عن أسباب وحلول "وهم" ماجستير إدارة الأعمال.
لقد أدى ظهور نماذج اللغات الكبيرة (LLM)، وخاصة شعبية التطبيقات مثل ChatGPT، إلى تغيير الطريقة التي يتم بها التفاعل بين الإنسان والحاسوب بشكل كامل. إن قدرة النماذج على توليد نص متماسك وشامل أمر مثير للإعجاب. ومع ذلك، على الرغم من قدراتها القوية، إلا أن LLM عرضة لـ "الهلوسة"، أي إنشاء محتوى يبدو حقيقيًا ولكنه في الواقع خيالي أو لا معنى له أو غير متوافق مع المطالبات.
أجرى الباحثون في جامعة هارفارد دراسة متعمقة لظاهرة "الهلوسة" في LLM ووجدوا أن جذورها تكمن في مبدأ عمل LLM. LLM يبني نموذجًا احتماليًا من خلال إجراء التعلم الآلي على بيانات نصية ضخمة، ويتنبأ بالكلمة التالية بناءً على احتمالية حدوث الكلمة بشكل مشترك. بمعنى آخر، LLM لا يفهم حقًا معنى اللغة، ولكنه يقوم بالتنبؤات بناءً على الاحتمالات الإحصائية.
يشبه الباحثون LLM بـ "التعهيد الجماعي" ويعتقدون أن LLM تنتج في الواقع "إجماع الشبكة". تمامًا مثل منصات مثل Wikipedia أو Reddit، تستخرج LLM المعلومات من كميات كبيرة من البيانات النصية وتولد الإجابات الأكثر شيوعًا. وبما أن معظم اللغات تستخدم لوصف العالم، فإن الإجابات التي تولدها LLM عادة ما تكون دقيقة.
ومع ذلك، يمكن أن تحدث "الأوهام" عندما يواجه LLM موضوعات غامضة أو مثيرة للجدل أو تفتقر إلى الإجماع. ولاختبار هذه الفرضية، صمم الباحثون سلسلة من التجارب لاختبار أداء مختلف طلاب ماجستير إدارة الأعمال عند التعامل مع موضوعات مختلفة. تظهر النتائج التجريبية أن LLM يؤدي أداءً جيدًا عند التعامل مع الموضوعات الشائعة، لكن الدقة تنخفض بشكل ملحوظ عند التعامل مع مواضيع غامضة أو مثيرة للجدل.
توضح هذه الدراسة أنه على الرغم من أن LLM هي أداة قوية، إلا أن دقتها تعتمد على جودة وكمية بيانات التدريب. عند استخدام LLM، خاصة عند التعامل مع مواضيع غامضة أو مثيرة للجدل، يجب التعامل مع مخرجاتها بحذر. يوفر هذا البحث أيضًا توجيهات للتطوير المستقبلي لماجستير القانون، وهو الحاجة إلى تحسين قدرة LLM على التعامل مع الموضوعات الغامضة والمثيرة للجدل وتحسين إمكانية تفسير نتائج مخرجاتها.
عنوان الورقة: https://dl.acm.org/doi/pdf/10.1145/3688007
توفر دراسة جامعة هارفارد رؤى قيمة لفهم وتحسين LLM، كما تذكرنا أننا بحاجة إلى استخدام LLM بحذر، خاصة عند التعامل مع موضوعات معقدة أو مثيرة للجدل، ويجب علينا تقييم نتائج مخرجاتها بشكل نقدي. يجب أن يركز اتجاه التطوير المستقبلي لـ LLM على تحسين قدرتها على التعامل مع المعلومات الغامضة وتحسين إمكانية التفسير. يأمل محرر Downcodes أن يؤدي هذا البحث إلى تعزيز تطوير تقنية LLM في اتجاه أكثر موثوقية وجديرة بالثقة.