يستكشف هذا المقال التحيزات العنصرية الضمنية الكامنة في نماذج اللغة، وتحديدًا التمييز ضد اللغة الإنجليزية الأمريكية الأفريقية (AAE). لقد وجدت الأبحاث أنه حتى عند التعبير عن مواقف إيجابية ظاهريًا، فإن النماذج اللغوية في التطبيقات العملية لا تزال تعكس تحيزات ضمنية تتداخل بشكل كبير مع الصور النمطية الأكثر سلبية للماضي، مثل عدم العدالة في مهام العمل والأحكام القضائية. وهذا لا يكشف فقط عن المواقف العنصرية المعقدة للمجتمع البشري التي تنعكس في الخوارزميات، ولكنه يسلط الضوء أيضًا على الحاجة إلى الاهتمام بقضايا التحيز المحتملة ومعالجتها عند تطوير نماذج اللغة وتطبيقها لضمان العدالة التقنية والسلامة.
في عصر التطور التكنولوجي السريع الذي نعيشه اليوم، أصبحت نماذج اللغة أداة لا غنى عنها في حياتنا. ولهذه النماذج تطبيقات تتراوح بين مساعدة المعلمين في تخطيط الدروس، والإجابة على الأسئلة المتعلقة بقوانين الضرائب، والتنبؤ بخطر وفاة المريض قبل خروجه من المستشفى.
ومع ذلك، مع استمرار تزايد أهميتها في عملية صنع القرار، يتعين علينا أيضًا أن نقلق بشأن ما إذا كانت هذه النماذج قد تعكس عن غير قصد التحيزات البشرية الكامنة في بيانات التدريب، وبالتالي تفاقم التمييز ضد الفئات المهمشة على أساس العرق والجنس وغيرها.
في حين كشفت أبحاث الذكاء الاصطناعي المبكرة عن التحيز ضد المجموعات العرقية، فإنها ركزت في المقام الأول على التمييز العنصري الصريح، أي الإشارات المباشرة إلى العرق والقوالب النمطية المقابلة له. مع تطور المجتمع، اقترح علماء الاجتماع مفهومًا جديدًا أكثر سرية للعنصرية يسمى "العنصرية الضمنية". ولم يعد هذا الشكل يتسم بالتمييز العنصري المباشر، بل يرتكز على أيديولوجية عنصرية "عديمة اللون" تتجنب ذكر العرق ولكنها لا تزال تحمل معتقدات سلبية عن الأشخاص الملونين.
هذه الدراسة هي الأولى التي تكشف أن النماذج اللغوية تنقل أيضًا مفهوم العنصرية الضمنية إلى حد ما، خاصة عند الحكم على المتحدثين باللغة الإنجليزية الأمريكية الأفريقية (AAE). AAE هي لهجة مرتبطة ارتباطًا وثيقًا بتاريخ وثقافة الأمريكيين من أصل أفريقي. من خلال تحليل أداء النماذج اللغوية في مواجهة AAE، وجدنا أن هذه النماذج تظهر تمييزًا ضارًا في اللهجة في عملية صنع القرار، وتظهر صورًا نمطية سلبية عن الأمريكيين من أصل أفريقي أكثر من أي صورة نمطية سلبية موثقة.
في سياق بحثنا، استخدمنا طريقة تسمى "تمويه المطابقة" لاستكشاف الاختلافات في أحكام النماذج اللغوية للمتحدثين بلهجات مختلفة من خلال مقارنة نصوص AAE ونصوص اللغة الإنجليزية الأمريكية القياسية (SAE). وفي هذه العملية، وجدنا أن نموذج اللغة لا يحمل صورًا نمطية أكثر إيجابية عن الأمريكيين من أصل أفريقي على السطح فحسب، بل كان لديه أيضًا تحيزات ضمنية عميقة تتداخل بشكل وثيق مع الصور النمطية الأكثر سلبية في الماضي.
على سبيل المثال، عندما طُلب من النماذج مطابقة الوظائف مع الأشخاص الذين يتحدثون لغة AAE، كانوا يميلون إلى تعيين هؤلاء الأشخاص في وظائف ذات مستوى أدنى، على الرغم من عدم إخبارهم بعرقهم. وبالمثل، في حالة افتراضية، عندما طُلب من العارضين الحكم على قاتل شهد باستخدام AAE، كانوا أكثر ميلاً إلى حد كبير إلى تفضيل عقوبة الإعدام.
والأمر الأكثر إثارة للقلق هو أن بعض الممارسات الحالية المصممة للتخفيف من التحيز العنصري، مثل التدريب من خلال ردود الفعل البشرية، تؤدي في الواقع إلى تفاقم الفجوة بين الصور النمطية الضمنية والصريحة، مما يسمح للعنصرية الأساسية بالظهور. يبدو الأمر أقل وضوحًا، لكنه لا يزال موجودًا على مستوى أعمق.
تسلط هذه النتائج الضوء على أهمية الاستخدام العادل والآمن لتقنيات اللغة، خاصة في السياقات التي يمكن أن يكون لها فيها تأثيرات عميقة على حياة الإنسان. على الرغم من أننا اتخذنا خطوات للقضاء على التحيز الصريح، إلا أن نموذج اللغة لا يزال يُظهر تمييزًا عنصريًا ضمنيًا ضد متحدثي AAE من خلال ميزات اللهجة.
وهذا لا يعكس المواقف العنصرية المعقدة في المجتمع البشري فحسب، بل يذكرنا أيضًا بأنه يجب علينا أن نكون أكثر حذرًا وحساسية عند تطوير هذه التقنيات واستخدامها.
المرجع: https://www.nature.com/articles/s41586-024-07856-5
تنبهنا النتائج إلى الحاجة إلى مزيد من البحث حول التحيزات في النماذج اللغوية وتطوير أساليب أكثر فعالية لإزالة التحيز. وبهذه الطريقة فقط يمكننا ضمان قدرة تكنولوجيا الذكاء الاصطناعي على خدمة الجميع بشكل عادل ومنصف وتجنب تفاقم الظلم الاجتماعي.