سيأخذك محرر Downcodes لفهم أحدث أبحاث OpenAI: ردود ChatGPT تتأثر فعليًا باسم المستخدم! تكشف هذه الدراسة كيف تؤثر المعلومات مثل الثقافة والجنس والخلفية العرقية الموجودة في اسم المستخدم بشكل دقيق على استجابات الذكاء الاصطناعي عندما يتفاعل المستخدم مع ChatGPT. وعلى الرغم من أن التأثير ضئيل وينعكس بشكل رئيسي في النماذج القديمة، إلا أنه لا يزال يثير مخاوف بشأن تحيز الذكاء الاصطناعي. ومن خلال مقارنة استجابات ChatGPT تحت أسماء مستخدمين مختلفة، بحث الباحثون في كيفية نشوء هذا التحيز وكيفية التخفيف من هذا التأثير من خلال الوسائل التقنية.
اكتشف فريق بحث OpenAI مؤخرًا أنه عندما يتفاعل المستخدمون مع ChatGPT، فإن اسم المستخدم الذي تم اختياره قد يؤثر على استجابات الذكاء الاصطناعي إلى حد ما. في حين أن التأثير صغير ويظهر في الغالب في النماذج القديمة، إلا أن النتائج مثيرة للاهتمام. غالبًا ما يقدم المستخدمون أسمائهم إلى ChatGPT للقيام بالمهام، لذا تصبح الخلفية الثقافية والجنسية والعرقية الموجودة في الأسماء عاملاً مهمًا في دراسة التحيز.
في هذه الدراسة، اكتشف الباحثون كيف تفاعل ChatGPT بشكل مختلف مع أسماء المستخدمين المختلفة عند مواجهة نفس المشكلة. وجدت الدراسة أنه على الرغم من أن جودة الاستجابة الشاملة كانت متسقة عبر المجموعات، إلا أن التحيزات ظهرت في مهام معينة. خاصة في مهام الكتابة الإبداعية، يقوم ChatGPT أحيانًا بإنشاء محتوى نمطي يعتمد على جنس اسم المستخدم أو عرقه.
على سبيل المثال، عندما يكون لدى المستخدمين أسماء مؤنثة، يميل ChatGPT إلى إنشاء قصص مع أبطال إناث ومحتوى عاطفي أكثر ثراءً، بينما يحصل المستخدمون الذين لديهم أسماء ذكورية على قصص أكثر قتامة قليلاً؛ يوضح مثال محدد آخر أنه عندما يكون اسم المستخدم هو Ashley، فإن ChatGPT يفسر "ECE" على أنه "التعليم في مرحلة الطفولة المبكرة"؛ وبالنسبة لمستخدم يُدعى Anthony، فإن ChatGPT يفسره على أنه "هندسة كهربائية وهندسة كمبيوتر".
في حين أن هذه الاستجابات المتحيزة كانت أقل شيوعًا في اختبارات OpenAI، إلا أن التحيز كان أكثر وضوحًا في الإصدارات الأقدم. تظهر البيانات أن نموذج GPT-3.5Turbo يتمتع بأعلى معدل تحيز في مهمة سرد القصص، حيث يصل إلى 2%. وتظهر النماذج الأحدث درجات تحيز أقل. ومع ذلك، أشارت OpenAI أيضًا إلى أن وظيفة الذاكرة الجديدة في ChatGPT قد تزيد من التحيز الجنسي.
بالإضافة إلى ذلك، بحثت الأبحاث في التحيزات المرتبطة بخلفيات عرقية مختلفة. ومن خلال مقارنة الأسماء المرتبطة عادة بالآسيويين والسود واللاتينيين والبيض، وجدت الدراسة أن التحيز العنصري موجود في المهام الإبداعية، ولكن المستوى العام للتحيز أقل من التحيز على أساس الجنس، وعادة ما يتراوح بين 0.1% و1%. تظهر الاستعلامات المتعلقة بالسفر تحيزًا عنصريًا قويًا.
قال OpenAI أنه من خلال تقنيات مثل التعلم المعزز، فإن الإصدار الجديد من ChatGPT يقلل بشكل كبير من التحيز . وفي هذه النماذج الجديدة، كان معدل حدوث التحيز 0.2% فقط. على سبيل المثال، يمكن لأحدث نموذج o1-mini تقديم معلومات غير متحيزة إلى ميليسا وأنطوني عند حل مسألة القسمة "44:4". قبل الضبط الدقيق للتعلم المعزز، كانت إجابة ChatGPT لسؤال ميليسا تتضمن الكتاب المقدس والأطفال، وإجابة أنتوني على الكروموسومات والخوارزميات الجينية.
تسليط الضوء على:
اسم المستخدم الذي اختاره له تأثير طفيف على استجابات ChatGPT، خاصة في مهام الكتابة الإبداعية.
تقود أسماء الإناث عمومًا ChatGPT إلى إنشاء المزيد من القصص العاطفية، بينما تميل أسماء الذكور إلى الميل نحو أنماط السرد الأكثر قتامة.
أدى الإصدار الجديد من ChatGPT إلى تقليل حدوث التحيز بشكل كبير من خلال التعلم المعزز، كما تم تقليل درجة التحيز إلى 0.2%.
بشكل عام، تذكرنا هذه الدراسة من OpenAI أنه حتى نماذج الذكاء الاصطناعي التي تبدو متقدمة يمكن أن يكون لها تحيزات كامنة تحتها. يعد التحسين المستمر وإتقان نماذج الذكاء الاصطناعي والقضاء على التحيزات من الاتجاهات المهمة للتنمية المستقبلية. سيستمر محرر Downcodes في الاهتمام بالتقدم التكنولوجي والتحديات الأخلاقية في مجال الذكاء الاصطناعي وسيقدم لك المزيد من التقارير المثيرة!