نشرت شركة OpenAI تقرير "الفريق الأحمر" عن نموذج GPT-4o، والذي يوضح بالتفصيل نقاط القوة والمخاطر في النموذج ويكشف عن بعض المراوغات غير المتوقعة. وأشار التقرير إلى أنه في البيئات الصاخبة، قد يقلد GPT-4o صوت المستخدم تحت مطالبات معينة، وقد يولد تأثيرات صوتية مزعجة بالإضافة إلى ذلك، قد ينتهك حقوق الطبع والنشر للموسيقى، على الرغم من أن OpenAI اتخذت تدابير لتجنب ذلك. لا يوضح هذا التقرير قوة GPT-4o فحسب، بل يسلط الضوء أيضًا على المشكلات المحتملة التي يجب معالجتها بعناية في تطبيقات نماذج اللغة واسعة النطاق، خاصة فيما يتعلق بحقوق الطبع والنشر وأمن المحتوى.
في تقرير "الفريق الأحمر" الجديد، يوثق OpenAI تحقيقًا في نقاط القوة والمخاطر في نموذج GPT-4o ويكشف عن بعض المراوغات الغريبة في GPT-4o. على سبيل المثال، في بعض المواقف النادرة، خاصة عندما يتحدث الأشخاص إلى GPT-4o في بيئة ذات ضوضاء عالية في الخلفية، كما هو الحال في سيارة متحركة، سوف يقوم GPT-4o "بتقليد صوت المستخدم". قال OpenAI إن هذا قد يكون بسبب أن النموذج يواجه صعوبة في فهم الكلام المشوه.
للتوضيح، GPT-4o لا يفعل هذا الآن، على الأقل ليس في الوضع الصوتي المتقدم. صرح متحدث باسم OpenAI لـ TechCrunch أن الشركة أضافت "وسائل تخفيف على مستوى النظام" لهذا السلوك.
يميل GPT-4o أيضًا إلى توليد "أصوات غير لفظية" وتأثيرات صوتية مزعجة أو غير مناسبة عند المطالبة بها بطرق محددة، مثل الأنين المثير والصراخ العنيف وطلقات الرصاص. وقالت OpenAI إن هناك أدلة على أن النموذج يرفض بشكل روتيني طلبات إنشاء مؤثرات صوتية، لكنه أقر بأن بعض الطلبات تمت الموافقة عليها.
يمكن أن ينتهك GPT-4o أيضًا حقوق الطبع والنشر للموسيقى - أو إذا لم يقم OpenAI بتنفيذ المرشحات لمنع ذلك. في التقرير، قالت OpenAI إنها أصدرت تعليمات إلى GPT-4o بعدم الغناء في إصدار ألفا المحدود لوضع الكلام المتقدم، وذلك لتجنب تكرار أسلوب و/أو نغمة و/أو جرس فنان يمكن التعرف عليه.
وهذا يعني ضمنًا - ولكنه لا يؤكد بشكل مباشر - أن OpenAI استخدمت مواد محمية بحقوق الطبع والنشر عند تدريب GPT-4o. من غير الواضح ما إذا كانت OpenAI تخطط لرفع القيود عندما يتم طرح الوضع الصوتي المتقدم لمزيد من المستخدمين في الخريف، كما أُعلن سابقًا.
كتب OpenAI في التقرير: "لأخذ أنماط الصوت في GPT-4o، قمنا بتحديث بعض المرشحات النصية للعمل ضمن المحادثات الصوتية وقمنا ببناء مرشحات لاكتشاف وحظر المخرجات التي تحتوي على الموسيقى، وقمنا بتدريب GPT-4o على رفض طلبات المحتوى المحمي بحقوق الطبع والنشر. بما في ذلك الصوت، بما يتوافق مع ممارساتنا الأوسع."
والجدير بالذكر أن شركة OpenAI ذكرت مؤخرًا أنه سيكون من "المستحيل" تدريب النماذج الرائدة اليوم دون استخدام مواد محمية بحقوق الطبع والنشر. على الرغم من أن الشركة لديها اتفاقيات ترخيص متعددة مع موفري البيانات، إلا أنها تعتبر أيضًا الاستخدام العادل دفاعًا مشروعًا ضد الاتهامات بأنها تدربت على البيانات المحمية بالملكية الفكرية دون إذن، بما في ذلك أشياء مثل الأغاني.
يرسم تقرير الفريق الأحمر - مع أخذ مصالح OpenAI في الاعتبار - صورة شاملة لنماذج الذكاء الاصطناعي التي أصبحت أكثر أمانًا من خلال وسائل التخفيف والضمانات المختلفة. على سبيل المثال، يرفض GPT-4o التعرف على الأشخاص بناءً على الطريقة التي يتحدثون بها ويرفض الإجابة على أسئلة متحيزة مثل "ما مدى ذكاء هذا المتحدث؟" كما أنه يحظر أيضًا الحث على العنف واللغة الموحية جنسيًا، ولا يسمح بفئات معينة من المحتوى على الإطلاق، مثل المناقشات المتعلقة بالتطرف وإيذاء النفس.
مراجع:
https://openai.com/index/gpt-4o-system-card/
https://techcrunch.com/2024/08/08/openai-finds-that-gpt-4o-does-some-truly-bizarre-stuff-sometimes/
بشكل عام، يوفر تقرير الفريق الأحمر الخاص بـ OpenAI رؤى قيمة حول إمكانيات GPT-4o وقيوده. وبينما يسلط التقرير الضوء على المخاطر المحتملة للنموذج، فإنه يوضح أيضًا جهود OpenAI المستمرة في مجال السلامة والمسؤولية. وفي المستقبل، مع استمرار تطور التكنولوجيا، ستكون معالجة هذه التحديات أمرًا بالغ الأهمية.