يقترح الباحثون في جامعة واشنطن طريقة مبتكرة لضبط الوكيل تعمل على تحسين نماذج اللغة الكبيرة بكفاءة دون الحاجة إلى الوصول إلى أوزان النماذج. تقوم هذه الطريقة بتوجيه تنبؤات النموذج الأساسي نحو النموذج المضبوط من خلال مقارنة تنبؤات النموذج المضبوط الصغير والنموذج غير المضبوط، وبالتالي تحسين أداء النموذج والاحتفاظ بشكل أفضل بالمعرفة التدريبية. تم التحقق من هذه التقنية المتقدمة في تجارب الضبط الدقيق للطرازين الأصليين 13B و70B من LLAMA-2، مما يدل على مزايا كفاءتها الكبيرة.
أفاد موقع Webmaster Home أن جامعة واشنطن أطلقت طريقة ضبط الوكيل التي يمكنها تحقيق ضبط فعال للنماذج الكبيرة دون لمس أوزان النماذج من خلال مقارنة نتائج التنبؤ للنماذج الصغيرة المعدلة والنماذج غير المعدلة. يمكن لهذه الطريقة الاحتفاظ بالمعرفة التدريبية بشكل أفضل أثناء فك التشفير وتحسين كفاءة الضبط. تم التحقق من أداء ضبط العامل من قبل الباحثين الذين قاموا بضبط النماذج الأصلية 13B و70B من LlAMA-2. تعتبر هذه الطريقة طريقة ضبط مبتكرة من خلال مقارنة توزيعات تنبؤ المخرجات للنموذج الأساسي M ونموذج الضبط M+ لتوجيه تنبؤات النموذج الأساسي للتحرك في اتجاه نموذج الضبط. توفر طريقة ضبط الوكيل حلاً لضبط النماذج الكبيرة بكفاءة مع الاحتفاظ بشكل أفضل بالمعرفة التدريبية أثناء فك التشفير، والتي من المتوقع أن تجلب تنويرًا جديدًا إلى مجال الذكاء الاصطناعي.توفر هذه الطريقة الجديدة طريقة أكثر ملاءمة وكفاءة لضبط النماذج الكبيرة، وتقلل من الحاجة إلى التلاعب المباشر بأوزان النماذج، وتحسن بشكل فعال أداء النموذج وقدرات الاحتفاظ بالمعرفة، مما يوفر إمكانيات جديدة لتطوير مجال الذكاء الاصطناعي. وفي المستقبل، من المتوقع أن يتم تطبيق هذه الطريقة في ضبط نماذج اللغة على نطاق أوسع، مما يزيد من تعزيز تقدم تكنولوجيا الذكاء الاصطناعي.