أصدر معهد Zhiyuan للأبحاث مجموعة تدريب جديدة لتوليد الأكواد TACO، تهدف إلى تحسين أداء نماذج توليد الأكواد. مجموعة بيانات TACO كبيرة الحجم وعالية الجودة وتوفر إجابات متنوعة لحل المشكلات وعلامات دقيقة، مما يوفر معيارًا أكثر شمولاً للتدريب النموذجي والتقييم. تظهر نتائج التقييم أن هناك فجوة كبيرة بين النماذج السائدة الحالية وGPT-4، وهذا لا يسلط الضوء فقط على دور TACO كمعيار اختبار صعب، ولكنه يشير أيضًا إلى الاتجاه لتحسين نماذج إنشاء التعليمات البرمجية المستقبلية، مما يشير إلى ذلك. أن هذا المجال سوف يستمر في التحسن وهناك إمكانات هائلة للتنمية.
تظهر النتائج التجريبية أن نموذج توليد الكود الشائع حاليًا يختلف بشكل كبير عن GPT-4 في تقييم TACO، مما يشير إلى أنه لا يزال هناك مجال للتحسين في هذا المجال. يوفر إصدار مجموعة بيانات TACO موارد قيمة لتحسين نماذج إنشاء التعليمات البرمجية ويعزز تطوير هذا المجال، وهو يستحق الاهتمام والدراسة المتعمقة من الباحثين.
لقد جلب ظهور TACO فرصًا وتحديات جديدة في مجال إنشاء الأكواد، وستساعد مجموعات البيانات واسعة النطاق وعالية الجودة وحلول التقييم التفصيلية على تعزيز ولادة نماذج أكثر قوة وموثوقية لإنشاء الأكواد. في المستقبل، يمكننا أن نتطلع إلى المزيد من نتائج الأبحاث المستندة إلى TACO لتحسين مستوى تقنية إنشاء التعليمات البرمجية.