تظهر أحدث الأبحاث أن نموذج WaveCoder من Microsoft قد حقق اختراقات كبيرة في مهام إنشاء التعليمات البرمجية. قام فريق البحث بإنشاء بيانات تعليمية عالية الجودة ومتنوعة بشكل فعال للتدريب النموذجي من خلال الضبط الدقيق للتعليمات المكثفة واستخدام مجموعة بيانات CodeOcean لبناء إطار عمل لتمييز المولدات قائم على LLM. توضح هذه الدراسة تفاصيل العملية الكاملة بدءًا من التعليمات البرمجية الأصلية وحتى تدريب النماذج النهائية، حيث تقدم أفكارًا وطرقًا جديدة لتحسين أداء نماذج اللغات الكبيرة القائمة على التعليمات البرمجية.
تشير أحدث الأبحاث إلى أن نموذج Microsoft WaveCoder يؤدي أداءً جيدًا في مهام البرمجة المختلفة من خلال ضبط التعليمات الشامل. تقدم الدراسة مجموعة بيانات CodeOcean وتقترح إطارًا للتمييز المولد استنادًا إلى LLM لإنشاء بيانات تعليمية متنوعة عالية الجودة. يتفوق نموذج WaveCoder على النماذج الأخرى في مختلف المهام مما يؤكد كفاءته. تفاصيل الدراسة العملية برمتها من الكود الأصلي إلى النموذج المدرّب وتسلط الضوء على المساهمة المهمة للطريقة المقترحة في تحسين أداء الكود LLM.
يثبت نجاح نموذج WaveCoder فعالية إطار تمييز المولد القائم على LLM واستراتيجيات ضبط التعليمات الشاملة في تحسين أداء نماذج اللغة واسعة النطاق في التعليمات البرمجية. يوفر هذا البحث رؤى قيمة لتحسين نموذج إنشاء التعليمات البرمجية في المستقبل ويبشر أيضًا بمواصلة تطوير وتطبيق تكنولوجيا إنشاء التعليمات البرمجية.