تستكشف النماذج الكبيرة المحلية بشكل نشط طرقًا لتجاوز GPT-4، ومع ذلك، فإن طرق التقييم الحالية لها قيود، مثل تسرب الاختبار وعدم كفاية المصداقية. من أجل توحيد تقييم النماذج الكبيرة وتوفير مرجع أكثر موثوقية لتطوير الصناعة، من الضروري تقييم المستوى الفني للنماذج الكبيرة بشكل موضوعي وعادل. ستناقش هذه المقالة حالة التطوير والتحديات التي تواجه النماذج الكبيرة المحلية.
تستكشف النماذج الكبيرة المحلية طرقًا لتجاوز GPT4، وتكشف طرق التقييم المختلفة عن قدرات النماذج الكبيرة، ولكن هناك تسريبات اختبارية وشكوك في المصداقية. أصدرت الأكاديمية الصينية لتكنولوجيا المعلومات والاتصالات خطة وطنية موحدة لتوفير معيار رسمي وموثوق لتقييم النماذج الكبيرة.
توفر الخطة القياسية الوطنية الصادرة عن الأكاديمية الصينية لتكنولوجيا المعلومات والاتصالات ضمانة مهمة للتنمية الصحية للنماذج الكبيرة المحلية وتمثل خطوة رئيسية في مجال تقييم النماذج الكبيرة في بلدي. في المستقبل، سيستمر نظام التقييم الأكثر اكتمالا في تعزيز التقدم التكنولوجي للنماذج الكبيرة المحلية، وتحقيق المنافسة في نهاية المطاف وتجاوز المستوى المتقدم الدولي.