في الآونة الأخيرة، أثار ميسترال، وهو نموذج محلي واسع النطاق أصدرته جامعة تسينغهوا، ردود فعل حماسية على GitHub، ويتميز حجمه 2B بأداء يفوق العديد من النماذج "واسعة النطاق"، وهو أمر مذهل. لا ينعكس هذا في أدائها القوي فحسب، بل ينعكس أيضًا في ميزة التكلفة المنخفضة للغاية: يمكن الحصول على تكلفة الاستدلال البالغة 1,700,000 رمز باستخدام يوان واحد فقط، وهو أقل بكثير من المنتجات المماثلة. بالإضافة إلى ذلك، تتمتع ميسترال أيضًا بقدرات متعددة الوسائط، مما يُظهر إمكانات تطبيقية قوية. تثبت هذه الحادثة مرة أخرى أنه في مجال الذكاء الاصطناعي، يعد تصميم النماذج الممتازة والتحكم في التكاليف أمرًا بالغ الأهمية بنفس القدر، وليس مجرد "الحجم هو الملك".
تركز المقالة على:
في الآونة الأخيرة، أصدرت إدارة جامعة تسينغهوا ميسترال منتجة محليًا. وقد تلقى هذا النموذج الكبير، الذي يبلغ حجمه 2 مليار فقط، ترحيبًا حارًا بشكل غير متوقع على GitHub وحصل على أكثر من 300 نجمة في يوم واحد. من حيث الأداء، هذا المنتج تنافسي للغاية. هناك تناقض كبير بين الأداء والحجم، وقد تجاوز العديد من النماذج الكبيرة "كبيرة الحجم" السائدة في العديد من الإنجازات. إن جانب التكلفة أكثر إثارة للدهشة، إذ لا يكلف سوى يوان واحد للحصول على 1,700,000 رمز بتكلفة الاستدلال، مقارنة بالمنتجات المماثلة، والتكلفة أقل بكثير. بالإضافة إلى الميزات المذكورة أعلاه، يتمتع المنتج أيضًا بقدرات متعددة الوسائط ويعرض نتائج ممتازة.
يوضح نجاح ميسترال الاختراق في أداء وتكلفة النماذج الكبيرة المحلية، كما يقدم أفكارًا جديدة لاتجاه تطوير النماذج الكبيرة في المستقبل. وأعتقد أننا سنشهد في المستقبل ظهور المزيد من المفاجآت المماثلة، مما يعزز التقدم المستمر لتكنولوجيا الذكاء الاصطناعي.