أصدرت NVIDIA مؤخرًا أحدث طراز كبير للأغراض العامة Nemotron-4، والذي يحتوي على 15 مليار معلمة ويؤدي أداءً جيدًا في مهام البرمجة واللغات المتعددة. يعتمد Nemotron-4 قانون التوسع الخاص بنموذج Chinchilla وقد حقق اختراقات في تحسين ميزانية الحوسبة والبيانات وحجم النموذج، ويتجاوز أدائه النماذج الأخرى من نفس الحجم، مما يجعله أحد أقوى نماذج اللغات ذات الأغراض العامة حاليًا. الهدف هو أن تكون قادرًا على التشغيل على وحدة معالجة الرسومات A100 أو H100 واحدة، مما يضع معيارًا جديدًا لكفاءة النماذج الكبيرة. يمثل هذا تقدمًا كبيرًا في السعي وراء نماذج كبيرة عالية الأداء.
أصدرت NVIDIA Nemotron-4، وهو نموذج كبير للأغراض العامة يحتوي على 15 مليار معلمة يؤدي أداءً جيدًا في العديد من اللغات ومهام الترميز. يعتمد النموذج قانون القياس لنموذج شينشيلا لتحسين ميزانية الحساب والبيانات وحجم النموذج، متجاوزًا النماذج ذات مقياس المعلمة نفسه ويصبح أقوى نموذج لغة عام. يهدف Nemotron-4 إلى العمل على وحدة معالجة رسومات A100 أو H100 واحدة، مما يضع معيارًا جديدًا في مجال النماذج الكبيرة.
لا يؤدي إصدار Nemotron-4 إلى تحسين أداء النماذج الكبيرة فحسب، بل الأهم من ذلك أن هدفه المتمثل في التشغيل على وحدة معالجة رسومات واحدة يقلل من عتبة استخدام النماذج الكبيرة، ويوفر الراحة لمزيد من المطورين والباحثين، ويبشر بتطبيق النماذج الكبيرة مزيد من التعميم. تعتبر خطوة Nvidia ذات أهمية كبيرة لتعزيز تطوير تكنولوجيا الذكاء الاصطناعي.