أصدرت NVIDIA نموذجها اللغوي الجديد واسع النطاق Nemotron-4، وهو نموذج مكون من 15 مليار معلمة يقدم أداءً جيدًا في معايير متعددة، ويتفوق على المنافسين من نفس الحجم. يعتمد النموذج على بنية محولات وحدة فك التشفير النقية القياسية ويتم تدريبه باستخدام مجموعة بيانات متعددة اللغات وترميز تحتوي على 8 تريليون رمز مميز. يغطي أدائها القوي المنطق المنطقي والرياضيات والأكواد والتصنيف والتوليد متعدد اللغات والترجمة الآلية.
أطلق فريق NVIDIA نموذجًا جديدًا يضم 15 مليار معلمة، وهو Nemotron-4، الذي يؤدي أداءً جيدًا في اللغة الإنجليزية، ومهام متعددة اللغات والتشفير، ويتفوق على النماذج ذات حجم المعلمة نفسه في معايير تقييم متعددة. باستخدام بنية محولات وحدة فك التشفير النقية القياسية، تحتوي مجموعة بيانات التدريب على 8 تريليون رمز، تغطي لغات متعددة ونصوصًا مشفرة. يتمتع Nemotron-415B بأداء ممتاز في مجالات المهام المختلفة، بما في ذلك المنطق السليم والرياضيات والترميز والتصنيف والتوليد متعدد اللغات والترجمة الآلية وما إلى ذلك. يعتقد المؤلف أن Nemotron-415B من المتوقع أن يصبح أفضل نموذج كبير للأغراض العامة يمكن تشغيله على وحدة معالجة الرسومات NVIDIA A100 أو H100 واحدة.
يُظهر ظهور Nemotron-4 التقدم التكنولوجي المستمر الذي حققته NVIDIA في مجال نماذج اللغات واسعة النطاق. كما أن مزاياها في تشغيل وحدة معالجة الرسومات الواحدة تجعلها تتمتع بآفاق تطبيقية واسعة، ومن الجدير التطلع إلى مزيد من التطوير والتطبيق في هذا المجال الذكاء الاصطناعي في المستقبل.