أصدرت NVIDIA مؤخرًا منصة Blackwell الجديدة وأظهرت تحسينات رائعة في الأداء في MLPERF Training 4.1. بالمقارنة مع منصات النطاط السابقة ، ضاعفت Blackwell أدائها في مهام التدريب المتعددة AI ، وخاصة في تدريب نموذج اللغة الكبير (LLM) ، وقد تم تحسين كفاءتها بشكل كبير. يشير هذا التقدم الذي تقدمه إلى قفزة أخرى في قوة الحوسبة الذكاء الاصطناعى وتضع أساسًا متينًا للتنفيذ الواسع النطاق لتطبيقات الذكاء الاصطناعي في المستقبل. ستجري هذه المقالة تحليلًا متعمقًا لأداء منصة Blackwell ومناقشة الابتكار التكنولوجي والتطوير المستقبلي.
في الآونة الأخيرة ، أصدرت Nvidia منصة Blackwell الجديدة وأظهرت الأداء الأولي في معيار تدريب MLPERF 4.1. وفقًا لنتائج الاختبار ، تضاعف أداء Blackwell في بعض الجوانب مقارنة بالجيل السابق من منصات النطاط ، وقد اجتذب هذا الإنجاز اهتمامًا واسعًا من الصناعة.
في مؤشر تدريب MLPERF4.1 ، حققت منصة Blackwell 2.2 أضعاف أداء كل وحدة معالجة الرسومات في مهمة صقل LLAMA270B لقياس LLM (نموذج اللغة الكبير) ، و 2 أضعاف أداء كل وحدة معالجة الرسومات في فترة ما قبل التدريب GPT-3175B ضعف التحسن. بالإضافة إلى ذلك ، في معايير أخرى مثل التدريب المستقر Diffusion V2 ، تجاوز الجيل الجديد من Blackwell أيضًا الجيل السابق بمقدار 1.7 مرة.
تجدر الإشارة إلى أنه على الرغم من استمرار Hopper في إظهار التحسينات ، فإن Hopper لديه أيضًا تحسن في الأداء 1.3x في تدريب نموذج اللغة قبل الجولة السابقة من معايير التدريب MLPERF. هذا يدل على أن تقنية NVIDIA تستمر في التحسن. في مؤشر GPT-3175B الأخير ، قدمت NVIDIA 11،616 من وحدات معالجة الرسومات Hopper ، مسجلاً سجلًا جديدًا للتوسع.
فيما يتعلق بالتفاصيل الفنية لبلاكويل ، قالت NVIDIA إن الهندسة المعمارية الجديدة تستخدم نوى موترات محسنة وذاكرة عرض النطاق الترددي العالي الأسرع. هذا يجعل من 64 وحدات معالجة الرسومات فقط تشغيل معيار GPT-3175B ، في حين أن 256 وحدات معالجة الرسومات لتحقيق نفس الأداء باستخدام منصة Hopper.
أكدت NVIDIA أيضًا على تحسين أداء منتجات توليد Hopper في تحديثات البرمجيات والشبكات في المؤتمر الصحفي ، ومن المتوقع أن تستمر Blackwell في التحسن مع التقديمات المستقبلية. بالإضافة إلى ذلك ، تخطط Nvidia لإطلاق الجيل التالي من AI Accelerator Blackwell Ultra العام المقبل ، والذي من المتوقع أن يوفر المزيد من الذاكرة وقوة الحوسبة الأقوى.
ظهرت بلاكويل لأول مرة في سبتمبر الماضي في مؤشر MLPERF Interference V4.1 ، ومن حيث الاستدلال من الذكاء الاصطناعى ، فإنه يحقق أداءً مدهشًا 4 مرات لكل وحدة معالجة الرسومات H100 ، خاصة مع انخفاض دقة FP4 Essence تم تصميم هذا الاتجاه الجديد للتعامل مع الطلب المتزايد على الدردشة المنخفضة للتشغيل والحوسبة الذكية مثل Openai's O1 Model.
نقاط:
- ** NVIDIA Blackwell Platform تضاعف أدائها في تدريب الذكاء الاصطناعي ، وكسر معايير الصناعة! **
- ** يتطلب Blackwell فقط 64 وحدات معالجة الرسومات في معيار GPT-3175B ، مما يؤدي إلى تحسين الكفاءة بشكل كبير! **
- ** سيتم إطلاق Blackwell Ultra العام المقبل ، والذي من المتوقع أن يوفر ذاكرة أعلى وقوة الحوسبة! **
باختصار ، يمثل ظهور منصة Blackwell في Nvidia اختراقًا كبيرًا في مجال حوسبة الذكاء الاصطناعي. سيؤدي تحسين الأداء الكبير وإطلاق Blackwell Ultra المستقبلي إلى زيادة تطوير وتطبيق تكنولوجيا الذكاء الاصطناعي وجلب المزيد من الإمكانيات إلى جميع الصناعات. لدينا سبب لتوقع أن تلعب منصة Blackwell دورًا أكبر في المستقبل.