علم محرر موقع Downcodes أن أداء منصة Blackwell الأحدث من Nvidia كان مذهلاً في الاختبار المعياري MLPerf Training 4.1، وأن أدائها تجاوز بشكل كبير منصة Hopper من الجيل السابق. تظهر نتائج الاختبار أن بلاكويل حققت تحسينات كبيرة في الأداء في العديد من الاختبارات المعيارية، الأمر الذي اجتذب اهتمامًا واسع النطاق في الصناعة ويبشر بإنجاز جديد في تكنولوجيا تسريع الذكاء الاصطناعي. على وجه التحديد، أظهرت بلاكويل مزايا مثيرة للإعجاب في مهام الضبط الدقيق ومهام ما قبل التدريب في LLM، مما يوفر إمكانيات جديدة لتطوير مجال الذكاء الاصطناعي.
أصدرت NVIDIA مؤخرًا منصة Blackwell الجديدة وأظهرت أداءً أوليًا في الاختبار المعياري MLPerf Training4.1. ووفقا لنتائج الاختبار، تضاعف أداء بلاكويل في بعض الجوانب مقارنة بالجيل السابق من منصة هوبر. وقد جذبت هذه النتيجة اهتماما واسع النطاق في الصناعة.
في معيار MLPerf Training4.1، حققت منصة Blackwell 2.2 مرة أداء Hopper لكل وحدة معالجة رسومات في مهمة الضبط الدقيق Llama270B لمعيار LLM (نموذج اللغة الكبيرة)، و2.2 مرة في التدريب المسبق لمرات GPT-3175B تحسين. بالإضافة إلى ذلك، في الاختبارات المعيارية الأخرى مثل تدريب Stable Diffusion v2، تجاوز الجيل الجديد من Blackwell أيضًا منتج الجيل السابق بميزة 1.7 مرة.
ومن الجدير بالذكر أنه بينما يواصل Hopper إظهار التحسن، فإنه يعمل أيضًا على تحسين الأداء في التدريب المسبق لنموذج اللغة بعامل 1.3 مقارنة بالجولة السابقة من معيار تدريب MLPerf. وهذا يدل على أن تكنولوجيا نفيديا مستمرة في التحسن. في اختبار GPT-3175B الأخير، قدمت Nvidia 11,616 وحدة معالجة رسومات Hopper، مسجلة رقمًا قياسيًا جديدًا.
فيما يتعلق بالتفاصيل الفنية لـ Blackwell، قالت Nvidia أن البنية الجديدة تستخدم Tensor Cores المحسنة وذاكرة ذات نطاق ترددي عالي أسرع. يسمح هذا بتشغيل معيار GPT-3175B على 64 وحدة معالجة رسوميات فقط، بينما يتطلب استخدام منصة Hopper 256 وحدة معالجة رسوميات لتحقيق نفس الأداء.
أكدت Nvidia أيضًا على تحسينات أداء منتجات جيل Hopper في تحديثات البرامج والشبكات في المؤتمر الصحفي، ومن المتوقع أن تستمر Blackwell في التحسن من خلال عمليات الإرسال المستقبلية. بالإضافة إلى ذلك، تخطط NVIDIA لإطلاق الجيل القادم من مسرع الذكاء الاصطناعي Blackwell Ultra العام المقبل، والذي من المتوقع أن يوفر ذاكرة أكبر وقدرة حوسبة أقوى.
ظهرت Blackwell أيضًا لأول مرة في سبتمبر الماضي على معيار MLPerf Inference v4.1، وحققت أداءً مثيرًا للإعجاب لكل وحدة معالجة رسومات أكثر بأربع مرات من H100 في استدلال الذكاء الاصطناعي، خاصة باستخدام دقة FP4 أقل. يهدف هذا الاتجاه الجديد إلى تلبية الطلب المتزايد على روبوتات الدردشة ذات زمن الاستجابة المنخفض والحوسبة الذكية مثل نموذج O1 الخاص بـ OpenAI.
يمثل الأداء المتميز لمنصة Blackwell قفزة كبيرة إلى الأمام في تكنولوجيا تسريع الذكاء الاصطناعي، كما أن تحسينات أدائها في تدريب LLM والاستدلال ستعزز بشكل كبير تطوير وتطبيق تكنولوجيا الذكاء الاصطناعي. سيستمر محرر Downcodes في الاهتمام بالتطوير اللاحق لمنصة Blackwell وتقديم المزيد من التقارير ذات الصلة.