شهدت أحدث شريحة Blackwell AI من Nvidia مشاكل خطيرة في ارتفاع درجة الحرارة أثناء اختبار الخادم ، والتي جذبت اهتمامًا واسع النطاق من الصناعة. هذه المشكلة لا تؤخر فقط وقت المنتج في السوق ، ولكن قد تؤثر أيضًا على خطط بناء مركز بيانات العملاء وخطط الأعمال. تفيد التقارير أن الرقائق التي تم ارتفاع درجة حرارتها عند توصيلها بحامل خادم الرقائق 72 ، وأن NVIDIA تعمل بنشاط مع الموردين لضبط تصميم الرف لحل المشكلة. على الرغم من أن NVIDIA قالت إنها تعمل عن كثب مع مقدمي الخدمات السحابية ، إلا أن الحادث لا يزال يعرض التحديات المحتملة في عمليات نشر رقائق الذكاء الاصطناعى على نطاق واسع وتسليط الضوء على المتطلبات الصارمة لتكنولوجيا التبريد في مجال الحوسبة عالية الأداء.
في الآونة الأخيرة ، أدت رقاقة Blackwell AI الجديدة من NVIDIA إلى ارتفاع درجة حرارة المشكلات في الخوادم ، مما يثير مخاوف بين العملاء من عدم القدرة على تمكين مراكز البيانات الجديدة في الوقت المناسب. وفقًا للمعلومات ، كانت وحدة معالجة رسومات Blackwell (GPU) محمومة عند توصيلها بحامل خادم مصمم لاستيعاب 72 رقائق.
وفقًا للأشخاص المطلعين على هذه المسألة ، يستجيب فريق Nvidia الهندسي بنشاط للمشكلة ، وطلب موظفو الشركة الموردين مرارًا وتكرارًا لضبط تصميم الرف لتجنب المزيد من المشكلات في ارتفاع درجة الحرارة. وفي الوقت نفسه ، قال متحدث باسم NVIDIA في مقابلة مع ALPHA: "تعمل NVIDIA بشكل وثيق مع مقدمي الخدمات السحابية ، وهو جزء مهم من فريقنا الهندسي والعمليات.
ظهرت Blackwell Chips لأول مرة في مارس من هذا العام ، وقالت Nvidia إن الرقائق ستبدأ الشحنة في الربع الثاني ، ولكن كان هناك تأخير. تضع هذه المشكلة الشركة في تحد لأنها لا تؤثر فقط على وقت تسويق المنتجات الجديدة ، ولكنها تؤثر أيضًا على خطط عمل العملاء.
مع التطور السريع لتكنولوجيا الذكاء الاصطناعى والطلب المتزايد على الحوسبة عالية الأداء ، تأمل NVIDIA ، كرائدة في الصناعة ، بطبيعة الحال في الحصول على مكان في هذه الموجة. ومع ذلك ، إذا لم يتم حل مشكلة ارتفاع درجة الحرارة في الوقت المناسب ، فقد تؤثر ذلك على سمعة السوق للشركة ورضا العملاء. يشير خبراء الصناعة إلى أن حل هذه المشكلات التقنية أمر بالغ الأهمية ، خاصة قبل النشر على نطاق واسع ، والذي سيؤثر بشكل مباشر على أداء مراكز البيانات وموثوقيتها.
على هذه الخلفية ، يعمل فريق الهندسة في Nvidia العمل الإضافي لإصلاح هذا العيب لضمان استخدام شريحة Blackwell بسلاسة. يولي العملاء أيضًا اهتمامًا وثيقًا بالتقدم ، على أمل رؤية حلول فعالة في أقرب وقت ممكن حتى يتمكنوا من فتح مراكز بيانات جديدة بنجاح وتلبية احتياجات الحوسبة المتزايدة.
النقاط الرئيسية:
يشعر العملاء بالقلق إزاء مشاكل ارتفاع درجة حرارة شريحة Blackwell AI في الخادم.
تعمل Nvidia مع مقدمي الخدمات السحابية لمحاولة ضبط تصميم الرف لحل المشكلة.
تم إصدار Chip Blackwell في شهر مارس وتم تحديد موعد في الأصل لشحنه في الربع الثاني ، لكنها واجهت تأخيرًا.
بدت مسألة ارتفاع درجة حرارة شريحة Blackwell دعوة للاستيقاظ لـ NVIDIA وصناعة الذكاء الاصطناعى بأكمله ، مع التركيز على أهمية التصميم الحراري مع متابعة الأداء العالي وضرورة إجراء اختبار صارم والتحقق قبل إطلاق المنتج. كيف ستحل Nvidia هذه المشكلة في المستقبل وتأثير هذا الحادث على هيكل السوق يستحق الاهتمام المستمر.