أصدرت SemiAnalogy مؤخرًا تقريرًا يشير إلى وجود عيوب خطيرة في برنامج الجيل الجديد من شريحة الذكاء الاصطناعي MI300X من AMD، والتي تمنع تحقيق أدائها بالكامل وغير قادرة على تحدي هيمنة Nvidia بشكل فعال في سوق شرائح الذكاء الاصطناعي. ويكشف التقرير، المستند إلى تحقيق متعمق لمدة خمسة أشهر، عن عيوب AMD في بناء النظام البيئي للبرمجيات ويقدم توصيات لتطوير AMD في المستقبل.
في الآونة الأخيرة، أصدرت وكالة تحليل التكنولوجيا SemiAnalogy تقرير تحقيق مدته خمسة أشهر، يكشف أن أحدث شريحة MI300X AI من AMD تعاني من مشكلات برمجية كبيرة، مما يجعلها غير قادرة على الأداء كما ينبغي، وبالتالي غير قادرة على المنافسة في سوق شرائح الذكاء الاصطناعي تحدي هيمنة نفيديا.
وأشار التقرير إلى أن برنامج AMD يحتوي على عدد كبير من نقاط الضعف، مما يجعل التدريب على نماذج الذكاء الاصطناعي شبه مستحيل ويحتاج المستخدمون إلى قضاء الكثير من الوقت في تصحيح الأخطاء. وفي الوقت نفسه، تواصل Nvidia طرح ميزات ومكتبات وتحديثات أداء جديدة تعمل على توسيع الفجوة بين الاثنين. أجرى المحللون اختبارات مكثفة، بما في ذلك معايير GEMM والتدريب على العقدة الواحدة، وأظهرت النتائج أن AMD لم تتمكن من التغلب على ما يسمى "خندق CUDA" - وهو ما يمثل ميزة Nvidia القوية في مجال البرمجيات.
من منظور مواصفات الأجهزة، فإن بيانات أداء MI300X ملفتة للنظر تمامًا. تصل قوة الحوسبة FP16 إلى 1307 تيرا فلوبس وهي مجهزة بذاكرة HBM3 بسعة 192 جيجابايت. بالمقارنة، يحتوي جهاز H100 من Nvidia على 989 TeraFLOPS وذاكرة 80 جيجابايت، على الرغم من أن أحدث H200 من Nvidia يسد الفجوة من حيث الذاكرة، حيث يوفر تكوينًا بسعة 141 جيجابايت. ومن الجدير بالذكر أن أنظمة AMD توفر مزايا من حيث التكلفة الإجمالية للملكية، مع انخفاض الأسعار وشبكات Ethernet بأسعار معقولة.
ومع ذلك، فإن مزايا الأجهزة هذه لا تحقق النتائج المرجوة في الاستخدام الفعلي. يصف SemiAnalogy هذه الظاهرة بأنها "مقارنة الكاميرات بعدد البكسل وحده"، مما يشير إلى أن AMD تضيع في لعبة الأرقام وتفشل في تقديم أداء كافٍ في العالم الحقيقي. من أجل الحصول على نتائج معيارية قابلة للاستخدام، كان على المحللين العمل مباشرة مع مهندسي AMD لحل نقاط الضعف المتعددة في البرامج، في حين كان نظام Nvidia جاهزًا للاستخدام دون تعديلات إضافية.
وذكر التقرير أيضًا أن Tensorwave، أكبر مزود للخدمات السحابية لوحدة معالجة الرسومات من AMD، اضطر إلى توفير وحدات معالجة الرسومات المشتراة الخاصة به لفريق AMD مجانًا للمساعدة في حل مشكلات البرامج. ولتحقيق هذه الغاية، اقترحت SemiAnalogy أن الرئيس التنفيذي لشركة AMD Su Zifeng يحتاج إلى زيادة الاستثمار في تطوير البرمجيات واختبارها، وخاصة تخصيص عدد كبير من شرائح MI300X للاختبار الآلي، وتبسيط متغيرات البيئة المعقدة، وتحسين الإعدادات الافتراضية لتعزيز تجربة المصنع.
وعلى الرغم من أن شركة SemiAnalogy تأمل في أن تصبح AMD منافسًا قويًا لـ Nvidia، إلا أنها قالت أيضًا: "للأسف، لا يزال هناك الكثير من العمل الذي يتعين القيام به". بدون تحسينات كبيرة في البرامج، تخاطر AMD بالتخلف أكثر، خاصة وأن Nvidia تستعد لإطلاق الجيل التالي من رقائق Blackwell، على الرغم من وجود تقارير أيضًا تفيد بأن إطلاق منتج الجيل التالي من Nvidia لن يكون سلسًا.
أبرز النقاط:
تواجه شريحة AMD MI300X AI مشكلات برمجية خطيرة، مما يجعل التدريب على نماذج الذكاء الاصطناعي أمرًا صعبًا.
تواصل Nvidia توسيع مزاياها في السوق من خلال منصة CUDA القوية وتحديثات البرامج المتكررة.
توصي SemiAnalogy بأن تقوم AMD بزيادة الاستثمار في تطوير البرامج وتحسين تجربة المستخدم لتعزيز القدرة التنافسية.
بشكل عام، يشير التقرير بوضوح إلى التحديات البرمجية الضخمة التي تواجهها شرائح AMD MI300X والاتجاهات التي تحتاج AMD إلى تحسينها. إن قدرتها على التغلب على "الخندق" في البرامج سيحدد بشكل مباشر نجاح AMD أو فشلها في المنافسة المستقبلية في سوق شرائح الذكاء الاصطناعي.