Недавно компания SemiAnaанализ опубликовала отчет, в котором говорится, что в программном обеспечении AI-чипа нового поколения AMD MI300X имеются серьезные недостатки, которые не позволяют полностью реализовать его производительность и не позволяют эффективно бросить вызов доминированию Nvidia на рынке AI-чипов. Отчет, основанный на пятимесячном углубленном расследовании, раскрывает недостатки AMD в построении экосистемы программного обеспечения и дает рекомендации по будущему развитию AMD.
Недавно агентство технологического анализа SemiAnalysis опубликовало пятимесячный отчет о расследовании, показывающий, что новейший AI-чип AMD MI300X имеет серьезные программные проблемы, из-за которых он не может работать должным образом и, следовательно, не может конкурировать на рынке AI-чипов. . Бросить вызов доминированию Nvidia.
В отчете отмечается, что программное обеспечение AMD содержит большое количество уязвимостей, что делает обучение моделей ИИ практически невозможным, и пользователям приходится тратить много времени на отладку. Тем временем Nvidia продолжает внедрять новые функции, библиотеки и обновления производительности, которые еще больше увеличивают разрыв между ними. Аналитики провели обширное тестирование, включая тесты GEMM и обучение одного узла, и результаты показали, что AMD не смогла преодолеть так называемый «ров CUDA», то есть сильное преимущество Nvidia в программном обеспечении.
С точки зрения аппаратных характеристик, производительность MI300X весьма привлекательна. Вычислительная мощность FP16 достигает 1307 Терафлопс и оснащена памятью HBM3 объемом 192 ГБ. Для сравнения, Nvidia H100 имеет производительность 989 Терафлопс и 80 ГБ памяти, хотя последняя версия Nvidia H200 закрывает разрыв в объеме памяти, предлагая конфигурацию на 141 ГБ. Стоит отметить, что системы AMD предлагают преимущества с точки зрения совокупной стоимости владения за счет более низких цен и более доступных сетей Ethernet.
Однако эти аппаратные преимущества не приносят желаемых результатов при реальном использовании. SemiAnaлиз описывает это явление как «сравнение камер только по количеству пикселей», предполагая, что AMD теряется в игре с числами и не может обеспечить достаточную реальную производительность. Чтобы получить пригодные для использования результаты тестов, аналитикам пришлось работать напрямую с инженерами AMD над устранением множества уязвимостей программного обеспечения, тогда как система Nvidia была готова к использованию без дополнительных настроек.
В отчете также упоминается, что Tensorwave, крупнейший поставщик облачных услуг графических процессоров AMD, даже был вынужден бесплатно предоставить команде AMD приобретенные графические процессоры для решения проблем с программным обеспечением. С этой целью компания SemiAnalysis предположила, что генеральному директору AMD Су Цзыфэну необходимо увеличить инвестиции в разработку и тестирование программного обеспечения, особенно выделить большое количество чипов MI300X для автоматического тестирования, упростить сложные переменные среды и улучшить настройки по умолчанию для повышения качества работы на заводе.
Хотя SemiAnalysis надеется, что AMD сможет стать сильным конкурентом Nvidia, они также заявили, что «к сожалению, предстоит еще много работы». Без серьезных улучшений программного обеспечения AMD рискует еще больше отстать, особенно сейчас, когда Nvidia готовится к выпуску следующего поколения чипов Blackwell, хотя есть также сообщения о том, что запуск продукта следующего поколения Nvidia не будет проходить гладко.
Основные моменты:
Чип искусственного интеллекта AMD MI300X сталкивается с серьезными проблемами программного обеспечения, что затрудняет обучение модели искусственного интеллекта.
Nvidia продолжает расширять свое рыночное преимущество благодаря мощной платформе CUDA и частым обновлениям программного обеспечения.
SemiAnaлиз рекомендует AMD увеличить инвестиции в разработку программного обеспечения и улучшить взаимодействие с пользователем для повышения конкурентоспособности.
В целом, в отчете четко обозначены огромные проблемы с программным обеспечением, с которыми сталкиваются чипы AMD MI300X, и направления, в которых AMD необходимо совершенствоваться. Сможет ли AMD преодолеть «ров» в программном обеспечении, это напрямую определит успех или неудачу AMD в будущей конкуренции на рынке чипов искусственного интеллекта.