Последний чип Nvidia Blackwell AI сталкивался с серьезными проблемами перегрева во время тестирования на сервере, что привлекло широкое внимание отрасли. Эта проблема не только задерживает время продукта на рынке, но и может повлиять на строительство клиентов и бизнес -планы клиентов. Сообщается, что чип перегревается при подключении к стойке 72 чипсов, и NVIDIA активно работает с поставщиками для регулировки конструкции стойки для решения проблемы. Хотя Nvidia заявила, что работает в тесном контакте с поставщиками облачных услуг, инцидент по-прежнему выявлял потенциальные проблемы в крупномасштабных развертываниях микросхемы ИИ и выявил строгие требования к технологии охлаждения в области высокопроизводительных вычислений.
Недавно новый чип Nvidia Blackwell AI перегрел проблемы на серверах, что вызвало проблемы среди клиентов о том, что он не может вовремя включать новые центры обработки данных. Согласно информации, блок обработки графики Blackwell (GPU) перегрелся при подключении к серверной стойке, предназначенной для размещения 72 чипов.
По словам людей, знакомых с этим вопросом, инженерная команда NVIDIA активно реагирует на проблему, и сотрудники компании неоднократно просили поставщиков скорректировать дизайн стойки, чтобы избежать дальнейших проблем перегрева. Между тем, представитель NVIDIA сказал, что в интервью Alpha: «NVIDIA работает в тесном контакте с ведущими поставщиками облачных услуг, важной частью нашей инженерной группы и процессов.
Чипсы Blackwell дебютировали в марте этого года, и Nvidia заявила, что чипсы начнут отправку во втором квартале, но были задержки. Эта проблема ставит компанию в задачу, потому что она не только влияет на время на рынок новых продуктов, но и влияет на бизнес -планы клиентов.
Благодаря быстрому развитию технологий ИИ и растущим спросом на высокопроизводительные вычисления, NVIDIA, как лидер отрасли, естественно надеется получить место в этой волне. Однако, если проблема перегрева не решается вовремя, это может повлиять на рыночную репутацию компании и удовлетворенность клиентов. Отраслевые эксперты отмечают, что решение этих технических проблем имеет решающее значение, особенно перед широкомасштабным развертыванием, которое напрямую повлияет на эффективность и надежность центров обработки данных.
На этом фоне команда инженеров NVIDIA работает сверхурочно, чтобы исправить этот недостаток, чтобы гарантировать, что чип Blackwell может быть использован плавно. Клиенты также уделяют пристальное внимание прогрессу, надеясь увидеть эффективные решения как можно скорее, чтобы они могли успешно открыть новые центры обработки данных и удовлетворить растущие вычислительные потребности.
Ключевые моменты:
Клиенты обеспокоены проблемами перегрева в Blackwell AI на сервере.
Nvidia работает с поставщиками облачных услуг, чтобы попытаться настроить дизайн стойки для решения проблемы.
Чип Blackwell был выпущен в марте и первоначально должен был отправить во второй четверти, но он столкнулся с задержкой.
Проблема перегрева Blackwell Chips вызвала пробуждение для Nvidia и всей индустрии искусственного интеллекта, подчеркнув важность теплового дизайна при выполнении высокой производительности и необходимости строгого тестирования и проверки перед выпуском продукта. То, как Nvidia решит эту проблему в будущем, и влияние этого инцидента на структуру рынка заслуживает постоянного внимания.