O editor do Downcodes descobriu que o mais recente chip Blackwell AI da Nvidia teve um problema de superaquecimento durante os testes do servidor, o que atraiu a atenção da indústria. Este problema não afeta apenas o tempo de lançamento de novos produtos no mercado, mas também pode causar atrasos nos planos de implantação do data center dos clientes. É relatado que as GPUs Blackwell superaquecem quando conectadas a um rack de servidor projetado para acomodar 72 chips, e a Nvidia está trabalhando com fornecedores para resolver ativamente o problema.
De acordo com pessoas familiarizadas com o assunto, a equipe de engenharia da Nvidia está respondendo ativamente a esse problema, e os funcionários da empresa têm solicitado repetidamente aos fornecedores que ajustem o design do rack para evitar mais problemas de superaquecimento. Um porta-voz da NVIDIA disse que a empresa está trabalhando em estreita colaboração com os principais provedores de serviços em nuvem e que as iterações de engenharia são um processo normal e esperado. Os chips Blackwell foram lançados em março deste ano e estavam originalmente programados para serem lançados no segundo trimestre, mas problemas de superaquecimento causaram atrasos.
O problema de superaquecimento do chip Blackwell destaca a importância de resolver problemas técnicos no campo da computação de alto desempenho, especialmente antes da implantação em larga escala. Isso está diretamente relacionado ao desempenho e à confiabilidade do data center e também afeta a reputação de mercado da NVIDIA e a satisfação do cliente. Atualmente, a equipe de engenharia da NVIDIA está trabalhando horas extras para corrigir os defeitos, e os clientes também estão prestando muita atenção ao progresso, na esperança de ver soluções eficazes o mais rápido possível.
Neste contexto, a equipe de engenharia da Nvidia está trabalhando horas extras para corrigir esse defeito e garantir que o chip Blackwell possa ser usado sem problemas. Os clientes também estão prestando muita atenção ao progresso, esperando ver soluções eficazes o mais rápido possível, para que possam abrir novos data centers sem problemas para atender às crescentes necessidades de computação.
O problema de superaquecimento do chip Blackwell AI da Nvidia nos lembra que desafios e oportunidades coexistem no campo da computação de alto desempenho. Esperamos que a Nvidia possa resolver o problema o mais rápido possível e contribuir para o desenvolvimento da indústria de IA. O editor do Downcodes continuará atento ao andamento do incidente e trazendo os últimos relatórios aos leitores.