O mais recente chip da AI Blackwell da NVIDIA teve problemas graves de superaquecimento durante os testes do servidor, o que atraiu a atenção generalizada do setor. Esse problema não apenas atrasa o tempo do produto para o mercado, mas também pode afetar os planos de construção e negócios dos clientes dos clientes. É relatado que o chip superaqueceu quando conectado ao rack de 72 servidores de chip, e a NVIDIA está trabalhando ativamente com fornecedores para ajustar o design do rack para resolver o problema. Embora a Nvidia tenha dito que está trabalhando em estreita colaboração com os provedores de serviços em nuvem, o incidente ainda expôs possíveis desafios em implantações de chip de AI em larga escala e destacou os requisitos rígidos para a tecnologia de refrigeração no campo da computação de alto desempenho.
Recentemente, o novo chip Blackwell AI da NVIDIA superaqueceu problemas nos servidores, levantando preocupações entre os clientes sobre não poder permitir novos data centers a tempo. De acordo com as informações, a unidade de processamento de gráficos Blackwell (GPU) superaqueceu quando conectada a um rack de servidor projetado para acomodar 72 chips.
Segundo pessoas familiarizadas com o assunto, a equipe de engenharia da Nvidia está respondendo ativamente ao problema, e a equipe da empresa pediu repetidamente aos fornecedores que ajustassem o design do rack para evitar problemas de superaquecimento. Enquanto isso, um porta -voz da NVIDIA disse em uma entrevista à busca de Alpha: “
A Blackwell Chips estreou em março deste ano, e a Nvidia disse que as fichas começarão a enviar no segundo trimestre, mas houve atrasos. Esse problema coloca a empresa em um desafio, pois não apenas afeta o tempo de comercialização de novos produtos, mas também afeta os planos de negócios dos clientes.
Com o rápido desenvolvimento da tecnologia de IA e a crescente demanda por computação de alto desempenho, a NVIDIA, como líder da indústria, naturalmente espera ganhar um lugar nessa onda. No entanto, se o problema de superaquecimento não for resolvido a tempo, isso poderá afetar a reputação do mercado e a satisfação do cliente da empresa. Especialistas do setor apontam que a solução desses problemas técnicos é crucial, especialmente antes da implantação em larga escala, o que afetará diretamente o desempenho e a confiabilidade dos data centers.
Nesse cenário, a equipe de engenharia da NVIDIA está trabalhando horas extras para corrigir essa falha para garantir que o chip Blackwell possa ser colocado em uso sem problemas. Os clientes também estão prestando muita atenção ao progresso, na esperança de ver soluções eficazes o mais rápido possível, para que possam abrir com sucesso novos data centers e atender às crescentes necessidades de computação.
Pontos -chave:
Os clientes estão preocupados com os problemas de superaquecimento de chip da Blackwell AI no servidor.
A NVIDIA está trabalhando com provedores de serviços em nuvem para tentar ajustar o design do rack para resolver o problema.
O Chip Blackwell foi lançado em março e estava originalmente programado para ser enviado no segundo trimestre, mas encontrou um atraso.
A questão do superaquecimento de chip de Blackwell soou um alerta para a NVIDIA e toda a indústria da IA, enfatizando a importância do design térmico enquanto buscava alto desempenho e a necessidade de testes e verificação rigorosas antes da liberação do produto. Como a NVIDIA resolverá esse problema no futuro e o impacto desse incidente na estrutura do mercado é digno de atenção contínua.