El último chip Blackwell AI de NVIDIA ha experimentado serios problemas de sobrecalentamiento durante las pruebas de servidor, lo que ha atraído una atención generalizada de la industria. Este problema no solo retrasa el tiempo del producto al mercado, sino que también puede afectar la construcción de los centros de datos de los clientes y los planes de negocios. Se informa que el chip se sobrecalienta cuando está conectado al estante de servidor de chips 72, y NVIDIA está trabajando activamente con los proveedores para ajustar el diseño del bastidor para resolver el problema. Aunque NVIDIA dijo que está trabajando estrechamente con los proveedores de servicios en la nube, el incidente aún expuso desafíos potenciales en las implementaciones de chips de IA a gran escala y destacó los requisitos estrictos para la tecnología de enfriamiento en el campo de la computación de alto rendimiento.
Recientemente, el nuevo chip Blackwell AI de Nvidia ha sobrecalentado problemas en los servidores, lo que plantea preocupaciones entre los clientes sobre no poder permitir nuevos centros de datos a tiempo. Según la información, la Unidad de Procesamiento de Gráficos de Blackwell (GPU) se sobrecalentó cuando se conectó a un estante de servidor diseñado para acomodar 72 chips.
Según personas familiarizadas con el asunto, el equipo de ingeniería de NVIDIA está respondiendo activamente al problema, y el personal de la compañía ha pedido repetidamente a los proveedores que ajusten el diseño del bastidor para evitar más problemas de sobrecalentamiento. Mientras tanto, un portavoz de NVIDIA dijo en una entrevista con la búsqueda de Alpha: "Nvidia está trabajando en estrecha colaboración con los principales proveedores de servicios en la nube, una parte importante de nuestro equipo de ingeniería y los procesos de ingeniería son normales y predecibles.
Blackwell Chips debutó en marzo de este año, y Nvidia ha dicho que los chips comenzarán el envío en el segundo trimestre, pero ha habido demoras. Este problema pone a la empresa en un desafío porque no solo afecta el tiempo para comercializar nuevos productos, sino que también afecta los planes comerciales de los clientes.
Con el rápido desarrollo de la tecnología de IA y la creciente demanda de computación de alto rendimiento, Nvidia, como líder de la industria, naturalmente espera ganar un lugar en esta ola. Sin embargo, si el problema de sobrecalentamiento no se resuelve en el tiempo, puede afectar la reputación del mercado y la satisfacción del cliente de la Compañía. Los expertos de la industria señalan que resolver estos problemas técnicos es crucial, especialmente antes de la implementación a gran escala, lo que afectará directamente el rendimiento y la confiabilidad de los centros de datos.
En este contexto, el equipo de ingeniería de NVIDIA está trabajando horas extras para arreglar este defecto para garantizar que el chip Blackwell se pueda usar sin problemas. Los clientes también están prestando mucha atención al progreso, con la esperanza de ver soluciones efectivas lo antes posible para que puedan abrir con éxito nuevos centros de datos y satisfacer las crecientes necesidades informáticas.
Puntos clave:
Los clientes están preocupados por los problemas de sobrecalentamiento de chip Blackwell AI en el servidor.
NVIDIA está trabajando con proveedores de servicios en la nube para tratar de ajustar el diseño del bastidor para resolver el problema.
El Blackwell Chip fue lanzado en marzo y originalmente estaba programado para enviar en el segundo trimestre, pero encontró un retraso.
El tema del sobrecalentamiento de chips Blackwell ha sonado una llamada de atención para Nvidia y toda la industria de la IA, enfatizando la importancia del diseño térmico mientras busca un alto rendimiento y la necesidad de pruebas y verificación rigurosas antes del lanzamiento del producto. La forma en que Nvidia resolverá este problema en el futuro y el impacto de este incidente en la estructura del mercado es digna de atención continua.