El 13 de noviembre, en la Cumbre de IA de 2024 en Japón, NVIDIA y SoftBank anunciaron una serie de planes de cooperación destinados a acelerar el desarrollo del proyecto soberano de IA de Japón (IA soberana, infraestructura de IA a nivel nacional) y fortalecer el liderazgo tecnológico global de NVIDIA, al tiempo que aporta miles de millones. de dólares en nuevos ingresos para la industria mundial de las telecomunicaciones.
El fundador y director ejecutivo de NVIDIA, Jensen Huang, reveló en su discurso de apertura que SoftBank está utilizando la plataforma Blackwell para construir la supercomputadora de inteligencia artificial más poderosa de Japón y planea actualizar a la plataforma Grace Blackwell en el futuro.
Al mismo tiempo, NVIDIA anunció que SoftBank ha utilizado con éxito la plataforma NVIDIA AI Aerial para realizar la primera prueba de integración del mundo de redes de telecomunicaciones AI y 5G. Este avance abrirá miles de millones de dólares en nuevos canales de ingresos para los operadores de telecomunicaciones.
Además, NVIDIA y SoftBank también anunciaron conjuntamente que utilizarán el software NVIDIA AI Enterprise para crear un mercado que satisfaga las necesidades informáticas seguras de IA locales de Japón. Este nuevo servicio respaldará la capacitación en IA, el razonamiento de vanguardia y otras funciones, ayudando a SoftBank a convertirse en el núcleo de la red de IA de Japón y a crear, distribuir y utilizar nuevas oportunidades comerciales para servicios de inteligencia artificial para diversas industrias, consumidores y empresas.
Huang Renxun dijo que esta cooperación con SoftBank empujará a Japón a la revolución industrial de la IA y liderará una nueva era de crecimiento en industrias como las telecomunicaciones, el transporte, la robótica y la atención médica.
Junichi Miyagawa, presidente y director ejecutivo de SoftBank, enfatizó que el mundo está acelerando la adopción de la IA para promover el desarrollo social, y la cooperación a largo plazo entre SoftBank y Nvidia ayudará a esta transformación. Con su potente infraestructura de IA y su innovadora solución AI-RAN distribuida "AITRAS", SoftBank remodelará las redes 5G y acelerará el ritmo de la innovación en todo el mundo.
SoftBank está a punto de recibir el primer sistema NVIDIA DGX B200 del mundo, que se convertirá en el componente central de su nueva supercomputadora NVIDIA DGX SuperPOD.
SoftBank tiene la intención de utilizar este DGX SuperPOD impulsado por Blackwell no solo para promover su propia investigación y desarrollo de IA generativa y negocios relacionados con la IA, sino también para satisfacer las necesidades de IA de las universidades, instituciones de investigación y empresas japonesas.
Se espera que una vez finalizado, el DGX SuperPOD de SoftBank se convierta en el sistema de supercomputación más destacado de Japón. Viene con el software NVIDIA AI Enterprise y la red NVIDIA Quantum-2 InfiniBand, que es particularmente adecuada para desarrollar modelos de lenguaje de gran tamaño.
Además del DGX SuperPOD, SoftBank también está planeando otra supercomputadora enfocada en tareas altamente computacionales. Inicialmente, se planeó construir la computadora sobre la base de la plataforma NVIDIA Grace Blackwell e integrar el sistema NVIDIA GB200 NVL72 de múltiples nodos, refrigerado por líquido y a nivel de bastidor, combinando perfectamente la GPU NVIDIA Blackwell con la eficiente CPU NVIDIA Grace de arquitectura Arm.
SoftBank ha trabajado estrechamente con Nvidia para lograr un hito tecnológico: el desarrollo de una nueva red de telecomunicaciones que puede tener en cuenta cargas de trabajo de IA y 5G, que la industria llama AI Radio Access Network (AI-RAN). Esta infraestructura innovadora es ampliamente favorecida por el ecosistema de la industria de las telecomunicaciones porque ayuda a los operadores a transformar las estaciones base de cargas de costos en recursos generadores de ingresos de IA.
En una prueba al aire libre en la prefectura de Kanagawa, Japón, SoftBank verificó que su solución AI-RAN basada en la aceleración de NVIDIA ha logrado un rendimiento 5G a nivel de operador y puede ejecutar sin problemas tareas de inferencia de IA mientras utiliza la capacidad restante de la red.
Las redes de telecomunicaciones tradicionales están diseñadas para soportar las horas pico, pero la utilización promedio es sólo de un tercio. Se espera que las capacidades informáticas generales de AI-RAN brinden a las empresas de telecomunicaciones la oportunidad de convertir los dos tercios restantes de la capacidad en servicios de inferencia de IA para su comercialización.
Según estimaciones de NVIDIA y SoftBank, se espera que los operadores de telecomunicaciones obtengan aproximadamente 5 dólares estadounidenses en ingresos por inferencia de IA por cada dólar estadounidense de gasto de capital que inviertan en nueva infraestructura AI-RAN. Teniendo en cuenta los costos operativos y los gastos de capital, SoftBank predice que por cada servidor AI-RAN adicional, la tasa de retorno de su infraestructura puede alcanzar hasta el 219%.