Le 13 novembre, lors du Sommet de l'IA 2024 au Japon, NVIDIA et SoftBank ont annoncé une série de plans de coopération visant à accélérer le développement du projet d'IA souverain du Japon (IA souveraine, infrastructure d'IA au niveau national) et à renforcer le leadership technologique mondial de NVIDIA tout en apportant des milliards de dollars. de dollars de nouveaux revenus pour l'industrie mondiale des télécommunications.
Le fondateur et PDG de NVIDIA, Jensen Huang, a révélé dans son discours d'ouverture que SoftBank utilise la plate-forme Blackwell pour construire le supercalculateur d'IA le plus puissant du Japon et prévoit de passer à la plate-forme Grace Blackwell à l'avenir.
Dans le même temps, NVIDIA a annoncé que SoftBank avait utilisé avec succès la plate-forme NVIDIA AI Aerial pour réaliser le premier test d'intégration au monde de l'IA et des réseaux de télécommunications 5G. Cette percée ouvrira des milliards de dollars de nouveaux canaux de revenus pour les opérateurs de télécommunications.
En outre, NVIDIA et SoftBank ont également annoncé conjointement qu'ils utiliseraient le logiciel NVIDIA AI Enterprise pour créer un marché qui répond aux besoins locaux en matière d'informatique sécurisée en matière d'IA au Japon. Ce nouveau service prendra en charge la formation en IA, le raisonnement de pointe et d'autres fonctions, aidant ainsi SoftBank à devenir le cœur du réseau d'IA du Japon et à créer, distribuer et utiliser de nouvelles opportunités commerciales pour les services d'intelligence artificielle pour diverses industries, consommateurs et entreprises.
Huang Renxun a déclaré que cette coopération avec SoftBank pousserait le Japon dans la révolution industrielle de l'IA et ouvrirait la voie à une nouvelle ère de croissance dans des secteurs tels que les télécommunications, les transports, la robotique et la santé.
Junichi Miyagawa, président et PDG de SoftBank, a souligné que le monde accélère l'adoption de l'IA pour promouvoir le développement social, et que la coopération à long terme entre SoftBank et Nvidia contribuera à cette transformation. Grâce à sa puissante infrastructure d'IA et à sa solution AI-RAN distribuée innovante « AITRAS », SoftBank va remodeler les réseaux 5G et accélérer le rythme de l'innovation dans le monde entier.
SoftBank est sur le point de recevoir le premier système NVIDIA DGX B200 au monde, qui deviendra l'élément de base de son nouveau supercalculateur NVIDIA DGX SuperPOD.
SoftBank a l'intention d'utiliser ce DGX SuperPOD propulsé par Blackwell non seulement pour promouvoir sa propre recherche et développement en IA générative et ses activités liées à l'IA, mais également pour répondre aux besoins en IA des universités, instituts de recherche et entreprises japonais.
On s'attend à ce qu'une fois terminé, le DGX SuperPOD de SoftBank devienne le système de calcul intensif le plus remarquable du Japon. Il est livré avec le logiciel NVIDIA AI Enterprise et la mise en réseau NVIDIA Quantum-2 InfiniBand, particulièrement adaptée au développement de grands modèles de langage.
En plus du DGX SuperPOD, SoftBank prévoit également un autre supercalculateur axé sur des tâches à forte intensité de calcul. L'ordinateur devrait initialement être construit sur la base de la plate-forme NVIDIA Grace Blackwell et intégrer le système de niveau rack multi-nœuds NVIDIA GB200 NVL72, refroidi par liquide, combinant parfaitement le GPU NVIDIA Blackwell avec l'architecture Arm efficace CPU NVIDIA Grace.
SoftBank a travaillé en étroite collaboration avec Nvidia pour franchir une étape technologique : le développement d'un nouveau réseau de télécommunications capable de prendre en compte à la fois les charges de travail de l'IA et de la 5G, que l'industrie appelle AI Radio Access Network (AI-RAN). Cette infrastructure innovante est largement favorisée par l’écosystème de l’industrie des télécommunications car elle aide les opérateurs à transformer les stations de base du fardeau des coûts en ressources génératrices de revenus de l’IA.
Lors d'un essai en extérieur dans la préfecture de Kanagawa, au Japon, SoftBank a vérifié que sa solution AI-RAN basée sur l'accélération NVIDIA a atteint des performances 5G de niveau opérateur et peut exécuter en douceur des tâches d'inférence d'IA tout en utilisant la capacité restante du réseau.
Les réseaux de télécommunications traditionnels sont conçus pour gérer les heures de pointe, mais leur utilisation moyenne n'est que d'un tiers. Les capacités informatiques générales d’AI-RAN devraient donner aux entreprises de télécommunications la possibilité de convertir les deux tiers restants de la capacité en services d’inférence d’IA à des fins de commercialisation.
Selon les estimations de NVIDIA et SoftBank, les opérateurs de télécommunications devraient obtenir environ 5 USD de revenus d'inférence d'IA pour chaque dollar d'investissement qu'ils investissent dans la nouvelle infrastructure AI-RAN. Compte tenu des coûts d'exploitation et des dépenses en capital, SoftBank prévoit que pour chaque serveur AI-RAN supplémentaire, le taux de retour sur son infrastructure peut atteindre jusqu'à 219 %.