Am 13. November kündigten NVIDIA und SoftBank auf dem KI-Gipfel 2024 in Japan eine Reihe von Kooperationsplänen an, die darauf abzielen, die Entwicklung von Japans souveränem KI-Projekt (Sovereign AI, KI-Infrastruktur auf nationaler Ebene) zu beschleunigen, NVIDIAs globale Technologieführerschaft zu stärken und gleichzeitig Milliarden einzubringen US-Dollar an neuen Einnahmen für die globale Telekommunikationsbranche.
Jensen Huang, Gründer und CEO von NVIDIA, gab in seiner Grundsatzrede bekannt, dass SoftBank die Blackwell-Plattform nutzt, um Japans leistungsstärksten KI-Supercomputer zu bauen, und plant, in Zukunft auf die Grace Blackwell-Plattform aufzurüsten.
Gleichzeitig gab NVIDIA bekannt, dass SoftBank die NVIDIA AI Aerial-Plattform erfolgreich eingesetzt hat, um den weltweit ersten Integrationstest von KI- und 5G-Telekommunikationsnetzen durchzuführen. Dieser Durchbruch wird Telekommunikationsbetreibern neue Umsatzkanäle in Milliardenhöhe eröffnen.
Darüber hinaus gaben NVIDIA und SoftBank gemeinsam bekannt, dass sie die NVIDIA AI Enterprise-Software nutzen werden, um einen Markt zu schaffen, der Japans lokale Anforderungen an sicheres KI-Computing erfüllt. Dieser neue Dienst wird KI-Training, Edge Reasoning und andere Funktionen unterstützen und SoftBank dabei helfen, zum Kern des japanischen KI-Netzes zu werden und neue Geschäftsmöglichkeiten für Dienste der künstlichen Intelligenz für verschiedene Branchen, Verbraucher und Unternehmen zu schaffen, zu vertreiben und zu nutzen.
Huang Renxun sagte, dass diese Zusammenarbeit mit SoftBank Japan in die industrielle KI-Revolution treiben und eine neue Ära des Wachstums in Branchen wie Telekommunikation, Transport, Robotik und Gesundheitswesen einleiten wird.
Junichi Miyagawa, Präsident und CEO von SoftBank, betonte, dass die Welt die Einführung von KI beschleunigt, um die soziale Entwicklung zu fördern, und dass die langfristige Zusammenarbeit zwischen SoftBank und Nvidia diesen Wandel unterstützen werde. Mit seiner leistungsstarken KI-Infrastruktur und der innovativen verteilten KI-RAN-Lösung „AITRAS“ wird SoftBank 5G-Netze neu gestalten und das Innovationstempo weltweit beschleunigen.
SoftBank erhält demnächst das weltweit erste NVIDIA DGX B200-System, das zum Kernbaustein seines neuen NVIDIA DGX SuperPOD-Supercomputers werden wird.
SoftBank beabsichtigt, mit diesem von Blackwell betriebenen DGX SuperPOD nicht nur seine eigene generative KI-Forschung und -Entwicklung sowie KI-bezogene Unternehmen zu fördern, sondern auch den KI-Bedarf japanischer Universitäten, Forschungseinrichtungen und Unternehmen zu unterstützen.
Es wird erwartet, dass der DGX SuperPOD von SoftBank nach seiner Fertigstellung Japans herausragendstes Supercomputersystem sein wird. Es wird mit der NVIDIA AI Enterprise-Software und dem NVIDIA Quantum-2 InfiniBand-Netzwerk geliefert, das sich besonders für die Entwicklung großer Sprachmodelle eignet.
Neben dem DGX SuperPOD plant SoftBank auch einen weiteren Supercomputer mit Schwerpunkt auf hochrechenintensiven Aufgaben. Der Computer soll zunächst auf Basis der NVIDIA Grace Blackwell-Plattform gebaut werden und das flüssigkeitsgekühlte Rack-Level-System NVIDIA GB200 NVL72 mit mehreren Knoten integrieren, wobei die NVIDIA Blackwell-GPU perfekt mit der effizienten NVIDIA Grace-CPU mit Arm-Architektur kombiniert wird.
SoftBank hat eng mit Nvidia zusammengearbeitet, um einen technologischen Meilenstein zu erreichen – die Entwicklung eines neuen Telekommunikationsnetzwerks, das sowohl KI- als auch 5G-Workloads berücksichtigen kann, das die Branche AI Radio Access Network (AI-RAN) nennt. Diese innovative Infrastruktur erfreut sich im Ökosystem der Telekommunikationsbranche großer Beliebtheit, da sie Betreibern hilft, Basisstationen von Kostenbelastungen in umsatzgenerierende KI-Ressourcen umzuwandeln.
In einem Outdoor-Test in der Präfektur Kanagawa, Japan, bestätigte SoftBank, dass seine auf NVIDIA-Beschleunigung basierende AI-RAN-Lösung eine 5G-Leistung auf Betreiberebene erreicht hat und KI-Inferenzaufgaben reibungslos ausführen kann, während die verbleibende Kapazität des Netzwerks genutzt wird.
Herkömmliche Telekommunikationsnetze sind für die Bewältigung von Spitzenzeiten ausgelegt, die durchschnittliche Auslastung beträgt jedoch nur ein Drittel. Es wird erwartet, dass die allgemeinen Rechenkapazitäten von AI-RAN Telekommunikationsunternehmen die Möglichkeit geben, die verbleibenden zwei Drittel der Kapazität zur Kommerzialisierung in KI-Inferenzdienste umzuwandeln.
Schätzungen von NVIDIA und SoftBank zufolge werden Telekommunikationsbetreiber voraussichtlich etwa 5 US-Dollar an KI-Inferenzeinnahmen für jeden US-Dollar an Kapitalausgaben erzielen, die sie in neue AI-RAN-Infrastruktur investieren. Unter Berücksichtigung der Betriebskosten und Investitionsausgaben prognostiziert SoftBank, dass die Rendite seiner Infrastruktur für jeden zusätzlichen AI-RAN-Server bis zu 219 % erreichen kann.