11月13日,在日本舉行的2024年AI峰會上,英偉達與軟銀公佈了一系列合作計劃,旨在加速日本主權AI項目( Sovereign AI,即國家層面的AI基礎設施)的發展,並強化英偉達在全球的技術領先地位,同時為全球電信業帶來數十億美元的新收入。
英偉達創辦人兼CEO黃仁勳在主題演講中透露,軟銀正利用Blackwell平台打造日本最強大的AI超級計算機,並計畫在未來升級至Grace Blackwell平台。
同時,英偉達宣布,軟銀已成功利用NVIDIA AI Aerial平台,實現了全球首個AI與5G電信網路的整合試驗,這項突破將為電信營運商開闢數十億美元的新收入管道。
此外,英偉達與軟銀也共同宣布,將藉助NVIDIA AI Enterprise軟體,打造符合日本本土安全AI運算需求的市場。這項新服務將支援AI培訓、邊緣推理等功能,幫助軟銀成為日本AI網格的核心,為各行業、消費者及企業創造、分發和使用人工智慧服務的新商機。
黃仁勳表示,這次與軟銀的合作將推動日本邁入AI產業革命,引領電信、交通、機器人及醫療保健等產業的新增長時代。
軟銀總裁兼CEO宮川潤一則強調,全球正加速採用AI促進社會發展,軟銀與英偉達的長期合作將協助這項轉型。憑藉強大的AI基礎設施及創新的分散式AI-RAN解決方案“AITRAS”,軟銀將重塑5G網絡,加速全球範圍內的創新步伐。
軟銀即將接收全球首台英偉達DGX B200系統,此系統將成為其新型NVIDIA DGX SuperPOD超級電腦的核心建構模組。
軟銀打算利用這台由Blackwell驅動的DGX SuperPOD,不僅推動自身的生成式AI研發及AI相關業務,還將支持日本各大學、研究機構及企業的AI需求。
預計建成後,軟銀的DGX SuperPOD將成為日本性能最卓越的超算系統。它配備了NVIDIA AI Enterprise軟體和NVIDIA Quantum-2 InfiniBand網絡,特別適合開發大語言模型。
除了DGX SuperPOD,軟銀還規劃了另一台專注於高運算密集任務的超級電腦。該電腦初步計畫基於NVIDIA Grace Blackwell平台構建,並融合NVIDIA GB200 NVL72多節點、液冷、機架級系統,將NVIDIA Blackwell GPU與高效的Arm架構NVIDIA Grace CPU完美結合。
軟銀與英偉達密切合作,實現了一個技術里程碑-研發出一種能兼顧AI與5G工作負載的新型電信網絡,業界稱之為AI無線接取網路(AI-RAN)。這項創新基礎設施廣受電信業生態系統青睞,因其助力業者將基地台從成本負擔轉變為AI創收資源。
在日本神奈川縣的戶外試驗中,軟銀驗證了其基於英偉達加速的AI-RAN方案已達成運營商級別的5G性能,並能在利用網絡剩餘容量的同時,順暢運行AI推理任務。
傳統電信網路為因應尖峰時段而設計,但平均利用率僅達三分之一。而AI-RAN所具備的通用運算能力,預計能讓電信公司有機會將剩餘的三分之二容量轉化為AI推理服務,實現商業化。
根據英偉達與軟銀估算,電信業者在新AI-RAN基礎設施上每投入1美元資本支出,可望獲得約5美元的AI推理收入。綜合考慮營運成本與資本支出,軟銀預測,每增設一台AI-RAN伺服器,其基礎設施的報酬率最高可達219%。