11月13日,在日本举行的2024年AI峰会上,英伟达与软银公布了一系列合作计划,旨在加速日本主权AI项目( Sovereign AI,即国家层面的AI基础设施)的发展,并强化英伟达在全球的技术领先地位,同时为全球电信行业带来数十亿美元的新收入。
英伟达创始人兼CEO黄仁勋在主题演讲中透露,软银正利用Blackwell平台构建日本最强大的AI超级计算机,并计划在未来升级至Grace Blackwell平台。
同时,英伟达宣布,软银已成功利用NVIDIA AI Aerial平台,实现了全球首个AI与5G电信网络的融合试验,这一突破将为电信运营商开辟数十亿美元的新收入渠道。
此外,英伟达与软银还共同宣布,将借助NVIDIA AI Enterprise软件,打造满足日本本土安全AI计算需求的市场。这一新服务将支持AI培训、边缘推理等功能,帮助软银成为日本AI网格的核心,为各行业、消费者及企业创造、分发和使用人工智能服务的新商机。
黄仁勋表示,此次与软银的合作将推动日本迈入AI产业革命,引领电信、交通、机器人及医疗保健等行业的新增长时代。
软银总裁兼CEO宫川润一则强调,全球正加速采用AI促进社会发展,软银与英伟达的长期合作将助力这一转型。凭借强大的AI基础设施及创新的分布式AI-RAN解决方案“AITRAS”,软银将重塑5G网络,加速全球范围内的创新步伐。
软银即将接收全球首台英伟达DGX B200系统,此系统将成为其新型NVIDIA DGX SuperPOD超级计算机的核心构建模块。
软银打算利用这台由Blackwell驱动的DGX SuperPOD,不仅推动自身的生成式AI研发及AI相关业务,还将支持日本各大学、研究机构及企业的AI需求。
预计建成后,软银的DGX SuperPOD将成为日本性能最卓越的超算系统。它配备了NVIDIA AI Enterprise软件和NVIDIA Quantum-2 InfiniBand网络,特别适合开发大语言模型。
除了DGX SuperPOD,软银还规划了另一台专注于高计算密集型任务的超级计算机。该计算机初步计划基于NVIDIA Grace Blackwell平台构建,并融合NVIDIA GB200 NVL72多节点、液冷、机架级系统,将NVIDIA Blackwell GPU与高效的Arm架构NVIDIA Grace CPU完美结合。
软银与英伟达密切合作,实现了一个技术里程碑——研发出一种能兼顾AI与5G工作负载的新型电信网络,业界称之为AI无线接入网络(AI-RAN)。这一创新基础设施广受电信行业生态系统青睐,因其助力运营商将基站从成本负担转变为AI创收资源。
在日本神奈川县的户外试验中,软银验证了其基于英伟达加速的AI-RAN方案已达成运营商级别的5G性能,并能在利用网络剩余容量的同时,顺畅运行AI推理任务。
传统电信网络为应对高峰时段而设计,但平均利用率仅达三分之一。而AI-RAN所具备的通用计算能力,预计能让电信公司有机会将剩余的三分之二容量转化为AI推理服务,实现商业化。
据英伟达与软银估算,电信运营商在新AI-RAN基础设施上每投入1美元资本支出,有望获得约5美元的AI推理收入。综合考虑运营成本与资本支出,软银预测,每增设一台AI-RAN服务器,其基础设施的回报率最高可达219%。