11월 13일, 일본에서 열린 2024 AI Summit에서 NVIDIA와 SoftBank는 일본의 주권 AI 프로젝트(Sovereign AI, 국가 수준 AI 인프라) 개발을 가속화하고 NVIDIA의 글로벌 기술 리더십을 강화하는 동시에 수십억 달러를 가져오기 위한 일련의 협력 계획을 발표했습니다. 글로벌 통신 산업에 새로운 수익을 창출합니다.
NVIDIA 창립자 겸 CEO인 Jensen Huang은 기조 연설에서 SoftBank가 Blackwell 플랫폼을 사용하여 일본에서 가장 강력한 AI 슈퍼컴퓨터를 구축하고 있으며 향후 Grace Blackwell 플랫폼으로 업그레이드할 계획이라고 밝혔습니다.
동시에 NVIDIA는 SoftBank가 NVIDIA AI Aerial 플랫폼을 사용하여 세계 최초의 AI 및 5G 통신 네트워크 통합 테스트를 성공적으로 달성했다고 발표했습니다. 이 획기적인 발전은 통신 사업자에게 수십억 달러의 새로운 수익 채널을 열어줄 것입니다.
또한 NVIDIA와 SoftBank는 NVIDIA AI Enterprise 소프트웨어를 사용하여 일본의 현지 보안 AI 컴퓨팅 요구 사항을 충족하는 시장을 창출할 것이라고 공동 발표했습니다. 이 새로운 서비스는 AI 교육, 엣지 추론 및 기타 기능을 지원하여 SoftBank가 일본 AI 그리드의 핵심이 되고 다양한 산업, 소비자 및 기업을 위한 인공 지능 서비스에 대한 새로운 비즈니스 기회를 창출, 배포 및 사용할 수 있도록 돕습니다.
황런순 회장은 이번 소프트뱅크와의 협력이 일본을 AI 산업혁명으로 몰아넣고 통신, 교통, 로봇공학, 헬스케어 등 산업 분야의 새로운 성장 시대를 이끌 것이라고 말했다.
SoftBank의 사장 겸 CEO인 Junichi Miyagawa는 사회 발전을 촉진하기 위해 전 세계가 AI 채택을 가속화하고 있으며 SoftBank와 Nvidia 간의 장기적인 협력이 이러한 변화를 지원할 것이라고 강조했습니다. 강력한 AI 인프라와 혁신적인 분산 AI-RAN 솔루션 'AITRAS'를 통해 소프트뱅크는 5G 네트워크를 재편하고 전 세계적으로 혁신 속도를 가속화할 것입니다.
SoftBank는 새로운 NVIDIA DGX SuperPOD 슈퍼컴퓨터의 핵심 빌딩 블록이 될 세계 최초의 NVIDIA DGX B200 시스템을 곧 도입할 예정입니다.
소프트뱅크는 이 블랙웰 기반 DGX SuperPOD를 활용해 자체 생성 AI 연구 개발 및 AI 관련 사업을 홍보할 뿐만 아니라 일본 대학, 연구 기관, 기업의 AI 요구를 지원할 계획이다.
완공 후 SoftBank의 DGX SuperPOD는 일본에서 가장 뛰어난 슈퍼컴퓨팅 시스템이 될 것으로 예상됩니다. NVIDIA AI Enterprise 소프트웨어와 NVIDIA Quantum-2 InfiniBand 네트워킹이 함께 제공되며 이는 특히 대규모 언어 모델 개발에 적합합니다.
소프트뱅크는 DGX SuperPOD 외에도 고도로 계산 집약적인 작업에 초점을 맞춘 또 다른 슈퍼컴퓨터를 계획하고 있습니다. 이 컴퓨터는 처음에는 NVIDIA Grace Blackwell 플랫폼을 기반으로 구축되고 NVIDIA GB200 NVL72 다중 노드, 수냉식 랙 레벨 시스템을 통합하여 NVIDIA Blackwell GPU와 효율적인 Arm 아키텍처 NVIDIA Grace CPU를 완벽하게 결합할 계획입니다.
SoftBank는 Nvidia와 긴밀히 협력하여 업계에서 AI 무선 액세스 네트워크(AI-RAN)라고 부르는 AI와 5G 워크로드를 모두 고려할 수 있는 새로운 통신 네트워크 개발이라는 기술적 이정표를 달성했습니다. 이 혁신적인 인프라는 통신 사업자가 기지국을 비용 부담에서 AI 수익 창출 리소스로 전환하는 데 도움이 되기 때문에 통신 산업 생태계에서 널리 선호됩니다.
일본 가나가와현에서 열린 야외 시험에서 소프트뱅크는 엔비디아 가속을 기반으로 한 자사의 AI-RAN 솔루션이 사업자 수준의 5G 성능을 달성했으며, 네트워크의 남은 용량을 활용하면서 AI 추론 작업을 원활하게 실행할 수 있음을 확인했다.
전통적인 통신 네트워크는 피크 시간을 처리하도록 설계되었지만 평균 활용도는 1/3에 불과합니다. AI-RAN의 일반 컴퓨팅 역량은 통신사들이 남은 용량의 3분의 2를 AI 추론 서비스로 전환해 상용화할 수 있는 기회를 제공할 것으로 기대된다.
NVIDIA와 SoftBank의 추정에 따르면 통신 사업자는 새로운 AI-RAN 인프라에 투자하는 자본 지출 1달러당 AI 추론 수익으로 약 5달러를 얻을 것으로 예상됩니다. SoftBank는 운영 비용과 자본 지출을 고려하여 AI-RAN 서버를 추가할 때마다 인프라 반환율이 최대 219%에 이를 수 있다고 예측합니다.