NVIDIA는 최근 새로운 Blackwell 플랫폼을 출시했으며 MLPERF Training 4.1 벤치 마크에서 인상적인 성능 향상을 보여주었습니다. 이전 호퍼 플랫폼과 비교할 때 Blackwell은 여러 AI 교육 작업, 특히 LLM (Lange Language Model) 교육에서 성능을 두 배로 늘 렸으며 효율성이 크게 향상되었습니다. 이러한 획기적인 진행 상황은 AI 컴퓨팅 능력의 또 다른 도약을 나타내며 향후 AI 애플리케이션의 광범위한 구현을위한 견고한 토대를 임명합니다. 이 기사는 Blackwell 플랫폼의 성능에 대한 심층 분석을 수행하고 기술 혁신과 미래 개발에 대해 논의 할 것입니다.
최근 Nvidia는 새로운 Blackwell 플랫폼을 발표하고 MLPERF Training 4.1 벤치 마크에서 예비 성과를 보여주었습니다. 테스트 결과에 따르면, 일부 측면에서 Blackwell의 성능은 이전 세대의 Hopper 플랫폼에 비해 두 배가되었으며,이 성과는 업계의 광범위한 관심을 끌었습니다.
MLPERF Training4.1 벤치 마크에서 Blackwell 플랫폼은 LLAMA270B의 미세 조정 작업에서 각 GPU의 성능을 2.2 배, 벤치 마크를 달성했으며, 사전 훈련에서 각 GPU의 성능을 2 배 GPT-3175B는 개선을 두 배로 늘 렸습니다. 또한, 안정적인 확산 v2 훈련과 같은 다른 벤치 마크에서, 새로운 세대의 블랙웰은 이전 세대를 1.7 배 늘 렸습니다.
호퍼는 계속 개선을 보여 주지만 호퍼는 이전 MLPERF 교육 벤치 마크와 비교하여 언어 모델 사전 훈련이 1.3 배의 성능 향상을 가졌다는 점은 주목할 가치가 있습니다. 이것은 Nvidia의 기술이 계속 향상되고 있음을 보여줍니다. 최근 GPT-3175B 벤치 마크에서 Nvidia는 11,616 Hopper GPU를 제출하여 새로운 확장 기록을 설정했습니다.
Nvidia는 Blackwell의 기술적 세부 사항과 관련하여 새로운 아키텍처는 최적화 된 텐서 코어와 더 빠른 대역폭 메모리를 사용한다고 말했다. 이로 인해 GPT-3175B 벤치 마크를 실행하는 것은 64Gpus에 불과하며, 호퍼 플랫폼을 사용하여 동일한 성능을 달성하기 위해 256 GPU는 동일한 성능을 달성합니다.
Nvidia는 또한 기자 회견에서 소프트웨어 및 네트워크 업데이트에서 Hopper의 세대 제품의 성능 향상을 강조했으며, Blackwell은 향후 제출물로 계속 개선 될 것으로 예상됩니다. 또한 NVIDIA는 내년에 차세대 AI 가속기 Blackwell Ultra를 출시 할 계획이며, 이는 더 많은 메모리와 더 강력한 컴퓨팅 파워를 제공 할 것으로 예상됩니다.
Blackwell은 지난 9 월 MLPERF 추론 v4.1 벤치 마크에서 데뷔했으며 AI 추론 측면에서 H100보다 GPU 당 4 배 더 놀라운 성능을 달성합니다. 이 새로운 트렌드는 오픈 라이의 O1 모델과 같은 저도의 챗봇에 대한 수요가 증가하고 스마트 컴퓨팅에 대처하기 위해 고안되었습니다.
전철기:
- ** Nvidia Blackwell Platform은 AI 교육에서 성능을 두 배로 늘리고 업계 표준을 깨뜨립니다! **
- ** Blackwell은 GPT-3175B 벤치 마크에서 64 GPU 만 필요하므로 효율성을 크게 향상시킵니다! **
- ** Blackwell Ultra는 내년에 출시 될 예정이며, 이는 더 높은 메모리와 컴퓨팅 파워를 제공 할 것으로 예상됩니다! **
요컨대, Nvidia의 Blackwell 플랫폼의 출현은 AI 컴퓨팅 분야에서 큰 돌파구를 나타냅니다. 상당한 성능 개선과 Blackwell Ultra의 향후 출시는 AI 기술의 개발 및 적용을 더욱 촉진하고 모든 산업에 더 많은 가능성을 가져올 것입니다. 우리는 Blackwell 플랫폼이 미래에 더 큰 역할을 할 것으로 기대할 이유가 있습니다.