英伟达Blackwell平台发布：AI训练性能暴增2.2倍，GPU需求大幅减少！

作者：Eve Cole 更新时间：2024-11-28 11:48:01

Downcodes小编获悉，英伟达最新发布的Blackwell平台在MLPerf Training 4.1基准测试中表现惊艳，性能大幅超越前代Hopper平台。此次测试结果显示，Blackwell在多个基准测试中均取得了显着的性能提升，引发业界广泛关注，预示着AI加速器技术的新突破。具体而言，Blackwell在LLM微调和预训练任务中展现出令人瞩目的优势，为AI领域的发展带来新的可能性。

近日，英伟达发布了其全新的Blackwell 平台，并在MLPerf Training4.1基准测试中展示了初步的性能表现。根据测试结果，Blackwell 在某些方面的性能相比于前一代Hopper 平台实现了翻倍的提升，这一成果引起了业界的广泛关注。

在MLPerf Training4.1基准测试中，Blackwell 平台在LLM（大语言模型）基准的Llama270B 微调任务中，每个GPU 的性能达到了Hopper 的2.2倍，而在GPT-3175B 的预训练中则达到了2倍的提升。此外，在Stable Diffusion v2训练等其他基准测试中，新一代的Blackwell 也以1.7倍的优势超过了前代产品。

值得注意的是，虽然Hopper 仍在继续展现出进步，但与上一轮MLPerf Training 基准测试相比，Hopper 在语言模型预训练中的性能也提高了1.3倍。这表明英伟达的技术持续在进步。在最近的GPT-3175B 基准测试中，英伟达提交了11，616个Hopper GPU，创下新的扩展记录。

关于Blackwell 的技术细节，英伟达表示，新的架构使用了优化的Tensor Cores 和更快速的高带宽内存。这使得GPT-3175B 基准测试的运行仅需64个GPU，而使用Hopper 平台则需要256个GPU 才能实现相同的性能。

英伟达在发布会上还强调了Hopper 代产品在软件和网络更新上的性能提升，预期Blackwell 也将随着未来的提交持续改进。此外，英伟达计划在明年推出下一代AI 加速器Blackwell Ultra，预计将提供更多的内存和更强的计算能力。

Blackwell在MLPerf Inference v4.1基准测试中也于去年九月首次亮相，在AI 推理方面，它的性能达到了每个GPU 比H100多出四倍的惊人成就，尤其是使用了更低的FP4精度。这一新趋势旨在应对低延迟聊天机器人和像OpenAI 的o1模型等智能计算需求的不断增长。

Blackwell平台的出色表现标志着AI加速器技术的一次重大飞跃，其在LLM训练和推理方面的性能提升将极大地推动AI技术的发展和应用。 Downcodes小编将持续关注Blackwell平台的后续发展，并带来更多相关报道。

​英伟达Blackwell平台发布：AI训练性能暴增2.2倍，GPU需求大幅减少！

英伟达Blackwell平台发布：AI训练性能暴增2.2倍，GPU需求大幅减少！