Editor Downcodes mengetahui bahwa platform Blackwell terbaru Nvidia berkinerja luar biasa dalam uji benchmark MLPerf Training 4.1, dan kinerjanya jauh melebihi platform Hopper generasi sebelumnya. Hasil pengujian menunjukkan bahwa Blackwell telah mencapai peningkatan kinerja yang signifikan dalam beberapa pengujian benchmark, yang telah menarik perhatian luas di industri dan menandai terobosan baru dalam teknologi akselerator AI. Secara khusus, Blackwell telah menunjukkan keunggulan yang mengesankan dalam tugas-tugas penyempurnaan dan pra-pelatihan LLM, membawa kemungkinan-kemungkinan baru dalam pengembangan bidang AI.
Baru-baru ini, NVIDIA merilis platform Blackwell barunya dan mendemonstrasikan kinerja awal dalam uji benchmark MLPerf Training4.1. Berdasarkan hasil pengujian, kinerja Blackwell dalam beberapa aspek meningkat dua kali lipat dibandingkan platform Hopper generasi sebelumnya.
Dalam benchmark MLPerf Training4.1, platform Blackwell mencapai 2,2 kali kinerja Hopper per GPU dalam tugas penyempurnaan Llama270B dari benchmark LLM (Large Language Model), dan 2,2 kali dalam waktu pra-pelatihan GPT-3175B peningkatan. Selain itu, pada pengujian benchmark lainnya seperti pelatihan Stable Diffusion v2, Blackwell generasi baru juga mengungguli produk generasi sebelumnya dengan keunggulan 1,7 kali lipat.
Khususnya, meskipun Hopper terus menunjukkan peningkatan, performa dalam pra-pelatihan model bahasa juga meningkat sebesar 1,3 kali lipat dibandingkan putaran benchmark Pelatihan MLPerf sebelumnya. Hal ini menunjukkan bahwa teknologi Nvidia terus berkembang. Dalam benchmark GPT-3175B baru-baru ini, Nvidia mengirimkan 11.616 GPU Hopper, yang mencetak rekor penskalaan baru.
Mengenai detail teknis Blackwell, Nvidia mengatakan bahwa arsitektur baru tersebut menggunakan Tensor Cores yang dioptimalkan dan memori bandwidth tinggi yang lebih cepat. Hal ini memungkinkan benchmark GPT-3175B dijalankan hanya pada 64 GPU, sedangkan menggunakan platform Hopper akan membutuhkan 256 GPU untuk mencapai performa yang sama.
Nvidia juga menekankan peningkatan kinerja produk generasi Hopper dalam pembaruan perangkat lunak dan jaringan pada konferensi pers, dan Blackwell diperkirakan akan terus meningkat dengan pengajuan di masa mendatang. Selain itu, NVIDIA berencana meluncurkan akselerator AI generasi berikutnya Blackwell Ultra pada tahun depan, yang diharapkan dapat memberikan lebih banyak memori dan daya komputasi lebih kuat.
Blackwell juga memulai debutnya pada bulan September lalu pada benchmark MLPerf Inference v4.1, mencapai kinerja per GPU empat kali lebih banyak dibandingkan H100 dalam inferensi AI, terutama menggunakan presisi FP4 yang lebih rendah. Tren baru ini bertujuan untuk mengatasi meningkatnya permintaan akan chatbot berlatensi rendah dan komputasi cerdas seperti model o1 OpenAI.
Kinerja luar biasa dari platform Blackwell menandai lompatan besar dalam teknologi akselerator AI, dan peningkatan kinerjanya dalam pelatihan dan inferensi LLM akan sangat mendorong pengembangan dan penerapan teknologi AI. Editor Downcodes akan terus memperhatikan perkembangan selanjutnya dari platform Blackwell dan membawa lebih banyak laporan terkait.