บรรณาธิการของ Downcodes ได้เรียนรู้ว่าแพลตฟอร์ม Blackwell ล่าสุดของ Nvidia ทำงานได้ดีอย่างน่าทึ่งในการทดสอบเกณฑ์มาตรฐาน MLPerf Training 4.1 และประสิทธิภาพของมันนั้นเหนือกว่าแพลตฟอร์ม Hopper รุ่นก่อนหน้าอย่างมาก ผลการทดสอบแสดงให้เห็นว่า Blackwell ประสบความสำเร็จในการปรับปรุงประสิทธิภาพอย่างมีนัยสำคัญในการทดสอบเกณฑ์มาตรฐานหลายรายการ ซึ่งดึงดูดความสนใจอย่างกว้างขวางในอุตสาหกรรม และถือเป็นการประกาศความก้าวหน้าครั้งใหม่ในเทคโนโลยีตัวเร่ง AI โดยเฉพาะอย่างยิ่ง Blackwell ได้แสดงให้เห็นถึงข้อได้เปรียบที่น่าประทับใจในการปรับแต่ง LLM และงานก่อนการฝึกอบรม ซึ่งนำความเป็นไปได้ใหม่มาสู่การพัฒนาสาขา AI
เมื่อเร็วๆ นี้ NVIDIA เปิดตัวแพลตฟอร์ม Blackwell ใหม่และสาธิตประสิทธิภาพเบื้องต้นในการทดสอบเกณฑ์มาตรฐาน MPerf Training4.1 จากผลการทดสอบ ประสิทธิภาพของ Blackwell ในบางด้านเพิ่มขึ้นเป็นสองเท่าเมื่อเทียบกับแพลตฟอร์ม Hopper รุ่นก่อนหน้า ผลลัพธ์นี้ดึงดูดความสนใจอย่างกว้างขวางในอุตสาหกรรม
ในเกณฑ์มาตรฐาน MLPerf Training4.1 แพลตฟอร์ม Blackwell ได้รับประสิทธิภาพ 2.2 เท่าของ Hopper ต่อ GPU ในงานปรับแต่ง Llama270B ของเกณฑ์มาตรฐาน LLM (Large Language Model) และ 2.2 เท่าในการฝึกอบรมล่วงหน้าของ GPT-3175B เท่า การปรับปรุง. นอกจากนี้ ในการทดสอบเกณฑ์มาตรฐานอื่นๆ เช่น การฝึกอบรม Stable Diffusion v2 นั้น Blackwell รุ่นใหม่ยังเหนือกว่าผลิตภัณฑ์รุ่นก่อนหน้าด้วยข้อได้เปรียบ 1.7 เท่า
ที่น่าสังเกตคือ แม้ว่า Hopper ยังคงแสดงการปรับปรุงอย่างต่อเนื่อง แต่ก็ยังปรับปรุงประสิทธิภาพในการฝึกอบรมล่วงหน้าของโมเดลภาษาด้วยปัจจัย 1.3 เมื่อเทียบกับเกณฑ์มาตรฐาน MLPerf Training รอบที่แล้ว นี่แสดงให้เห็นว่าเทคโนโลยีของ Nvidia มีการปรับปรุงอย่างต่อเนื่อง ในเกณฑ์มาตรฐาน GPT-3175B ล่าสุด ทาง Nvidia ได้ส่ง Hopper GPU จำนวน 11,616 ตัว ซึ่งสร้างสถิติการปรับขนาดใหม่
เกี่ยวกับรายละเอียดทางเทคนิคของ Blackwell นั้น Nvidia กล่าวว่าสถาปัตยกรรมใหม่ใช้ Tensor Cores ที่ได้รับการปรับปรุงและหน่วยความจำแบนด์วิธสูงที่เร็วขึ้น ซึ่งช่วยให้สามารถรันเกณฑ์มาตรฐาน GPT-3175B บน GPU เพียง 64 ตัว ในขณะที่การใช้แพลตฟอร์ม Hopper จะต้องใช้ GPU 256 ตัวเพื่อให้ได้ประสิทธิภาพเท่ากัน
Nvidia ยังเน้นย้ำถึงการปรับปรุงประสิทธิภาพของผลิตภัณฑ์รุ่น Hopper ในการอัปเดตซอฟต์แวร์และเครือข่ายในงานแถลงข่าว และคาดว่า Blackwell จะปรับปรุงต่อไปพร้อมกับการส่งผลงานในอนาคต นอกจากนี้ NVIDIA มีแผนที่จะเปิดตัวเครื่องเร่งความเร็ว AI รุ่นต่อไป Blackwell Ultra ในปีหน้า ซึ่งคาดว่าจะเพิ่มหน่วยความจำและพลังการประมวลผลที่แข็งแกร่งยิ่งขึ้น
Blackwell ยังเปิดตัวเมื่อเดือนกันยายนปีที่แล้วโดยใช้เกณฑ์มาตรฐาน MLPerf Inference v4.1 ซึ่งได้รับประสิทธิภาพต่อ GPU ที่น่าประทับใจมากกว่า H100 ในการอนุมาน AI ถึงสี่เท่า โดยเฉพาะอย่างยิ่งเมื่อใช้ความแม่นยำ FP4 ที่ต่ำกว่า เทรนด์ใหม่นี้มีจุดมุ่งหมายเพื่อตอบสนองความต้องการที่เพิ่มขึ้นสำหรับแชทบอทที่มีความหน่วงต่ำและการประมวลผลอัจฉริยะ เช่น โมเดล o1 ของ OpenAI
ประสิทธิภาพที่โดดเด่นของแพลตฟอร์ม Blackwell ถือเป็นก้าวกระโดดครั้งสำคัญในเทคโนโลยีเร่ง AI และการปรับปรุงประสิทธิภาพในการฝึกอบรมและการอนุมาน LLM จะส่งเสริมการพัฒนาและการประยุกต์ใช้เทคโนโลยี AI อย่างมาก บรรณาธิการของ Downcodes จะยังคงให้ความสนใจกับการพัฒนาแพลตฟอร์ม Blackwell ต่อไป และนำเสนอรายงานที่เกี่ยวข้องเพิ่มเติม