Nvidia недавно выпустила новую платформу Blackwell и продемонстрировала впечатляющие улучшения производительности в эталоне Mlperf Training 4.1. По сравнению с предыдущими платформами Hopper, Blackwell удвоил свою производительность в нескольких задачах обучения искусственного интеллекта, особенно на тренировке с крупной языковой моделью (LLM), и его эффективность значительно улучшилась. Этот прогресс прорыва указывает на еще один скачок в вычислительной мощности ИИ и закладывает прочную основу для широко распространенной реализации приложений ИИ в будущем. Эта статья проведет глубокий анализ эффективности платформы Blackwell и обсудит ее технологические инновации и будущее развитие.
Недавно NVIDIA выпустила свою новую платформу Blackwell и продемонстрировала предварительную производительность в эталоне Mlperf Training 4.1. Согласно результатам испытаний, производительность Блэквелла в некоторых аспектах удвоилась по сравнению с предыдущим поколением платформ Hopper, и это достижение привлекло широкое внимание от отрасли.
В тесте Mlperf Training4.1 платформа Blackwell достигала в 2,2 раза превышающей производительность каждого графического процессора в задаче тонкой настройки Llama270b контрольного эталона LLM (большая языковая модель) и в 2 раза превышает производительность каждого графического процессора в предварительном обучении GPT-3175B удваивается улучшение. Кроме того, в других критериях, таких как стабильная диффузия V2, новое поколение Blackwell также превзошло предыдущее поколение в 1,7 раза.
Стоит отметить, что, хотя Hopper продолжает демонстрировать улучшения, Hopper также имеет 1,3-кратное улучшение производительности в предварительной тренировке языковой модели по сравнению с предыдущим раундом ориентиров MLPERF Training. Это показывает, что технология Nvidia продолжает улучшаться. В недавнем тесте GPT-3175B NVIDIA представила 11 616 графических процессоров бункера, установив новую запись расширения.
Что касается технических деталей Блэквелла, NVIDIA сказал, что новая архитектура использует оптимизированные тензорные ядра и более быструю память с высокой пропускной способностью. Это делает его только 64 графическими процессорами для запуска эталона GPT-3175B, в то время как 256 графических процессоров для достижения той же производительности с использованием платформы Hopper.
Nvidia также подчеркнула улучшение производительности продуктов генерации Hopper в программном обеспечении и обновлениях сети на пресс -конференции, и ожидается, что Blackwell продолжит улучшаться с будущими представлениями. Кроме того, NVIDIA планирует запустить следующее поколение Accelerator Blackwell Ultra в следующем году, что, как ожидается, обеспечит больше памяти и более сильной вычислительной мощности.
Блэквелл также дебютировал в сентябре прошлого года в эталонном эталоне MLPERF V.4.1, и с точки зрения вывода ИИ он достигает в 4 раза больше удивительной производительности на графический процессор, чем в H100, особенно с более низкой сущностью точности FP4 Эта новая тенденция предназначена для удовлетворения растущего спроса на чат-ботов с низкой задержкой и интеллектуальные вычисления, такие как модель Operai O1.
Очки:
- ** Платформа Nvidia Blackwell удваивает свои результаты в обучении ИИ, нарушает отраслевые стандарты! **
- ** Blackwell требует только 64 графических процессоров в тесте GPT-3175B, значительно повышая эффективность! **
- ** Blackwell Ultra будет запущена в следующем году, что, как ожидается, обеспечит более высокую память и вычислительную мощность! **
Короче говоря, появление платформы Nvidia Blackwell знаменует собой большой прорыв в области компьютеров искусственного интеллекта. Его значительное улучшение производительности и будущий запуск Blackwell Ultra еще больше способствуют разработке и применению технологий ИИ и принесут больше возможностей для всех отраслей. У нас есть основания ожидать, что платформа Blackwell сыграет большую роль в будущем.