Редактор Downcodes узнал, что новейшая платформа Nvidia Blackwell показала потрясающие результаты в тесте производительности MLPerf Training 4.1 и значительно превзошла платформу Hopper предыдущего поколения. Результаты испытаний показывают, что компания Blackwell добилась значительного улучшения производительности в нескольких тестах производительности, что привлекло широкое внимание в отрасли и предвещает новый прорыв в технологии ускорителей искусственного интеллекта. В частности, Blackwell продемонстрировала впечатляющие преимущества в задачах тонкой настройки LLM и предварительной подготовки, открывая новые возможности для развития области искусственного интеллекта.
Недавно NVIDIA выпустила свою новую платформу Blackwell и продемонстрировала предварительную производительность в тесте производительности MLPerf Training4.1. Согласно результатам испытаний, производительность Blackwell по некоторым аспектам выросла вдвое по сравнению с платформой Hopper предыдущего поколения. Этот результат привлек широкое внимание в отрасли.
В тесте MLPerf Training4.1 платформа Blackwell достигла производительности в 2,2 раза выше производительности Hopper на каждый графический процессор в задаче точной настройки Llama270B теста LLM (Large Language Model) и в 2,2 раза при предварительном обучении GPT-3175B раз. улучшение. Кроме того, в других тестах производительности, таких как обучение Stable Diffusion v2, новое поколение Blackwell также превзошло продукт предыдущего поколения с преимуществом в 1,7 раза.
Примечательно, что хотя Hopper продолжает демонстрировать улучшения, он также повышает производительность предварительного обучения языковой модели в 1,3 раза по сравнению с предыдущим этапом теста MLPerf Training. Это показывает, что технологии Nvidia продолжают совершенствоваться. В недавнем тесте GPT-3175B компания Nvidia представила 11 616 графических процессоров Hopper, установив новый рекорд масштабирования.
Что касается технических деталей Blackwell, Nvidia заявила, что в новой архитектуре используются оптимизированные тензорные ядра и более быстрая память с высокой пропускной способностью. Это позволяет запускать тест GPT-3175B всего на 64 графических процессорах, тогда как при использовании платформы Hopper для достижения той же производительности потребуется 256 графических процессоров.
Nvidia также подчеркнула на пресс-конференции повышение производительности продуктов поколения Hopper в обновлениях программного обеспечения и сети, и ожидается, что Blackwell продолжит совершенствоваться в будущих предложениях. Кроме того, в следующем году NVIDIA планирует выпустить ускоритель искусственного интеллекта следующего поколения Blackwell Ultra, который, как ожидается, обеспечит больше памяти и более высокую вычислительную мощность.
Blackwell также дебютировала в сентябре прошлого года в тесте MLPerf Inference v4.1, добившись впечатляющего четырехкратного повышения производительности на каждый графический процессор по сравнению с H100 в тесте AI-вывода, особенно при использовании более низкой точности FP4. Эта новая тенденция направлена на удовлетворение растущего спроса на чат-боты с малой задержкой и интеллектуальные вычисления, такие как модель o1 OpenAI.
Выдающаяся производительность платформы Blackwell знаменует собой большой шаг вперед в технологии ускорителей искусственного интеллекта, а улучшение производительности в обучении и выводах LLM будет в значительной степени способствовать разработке и применению технологий искусственного интеллекта. Редактор Downcodes продолжит уделять внимание дальнейшему развитию платформы Blackwell и публиковать дополнительные отчеты по этой теме.