NVIDIA недавно выпустила свою новейшую большую модель общего назначения Nemotron-4, которая имеет 15 миллиардов параметров и хорошо справляется с задачами мультиязычности и кодирования. Nemotron-4 использует закон масштабирования модели Chinchilla и добился прорыва в оптимизации вычислительного бюджета, данных и размера модели. Его производительность превосходит другие модели того же масштаба, что делает его одной из самых мощных языковых моделей общего назначения в настоящее время. Цель состоит в том, чтобы иметь возможность работать на одном графическом процессоре A100 или H100, устанавливая новый стандарт эффективности больших моделей. Это знаменует собой значительный прогресс в создании высокопроизводительных больших моделей.
NVIDIA выпустила Nemotron-4, большую модель общего назначения с 15 миллиардами параметров, которая хорошо работает на нескольких языках и в задачах кодирования. Модель использует закон масштабирования модели Шиншилла для оптимизации бюджета вычислений, данных и размера модели, превосходя модели с тем же масштабом параметров и становясь самой мощной общей языковой моделью. Nemotron-4 предназначен для работы на одном графическом процессоре A100 или H100, устанавливая новый стандарт в области больших моделей.
Выпуск Nemotron-4 не только повышает производительность больших моделей, но, что более важно, его цель работы на одном графическом процессоре снижает порог использования больших моделей, обеспечивает удобство для большего числа разработчиков и исследователей и предвещает применение больших моделей. , дальнейшая популяризация. Этот шаг Nvidia имеет большое значение для содействия развитию технологий искусственного интеллекта.