NVIDIA는 최근 150억 개의 매개변수를 갖고 다중 언어 및 코딩 작업에 탁월한 성능을 발휘하는 최신 범용 대형 모델 Nemotron-4를 출시했습니다. Nemotron-4는 Chinchilla 모델의 확장 법칙을 채택하고 컴퓨팅 예산, 데이터 및 모델 크기를 최적화하는 데 획기적인 발전을 이루었습니다. 성능은 동일한 규모의 다른 모델을 능가하여 현재 가장 강력한 범용 언어 모델 중 하나입니다. 목표는 단일 A100 또는 H100 GPU에서 실행되어 대형 모델의 효율성에 대한 새로운 벤치마크를 설정하는 것입니다. 이는 고성능 대형 모델 추구에 있어 상당한 진전을 의미합니다.
엔비디아는 다양한 언어와 코딩 작업에서 뛰어난 성능을 발휘하는 150억 개의 매개변수를 갖춘 범용 대형 모델인 Nemotron-4를 출시했습니다. 이 모델은 Chinchilla 모델의 확장 법칙을 채택하여 계산 예산, 데이터 및 모델 크기를 최적화하여 동일한 매개변수 규모의 모델을 능가하고 가장 강력한 일반 언어 모델이 되었습니다. Nemotron-4는 단일 A100 또는 H100 GPU에서 실행되어 대형 모델 분야의 새로운 표준을 설정하는 것을 목표로 합니다.
Nemotron-4의 출시는 대형 모델의 성능을 향상시킬 뿐만 아니라, 더 중요한 것은 단일 GPU에서의 실행을 목표로 대형 모델 사용의 문턱을 낮추고 더 많은 개발자와 연구자에게 편의성을 제공하며 대형 모델의 적용을 예고한다는 것입니다. .더 많은 대중화. 엔비디아의 이번 행보는 인공지능 기술 발전을 촉진하는 데 큰 의미가 있다.