NVIDIA merilis Nemotron-4: model besar universal dengan 15 miliar parameter, target tunggal A100/H100 dapat dijalankan

Penulis：Eve Cole Waktu Pembaruan：2025-02-07 18:48:02

NVIDIA baru-baru ini merilis model besar terbaru untuk keperluan umum Nemotron-4, yang memiliki 15 miliar parameter dan berkinerja baik dalam tugas multi-bahasa dan pengkodean. Nemotron-4 mengadopsi hukum penskalaan model Chinchilla dan telah membuat terobosan dalam mengoptimalkan anggaran komputasi, data, dan ukuran model. Kinerjanya melebihi model lain dengan skala yang sama, menjadikannya salah satu model bahasa tujuan umum yang paling kuat saat ini. Tujuannya adalah untuk dapat berjalan pada satu GPU A100 atau H100, sehingga menetapkan tolok ukur baru untuk efisiensi model besar. Hal ini menandai kemajuan signifikan dalam upaya mewujudkan model besar berperforma tinggi.

NVIDIA telah merilis Nemotron-4, model besar serba guna dengan 15 miliar parameter yang bekerja dengan baik dalam berbagai bahasa dan tugas pengkodean. Model ini mengadopsi hukum penskalaan model Chinchilla untuk mengoptimalkan anggaran penghitungan, data, dan ukuran model, melampaui model dengan skala parameter yang sama dan menjadi model bahasa umum yang paling kuat. Nemotron-4 bertujuan untuk berjalan pada satu GPU A100 atau H100, menetapkan standar baru di bidang model besar.

Peluncuran Nemotron-4 tidak hanya meningkatkan kinerja model besar, namun yang lebih penting, tujuannya untuk berjalan pada satu GPU menurunkan ambang batas penggunaan model besar, memberikan kenyamanan bagi lebih banyak pengembang dan peneliti, dan menandai penerapan model besar. . mempopulerkan lebih lanjut. Langkah Nvidia sangat penting dalam mendorong perkembangan teknologi kecerdasan buatan.