NVIDIA เพิ่งเปิดตัว Nemotron-4 รุ่นใหญ่สำหรับใช้งานทั่วไปรุ่นล่าสุด ซึ่งมีพารามิเตอร์ถึง 15 พันล้านพารามิเตอร์และทำงานได้ดีในหลายภาษาและงานเขียนโค้ด Nemotron-4 ใช้กฎมาตราส่วนของโมเดล Chinchilla และได้สร้างความก้าวหน้าในการเพิ่มประสิทธิภาพงบประมาณในการประมวลผล ข้อมูล และขนาดโมเดล โดยมีประสิทธิภาพสูงกว่ารุ่นอื่นๆ ในขนาดเดียวกัน ทำให้เป็นหนึ่งในโมเดลภาษาสำหรับวัตถุประสงค์ทั่วไปที่ทรงพลังที่สุดในปัจจุบัน เป้าหมายคือสามารถทำงานบน GPU A100 หรือ H100 ตัวเดียวได้ ซึ่งเป็นการสร้างมาตรฐานใหม่สำหรับประสิทธิภาพของรุ่นขนาดใหญ่ สิ่งนี้ถือเป็นความก้าวหน้าครั้งสำคัญในการแสวงหาโมเดลขนาดใหญ่ที่มีประสิทธิภาพสูง
NVIDIA ได้เปิดตัว Nemotron-4 ซึ่งเป็นโมเดลขนาดใหญ่สำหรับใช้งานทั่วไปซึ่งมีพารามิเตอร์ถึง 15 พันล้านพารามิเตอร์ที่ทำงานได้ดีในหลายภาษาและงานเขียนโค้ด โมเดลนี้ใช้กฎการปรับขนาดของโมเดล Chinchilla เพื่อเพิ่มประสิทธิภาพงบประมาณการคำนวณ ข้อมูล และขนาดโมเดล ให้เหนือกว่าโมเดลที่มีขนาดพารามิเตอร์เดียวกัน และกลายเป็นโมเดลภาษาทั่วไปที่ทรงพลังที่สุด Nemotron-4 ตั้งเป้าที่จะทำงานบน GPU A100 หรือ H100 ตัวเดียว ซึ่งเป็นการสร้างมาตรฐานใหม่ในด้านโมเดลขนาดใหญ่
การเปิดตัว Nemotron-4 ไม่เพียงแต่ปรับปรุงประสิทธิภาพของโมเดลขนาดใหญ่เท่านั้น แต่ที่สำคัญกว่านั้นคือ เป้าหมายในการทำงานบน GPU ตัวเดียวจะช่วยลดเกณฑ์ในการใช้โมเดลขนาดใหญ่ ให้ความสะดวกสบายสำหรับนักพัฒนาและนักวิจัยมากขึ้น และถือเป็นการประกาศถึงการใช้งานโมเดลขนาดใหญ่ . ประชาสัมพันธ์ต่อไป. การเคลื่อนไหวของ Nvidia มีความสำคัญอย่างยิ่งในการส่งเสริมการพัฒนาเทคโนโลยีปัญญาประดิษฐ์