MiniMax เปิดตัว abab6 ซึ่งเป็นโมเดลภาษาขนาดใหญ่ MoE ตัวแรกของจีน เมื่อวันที่ 16 มกราคม 2024 ถือเป็นความก้าวหน้าครั้งใหม่ในด้านโมเดลภาษาขนาดใหญ่ในประเทศของฉัน โมเดล abab6 ใช้สถาปัตยกรรม MoE มีความสามารถในการจัดการงานที่ซับซ้อน และสามารถฝึกอบรมข้อมูลได้มากขึ้นต่อหน่วยเวลา ซึ่งแสดงให้เห็นถึงข้อได้เปรียบที่สำคัญในด้านประสิทธิภาพและประสิทธิภาพ เมื่อเปรียบเทียบกับเวอร์ชันก่อนหน้า abab6 ได้รับการปรับปรุงในหลาย ๆ ด้าน เช่น การปฏิบัติตามคำสั่ง ความสามารถด้านภาษาจีนและอังกฤษที่ครอบคลุม ฯลฯ และยังเหนือกว่าโมเดลภาษาขนาดใหญ่ชั้นนำของโลกบางรุ่นอีกด้วย
MiniMax เปิดตัว abab6 ซึ่งเป็นโมเดลภาษาขนาดใหญ่ MoE ตัวแรกของจีนเมื่อวันที่ 16 มกราคม 2024 โมเดลนี้ใช้สถาปัตยกรรม MoE และมีความสามารถในการจัดการกับงานที่ซับซ้อน และสามารถฝึกข้อมูลได้มากขึ้นต่อหน่วยเวลา ผลการประเมินแสดงให้เห็นว่า abab6 เหนือกว่า abab5.5 เวอร์ชันก่อนหน้าในด้านการปฏิบัติตามคำสั่ง ความสามารถด้านภาษาจีนที่ครอบคลุม และความสามารถด้านภาษาอังกฤษอย่างครอบคลุม และเหนือกว่ารุ่นภาษาขนาดใหญ่อื่นๆ เช่น GPT-3.5 abab6 ได้แสดงให้เห็นถึงความสามารถที่โดดเด่น เช่น การสอนปัญหาคณิตศาสตร์ให้กับเด็กๆ และการช่วยสร้างเกมกระดานเกี่ยวกับเซี่ยงไฮ้ ในฐานะโมเดลภาษาขนาดใหญ่ MoE ตัวแรกในประเทศจีน abab6 ทำงานได้ดีในการจัดการงานที่ซับซ้อน
การเปิดตัว abab6 ไม่เพียงแต่ปรับปรุงระดับทางเทคนิคของโมเดลภาษาขนาดใหญ่ในประเทศเท่านั้น แต่ยังวางรากฐานที่มั่นคงสำหรับการพัฒนาแอปพลิเคชันปัญญาประดิษฐ์อย่างกว้างขวางในอนาคต ประสิทธิภาพที่ยอดเยี่ยมในการประมวลผลงานที่ซับซ้อนบ่งบอกถึงศักยภาพที่ยอดเยี่ยมของสถาปัตยกรรม MoE ในสาขานี้ ฉันเชื่อว่าโมเดลที่ยอดเยี่ยมอื่นๆ ที่ใช้สถาปัตยกรรม MoE จะปรากฏขึ้นในอนาคต โดยส่งเสริมความก้าวหน้าอย่างต่อเนื่องของเทคโนโลยีปัญญาประดิษฐ์