ห้องปฏิบัติการปัญญาประดิษฐ์เซี่ยงไฮ้: การอัพเกรดโมเดลขนาดใหญ่ Scholar Puyu - บทความ AI

ผู้เขียน：Eve Cole เวลาอัปเดต：2025-01-28 18:32:01

เมื่อเร็วๆ นี้ ห้องปฏิบัติการปัญญาประดิษฐ์เซี่ยงไฮ้ (Shanghai Artificial Intelligence Laboratory) ได้ประกาศเมื่อเร็ว ๆ นี้ว่าแบบจำลองทางวิชาการที่พัฒนาตนเองของตน ได้รับการอัปเกรดครั้งใหญ่ และเปิดตัว Scholar Puyu 3.0 เวอร์ชันใหม่ (InternLM3) เวอร์ชันนี้ได้สร้างความก้าวหน้าครั้งสำคัญในด้านประสิทธิภาพการใช้ข้อมูลและประสิทธิภาพของโมเดล โดยได้รับประสิทธิภาพที่สูงขึ้นด้วยต้นทุนที่ต่ำลง และเป็นครั้งแรกที่ผสานรวมการสนทนาปกติและการคิดเชิงลึก ซึ่งช่วยปรับปรุงประสิทธิภาพของโมเดลในสถานการณ์การใช้งานจริงได้อย่างมาก การอัปเกรดนี้ไม่เพียงแต่บรรลุความก้าวหน้าทางเทคโนโลยีเท่านั้น แต่ยังสะท้อนถึงความมุ่งมั่นและความแข็งแกร่งของจีนในการสร้างสรรค์นวัตกรรมในด้านปัญญาประดิษฐ์ต่อไป

Shanghai Artificial Intelligence Laboratory ประกาศว่าแบบจำลองทางวิชาการได้รับการอัปเกรดเวอร์ชันที่สำคัญแล้ว และเปิดตัว Scholar Puyu 3.0 (InternLM3) จากข้อมูลของห้องปฏิบัติการ เวอร์ชันใหม่ได้ปรับปรุงประสิทธิภาพการใช้ข้อมูลอย่างมีนัยสำคัญผ่านกรอบข้อมูลที่ได้รับการปรับปรุง ทำให้มีความหนาแน่นในการคิดเพิ่มขึ้น

โมเดล InternLM3-8B-Instruct ที่อัปเกรดแล้วใช้ข้อมูลเพียง 4T ในการฝึกอบรม เจ้าหน้าที่กล่าวว่าประสิทธิภาพที่ครอบคลุมนั้นเหนือกว่ารุ่นโอเพ่นซอร์สที่มีขนาดเท่ากัน และประหยัดค่าใช้จ่ายในการฝึกอบรมได้มากกว่า 75% เป็นที่น่าสังเกตว่าเวอร์ชันนี้เป็นครั้งแรกที่ประสบความสำเร็จในการบูรณาการการสนทนาปกติและการคิดเชิงลึกในโมเดลทั่วไป ซึ่งสามารถรับมือกับสถานการณ์การใช้งานในชีวิตจริงที่หลากหลายได้ดีขึ้น

ในแง่ของการประเมินแบบจำลอง ทีมวิจัยได้ใช้วิธีการแบบครบวงจรและทำซ้ำได้สำหรับการประเมินตามเฟรมเวิร์กการประเมินโอเพ่นซอร์ส Sinan OpenCompass เนื้อหาการประเมินเกี่ยวข้องกับชุดการประเมินที่เชื่อถือได้มากกว่าสิบชุด เช่น CMMLU และ GPQA ครอบคลุมหลายมิติ เช่น การใช้เหตุผล คณิตศาสตร์ การเขียนโปรแกรม การปฏิบัติตามคำสั่ง การสร้างข้อความขนาดยาว บทสนทนา และประสิทธิภาพที่ครอบคลุม ผลการประเมินแสดงให้เห็นว่า Shusheng Puyu 3.0 เป็นผู้นำคะแนนในชุดการประเมินส่วนใหญ่ และประสิทธิภาพโดยรวมก็ใกล้เคียงกับ GPT-4o-mini มาก

Shanghai AI Laboratory ยังระบุด้วยว่าโมเดลเวอร์ชันใหม่นี้ได้กลายเป็นโมเดลการสนทนาสากลตัวแรกในชุมชนโอเพ่นซอร์สเพื่อรองรับการใช้งานเบราว์เซอร์ และสามารถรองรับการข้ามหน้าเว็บได้มากกว่า 20 ขั้นตอน จึงสามารถขุดเจาะลึกได้ ข้อมูล.

หน้าประสบการณ์: https://internlm-chat.intern-ai.org.cn

ไฮไลท์:

โมเดล Shusheng Puyu 3.0 ได้รับการฝึกฝนด้วยข้อมูล 4T และประสิทธิภาพที่ครอบคลุมนั้นเหนือกว่ารุ่นโอเพ่นซอร์สที่มีขนาดเดียวกัน ซึ่งช่วยประหยัดค่าใช้จ่ายในการฝึกอบรมได้มากกว่า 75%

คะแนนแบบจำลองเป็นผู้นำในชุดการประเมินที่เชื่อถือได้หลายชุด และการบูรณาการความสามารถในการคิดและการสนทนาได้รับการปรับปรุงอย่างมาก

รุ่นใหม่รองรับการใช้เบราว์เซอร์และสามารถดำเนินการขุดข้อมูลเชิงลึกได้ กลายเป็นหนึ่งในไฮไลท์ของชุมชนโอเพ่นซอร์ส

โดยรวมแล้ว การอัปเกรด Shusheng Puyu 3.0 แสดงให้เห็นถึงความก้าวหน้าที่สำคัญของจีนในด้านโมเดลภาษาขนาดใหญ่ วิธีการฝึกอบรมที่มีประสิทธิภาพและประสิทธิภาพอันทรงพลังนั้น คาดว่าจะช่วยส่งเสริมการประยุกต์ใช้เทคโนโลยีปัญญาประดิษฐ์ในสาขาต่างๆ ได้มากขึ้น และมันก็คุ้มค่าที่จะดู มุ่งหน้าสู่การพัฒนาในอนาคต