Scholar Puyu 2.5 โอเพ่นซอร์สน้ำหนักเบาพิเศษ 1.8B เวอร์ชันหลายพารามิเตอร์ 20B ประสิทธิภาพสูง

ผู้เขียน：Eve Cole เวลาอัปเดต：2024-12-06 17:16:01

ห้องปฏิบัติการปัญญาประดิษฐ์เซี่ยงไฮ้เปิดตัว InternLM2.5 เวอร์ชันล่าสุดของซีรีส์ Scholar Puyu ที่ฟอรัมหลัก WAIC Science Frontier เมื่อวันที่ 4 กรกฎาคม 2024 ความสามารถในการให้เหตุผลของเวอร์ชันนี้ในสถานการณ์ที่ซับซ้อนได้รับการปรับปรุงอย่างมีนัยสำคัญ รองรับบริบทที่ยาวเป็นพิเศษ 1 ล้านรายการ และดำเนินการค้นหาทางอินเทอร์เน็ตและบูรณาการข้อมูลได้อย่างอิสระ ซึ่งเป็นความก้าวหน้าครั้งสำคัญ บรรณาธิการของ Downcodes จะอธิบายรายละเอียดเกี่ยวกับฟังก์ชันและข้อมูลโอเพ่นซอร์สของ InternLM2.5

ห้องปฏิบัติการปัญญาประดิษฐ์เซี่ยงไฮ้ได้เปิดตัว InternLM2.5 โมเดลซีรีส์ Scholar Puyu เวอร์ชันใหม่ ที่ฟอรัมหลัก WAIC Science Frontier เมื่อวันที่ 4 กรกฎาคม 2024 ความสามารถในการให้เหตุผลของเวอร์ชันนี้ในสถานการณ์ที่ซับซ้อนได้รับการปรับปรุงอย่างครอบคลุม โดยรองรับบริบทที่ยาวเป็นพิเศษ 1 ล้านรายการ และสามารถทำการค้นหาทางอินเทอร์เน็ตและรวมข้อมูลจากหน้าเว็บหลายร้อยหน้าได้อย่างอิสระ

InternLM2.5 เปิดตัวโมเดลพารามิเตอร์สามเวอร์ชัน ได้แก่ 1.8B, 7B และ 20B เพื่อปรับให้เข้ากับสถานการณ์การใช้งานที่แตกต่างกันและความต้องการของนักพัฒนา รุ่น 1.8B เป็นรุ่นที่มีน้ำหนักเบาเป็นพิเศษ ในขณะที่รุ่น 20B ให้ประสิทธิภาพที่ครอบคลุมที่แข็งแกร่งกว่า และรองรับสถานการณ์ในทางปฏิบัติที่ซับซ้อนมากขึ้น โมเดลทั้งหมดเหล่านี้เป็นโอเพ่นซอร์สและสามารถพบได้ที่หน้าแรกของโมเดลขนาดใหญ่ของซีรีส์ Scholar·Puyu, หน้าแรกของ ModelScope และหน้าแรกของ Hugging Face

InternLM2.5 ทำซ้ำเทคโนโลยีการสังเคราะห์ข้อมูลหลายรายการ ซึ่งปรับปรุงความสามารถในการให้เหตุผลของแบบจำลองอย่างมีนัยสำคัญ โดยเฉพาะอย่างยิ่ง อัตราความแม่นยำของชุดการประเมินทางคณิตศาสตร์ MATH สูงถึง 64.7% นอกจากนี้ โมเดลยังปรับปรุงความสามารถในการประมวลผลความยาวบริบทผ่านการฝึกอบรมที่มีประสิทธิภาพในขั้นตอนก่อนการฝึกอบรม

โมเดลซีรีส์ InternLM2.5 ยังบรรลุการบูรณาการอย่างราบรื่นกับการอนุมานดาวน์สตรีมและเฟรมเวิร์กการปรับแต่งอย่างละเอียด รวมถึงเฟรมเวิร์กการปรับแต่ง XTuner และเฟรมเวิร์กการอนุมาน LMDeploy ที่พัฒนาขึ้นอย่างอิสระโดย Shanghai Artificial Intelligence Laboratory เช่นเดียวกับเฟรมเวิร์กอื่นๆ ที่มีฐานผู้ใช้ที่กว้างขวางใน ชุมชนเช่น vLLM และ Ollama และ llama.cpp เครื่องมือ SWIFT ที่เปิดตัวโดยชุมชน Moda ยังรองรับการอนุมาน การปรับแต่ง และการปรับใช้โมเดลซีรีส์ InternLM2.5

ประสบการณ์การใช้งานโมเดลเหล่านี้ประกอบด้วยการให้เหตุผลที่ซับซ้อนหลายขั้นตอน ความเข้าใจที่แม่นยำเกี่ยวกับจุดประสงค์ของการสนทนาแบบหลายรอบ การดำเนินการควบคุมรูปแบบที่ยืดหยุ่น และความสามารถในการปฏิบัติตามคำแนะนำที่ซับซ้อน คู่มือการติดตั้งและการใช้งานโดยละเอียดมีไว้เพื่ออำนวยความสะดวกให้นักพัฒนาในการเริ่มต้นอย่างรวดเร็ว

หน้าแรกของ Scholar·Puyu ซีรีส์ขนาดใหญ่:

https://internlm.intern-ai.org.cn

หน้าแรกของ ModelScope:

https://www.modelscope.cn/organization/Shanghai_AI_Laboratory?tab=model

หน้าแรกของกอดใบหน้า:

https://huggingface.co/internlm

ลิงก์โอเพ่นซอร์ส InternLM2.5:

https://github.com/InternLM/InternLM

การเปิดตัว InternLM2.5 แบบโอเพ่นซอร์สนำความเป็นไปได้ใหม่ๆ มาสู่การวิจัยและการใช้งานในด้านปัญญาประดิษฐ์ เชื่อกันว่าประสิทธิภาพอันทรงพลังและความสะดวกในการใช้งานจะดึงดูดนักพัฒนาจำนวนมากให้สำรวจและสร้างสรรค์ บรรณาธิการของ Downcodes รอคอยที่จะได้เห็นแอปพลิเคชั่นที่ยอดเยี่ยมมากขึ้นจาก InternLM2.5!