เมื่อปลายปีนี้ บริษัท Beijing Zhipu Huazhang Technology Co., Ltd. ได้เปิดตัว GLM-Zero เวอร์ชันแรก ซึ่งเป็นโมเดลการอนุมานตัวแรกที่ได้รับการฝึกอบรมโดยใช้เทคโนโลยีการเรียนรู้แบบเสริมกำลังแบบขยาย - GLM-Zero-Preview โมเดลนี้แสดงให้เห็นถึงความสามารถอันยอดเยี่ยมในด้านตรรกะทางคณิตศาสตร์ การเขียนโค้ด และการให้เหตุผลของปัญหาที่ซับซ้อน และได้ผลลัพธ์ที่เทียบเท่ากับโมเดล OpenAI ที่คล้ายกันในการประเมินที่เชื่อถือได้หลายครั้ง GLM-Zero-Preview ไม่เพียงแต่ปรับปรุงขีดความสามารถของงานของผู้เชี่ยวชาญเท่านั้น แต่ยังรักษาประสิทธิภาพที่ยอดเยี่ยมสำหรับงานทั่วไป โดยสร้างมาตรฐานใหม่สำหรับการปรับปรุงความสามารถในการให้เหตุผลของปัญญาประดิษฐ์
เมื่อสิ้นปีสำหรับ Beijing Zhipu Huazhang Technology Co., Ltd. บริษัทได้เปิดตัวแบบจำลองการอนุมานตัวแรกที่ได้รับการฝึกอบรมโดยใช้เทคโนโลยีการเรียนรู้แบบเสริมกำลังแบบขยาย ซึ่งเป็นเวอร์ชันแรกของ GLM-Zero, GLM-Zero-Preview แบบจำลองนี้มุ่งเน้นไปที่การปรับปรุงความสามารถในการให้เหตุผลของปัญญาประดิษฐ์ โดยเฉพาะอย่างยิ่งในตรรกะทางคณิตศาสตร์ การเขียนโค้ด และการประมวลผลปัญหาที่ซับซ้อนที่ต้องใช้การให้เหตุผลเชิงลึก เมื่อเปรียบเทียบกับรุ่นพื้นฐานแล้ว GLM-Zero-Preview ได้ปรับปรุงขีดความสามารถของงานระดับผู้เชี่ยวชาญอย่างมีนัยสำคัญ ในขณะที่ยังคงรักษาขีดความสามารถของงานทั่วไปในการประเมิน AIME2024, MATH500 และ LiveCodeBench นั้นเทียบเท่ากับ OpenAI o1-preview
ขณะนี้ผู้ใช้สามารถสัมผัสประสบการณ์ GLM-Zero-Preview ได้ฟรีในตัวแทน "Zero Inference Model" ของแพลตฟอร์ม Zhipu Qingyan แพลตฟอร์มดังกล่าวรองรับการอัปโหลดข้อความและรูปภาพ และโมเดลจะแสดงกระบวนการให้เหตุผลโดยสมบูรณ์ ในเวลาเดียวกัน นักพัฒนายังสามารถเรียกโมเดลนี้ผ่าน API ของแพลตฟอร์มเปิด Zhipu
แม้ว่า GLM-Zero-Preview และโมเดล o3 ของ OpenAI ยังมีช่องว่างอยู่บ้าง แต่บริษัท Zhipu Huazhang Technology Co., Ltd. มีแผนที่จะเพิ่มประสิทธิภาพเทคโนโลยีการเรียนรู้แบบเสริมแรงแบบวนซ้ำต่อไป และจะเปิดตัว GLM-Zero เวอร์ชันอย่างเป็นทางการเร็วๆ นี้ เพื่อขยายขีดความสามารถ ของการคิดเชิงลึกตั้งแต่ตรรกะทางคณิตศาสตร์ไปจนถึงขอบเขตเทคโนโลยีทั่วไปเพิ่มเติม
ในแง่ของประสิทธิภาพของโมเดล GLM-Zero-Preview แสดงให้เห็นถึงความสำคัญของการเรียนรู้แบบเสริมกำลังในการเพิ่มความสามารถในการให้เหตุผลเชิงลึกของโมเดล เมื่อปริมาณการฝึกอบรมเพิ่มขึ้น ประสิทธิภาพของแบบจำลองในด้านต่างๆ เช่น การใช้เหตุผลเชิงลึกก็ได้รับการปรับปรุงอย่างต่อเนื่อง กฎมาตราส่วนของแบบจำลองในขั้นตอนการอนุมานได้รับการตรวจสอบแล้วเช่นกัน กล่าวคือ เนื่องจากจำนวนโทเค็นที่แบบจำลองสามารถคิดได้เพิ่มขึ้นและจำเป็นต้องมีการคำนวณมากขึ้น คุณภาพของผลลัพธ์ที่ได้รับจากแบบจำลองก็ดีขึ้นอย่างต่อเนื่องเช่นกัน GLM-Zero-Preview สามารถตระหนักถึงการตัดสินใจด้วยตนเอง การสลายตัวของปัญหา และลองหลายวิธีในการแก้ปัญหาในระหว่างกระบวนการให้เหตุผล ซึ่งคล้ายกับกระบวนการคิดและการตัดสินใจของมนุษย์
ในกรณีทดสอบจริง GLM-Zero-Preview แสดงให้เห็นถึงความสามารถในการระบุช่องโหว่เชิงตรรกะและจำลองสมมติฐานหลายประการในแง่ของการใช้เหตุผลเชิงตรรกะ ในแง่ของคณิตศาสตร์ โมเดลนี้มีความสามารถในการอุปนัยและนิรนัยที่แข็งแกร่ง สามารถจัดการกับการดำเนินการทางคณิตศาสตร์ที่ซับซ้อนได้อย่างรวดเร็ว และก้าวขึ้นสู่ระดับนักศึกษาระดับบัณฑิตศึกษาที่มีความโดดเด่นในการทดสอบคณิตศาสตร์เพื่อการสอบเข้าระดับสูงกว่าปริญญาตรี I ปี 2025 ในด้านการเขียนโปรแกรม GLM-Zero-Preview มีความเชี่ยวชาญในการใช้ภาษาการเขียนโปรแกรมได้หลายภาษาและช่วยให้นักพัฒนาเขียนโค้ดได้รวดเร็ว
สเปกตรัมภูมิปัญญา คำที่ชัดเจน:
https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh
แพลตฟอร์มเปิด Zipu:
https://bigmodel.cn/dev/api/normal-model/glm-zero-preview
การเปิดตัว GLM-Zero-Preview แสดงให้เห็นว่า Zhipu Huazhang มีความก้าวหน้าอย่างมากในด้านการใช้เหตุผลด้านปัญญาประดิษฐ์ นอกจากนี้ กลยุทธ์แบบเปิดและเสรียังช่วยอำนวยความสะดวกให้กับนักพัฒนาและผู้ใช้งาน รวมถึงได้รับคำติชม โดยให้ข้อมูลอันมีคุณค่าสำหรับการปรับปรุงโมเดลในอนาคตซ้ำๆ เราหวังว่าจะเปิดตัว GLM-Zero เวอร์ชันอย่างเป็นทางการเพื่อส่งเสริมความก้าวหน้าของเทคโนโลยีปัญญาประดิษฐ์ต่อไป