โมเดลการอนุมาน Marco-o1 ที่ทีมงาน AI นานาชาติของอาลีบาบาเปิดตัวเมื่อเร็วๆ นี้ แสดงให้เห็นถึงศักยภาพที่สำคัญในการแก้ปัญหาแบบเปิด โดยทลายข้อจำกัดของโมเดลแบบดั้งเดิมที่จำกัดเฉพาะขอบเขตคำตอบมาตรฐาน และมุ่งมั่นที่จะสำรวจแอปพลิเคชันในพื้นที่ที่ยากต่อการหาปริมาณและขาดผลตอบแทนที่ชัดเจน คุณลักษณะหลักของโมเดลนี้อยู่ที่วิธีการฝึกอบรมที่เป็นเอกลักษณ์และกลยุทธ์การขยายพื้นที่โซลูชัน ซึ่งช่วยให้สามารถจัดการกับงานที่ซับซ้อนและยากอีกต่อไป เช่น การแปลประโยคที่ยาวและยาก และแสดงให้เห็นถึงความสามารถในการให้เหตุผลที่แข็งแกร่งในการค่อยๆ รื้อปัญหา และในที่สุด ให้คำตอบที่ถูกต้อง โอเพ่นซอร์สของ Marco-o1 ยังมอบทรัพยากรอันมีค่าให้กับชุมชนการวิจัย AI
เมื่อเร็วๆ นี้ ทีม AI นานาชาติของอาลีบาบาได้เปิดตัวโมเดลการให้เหตุผลใหม่ที่เรียกว่า Marco-o1 ซึ่งให้ความสนใจเป็นพิเศษกับการแก้ปัญหาแบบเปิด และไม่จำกัดเฉพาะสาขาวิชาที่มีคำตอบมาตรฐาน เช่น การเขียนโปรแกรมและคณิตศาสตร์ ทีมวิจัยมุ่งมั่นที่จะสำรวจว่าแบบจำลองดังกล่าวสามารถสรุปได้อย่างมีประสิทธิภาพในพื้นที่ที่ยากต่อการหาปริมาณและขาดผลตอบแทนที่ชัดเจนหรือไม่
คุณลักษณะของโมเดล Marco-o1 ได้แก่ การใช้ข้อมูล CoT ที่ยาวเป็นพิเศษสำหรับการปรับแต่งอย่างละเอียด การใช้ MCTS เพื่อขยายพื้นที่โซลูชัน และการขยายพื้นที่โซลูชันแบบละเอียด โมเดลนี้ใช้การเล่นด้วยตนเอง+MCTS เพื่อสร้างชุดข้อมูล CoT ที่ยาวเป็นพิเศษพร้อมความสามารถในการสะท้อนและแก้ไข และได้รับการฝึกร่วมกับข้อมูลโอเพ่นซอร์สอื่นๆ นอกจากนี้ ทีมวิจัยยังกำหนดขั้นตอนย่อยเพื่อขยายพื้นที่โซลูชันของแบบจำลองเพิ่มเติม และชี้แนะแบบจำลองเพื่อให้ได้คำตอบที่ดีขึ้น
ในงานแปล แบบจำลอง Marco-o1 แสดงให้เห็นถึงความสามารถในการจัดการการแปลประโยคที่ยาวและยาก นี่เป็นครั้งแรกที่มีการนำการขยายเวลาการอนุมานไปใช้กับงานการแปลด้วยเครื่อง ทีมวิจัยได้โอเพ่นซอร์สข้อมูล CoT บางส่วนและแบบจำลองปัจจุบันที่ดีที่สุด และวางแผนที่จะเปิดข้อมูลและแบบจำลองเพิ่มเติมในอนาคต
แบบจำลองจะคิดอย่างลึกซึ้งเกี่ยวกับการตอบสนองเมื่อให้เหตุผล เช่น เมื่อส่งออกตัวเลข 'r's ในคำว่า 'strawberry' แบบจำลองจะค่อยๆ แยกตัวอักษรแต่ละตัวในคำนั้นออกแล้วเปรียบเทียบ และผลลัพธ์ที่ได้ก็ถูกต้องในที่สุด ในด้านการแปลด้วยเครื่อง แบบจำลองจะระบุจุดที่ยากได้อย่างถูกต้องผ่านลิงก์อนุมาน และแปลทีละคำ ซึ่งช่วยเพิ่มความแม่นยำในการแปลโดยรวม
ทีมวิจัยยังได้ทดลองในสาขาอื่นๆ อีกด้วย ซึ่งพิสูจน์ให้เห็นถึงความสามารถของแบบจำลองในการแก้ปัญหาทั่วไปอื่นๆ ในโลกแห่งความเป็นจริง โครงสร้างโดยรวมของ Marco-o1 ใช้การเล่นเอง+MCTS เพื่อสร้างชุดข้อมูล CoT ที่ยาวเป็นพิเศษพร้อมความสามารถในการสะท้อนและแก้ไข และฝึกร่วมกับข้อมูลโอเพ่นซอร์สอื่นๆ ทีมวิจัยยังได้รวมชุดข้อมูลการปฏิบัติตามคำสั่งบางอย่างจากตระกูล MarcoPolo เพื่อปรับปรุงความสามารถในการปฏิบัติตามคำสั่งของโมเดล
ในแง่ของการใช้งาน ทีมวิจัยจะจัดเตรียมโค้ดการอนุมานและโค้ดการปรับแต่ง ผู้ใช้สามารถโหลดโมเดลและโทเค็นไนเซอร์ และเริ่มแชทหรือปรับแต่งโมเดลได้อย่างง่ายดาย นอกจากนี้ โมเดลยังสามารถรันได้โดยตรงบนเวอร์ชัน GGUF บน ModelScope ซึ่งช่วยให้สัมผัสประสบการณ์ได้รวดเร็วยิ่งขึ้น
การเปิดตัวโมเดล Marco-o1 ถือเป็นก้าวสำคัญที่ทีม AI นานาชาติของอาลีบาบาดำเนินการในด้านโมเดลการอนุมาน โดยให้แนวคิดและเครื่องมือใหม่ๆ ในการแก้ปัญหาแบบเปิด
ขอบเขตโมเดล:
https://modelscope.cn/models/AIDC-AI/Marco-o1
อาร์ซิฟ:
https://arxiv.org/abs/2411.14405
Github:
https://github.com/AIDC-AI/Marco-o1
กอดใบหน้า:
https://huggingface.co/AIDC-AI/Marco-o1
โดยรวมแล้ว โอเพ่นซอร์สของโมเดล Marco-o1 นำความเป็นไปได้ใหม่ๆ มาสู่การวิจัยและการใช้งาน AI และความก้าวหน้าในการแก้ปัญหาแบบเปิดก็คุ้มค่าที่จะรอคอย ลิงก์ที่เกี่ยวข้องจะอำนวยความสะดวกให้ผู้ใช้เข้าใจและใช้โมเดลเพิ่มเติม