นักวิจัยของ Microsoft ได้เปิดตัวเฟรมเวิร์ก AI ใหม่ที่เรียกว่า Auto Evol-Instruct ซึ่งสามารถพัฒนาชุดข้อมูลคำแนะนำได้โดยอัตโนมัติโดยไม่ต้องมีการแทรกแซงจากมนุษย์ นี่เป็นสิ่งสำคัญอย่างยิ่งในการปรับปรุงความสามารถของโมเดลภาษาขนาดใหญ่ (LLM) เพื่อปฏิบัติตามคำสั่งที่ซับซ้อน วิธีการวิวัฒนาการแบบดั้งเดิมอาศัยกฎที่ออกแบบขึ้นมาเอง ซึ่งไม่มีประสิทธิภาพและยากต่อการปรับให้เข้ากับงานใหม่ ในทางกลับกัน Auto Evol-Instruct จะวิเคราะห์คำสั่งโดยอัตโนมัติผ่าน LLM ออกแบบและปรับกฎการวิวัฒนาการอย่างอิสระ ตระหนักถึงกระบวนการวิวัฒนาการแบบอัตโนมัติและมีประสิทธิภาพ และปรับปรุงความซับซ้อนและความหลากหลายของชุดข้อมูลอย่างมาก
เมื่อเร็วๆ นี้ นักวิจัยของ Microsoft ได้เสนอกรอบงาน AI ใหม่ที่เรียกว่า Auto Evol-Instruct ซึ่งสามารถพัฒนาชุดข้อมูลคำแนะนำได้โดยอัตโนมัติโดยไม่ต้องมีการแทรกแซงจากมนุษย์
ในด้านปัญญาประดิษฐ์ การพัฒนาโมเดลภาษาขนาดใหญ่ (LLM) เป็นสิ่งสำคัญ โดยเฉพาะอย่างยิ่งในการปรับปรุงความสามารถของโมเดลเหล่านี้ในการทำตามคำแนะนำโดยละเอียด นักวิจัยได้สำรวจวิธีปรับปรุงชุดข้อมูลที่ใช้ในการฝึกอบรม LLM เพื่อปรับปรุงประสิทธิภาพและความสามารถในการปรับเปลี่ยนของแบบจำลอง
วิธีการวิวัฒนาการแบบดั้งเดิม เช่น Evol-Instruct อาศัยกฎวิวัฒนาการที่ระบุโดยผู้เชี่ยวชาญที่เป็นมนุษย์ ซึ่งไม่เพียงแต่มีราคาแพงและใช้เวลานานเท่านั้น แต่ยังต้องมีการออกแบบวิธีการใหม่เมื่อปรับให้เข้ากับงานใหม่อีกด้วย ในทางตรงกันข้าม Auto Evol-Instruct ตระหนักถึงกระบวนการวิวัฒนาการแบบอัตโนมัติโดยใช้ LLM ในขั้นแรกเพื่อวิเคราะห์คำสั่งอินพุต และออกแบบวิธีการเริ่มต้นของกฎวิวัฒนาการอย่างอิสระ ต่อจากนั้น วิธีการวิวัฒนาการได้รับการปรับให้เหมาะสมซ้ำแล้วซ้ำเล่าผ่าน LLM ของเครื่องมือเพิ่มประสิทธิภาพ เพื่อระบุและแก้ไขปัญหาในระหว่างกระบวนการวิวัฒนาการ เพื่อให้มั่นใจถึงความซับซ้อนและความเสถียรของคำสั่งการวิวัฒนาการขั้นสุดท้าย
Auto Evol-Instruct ใช้ LLM เพื่อออกแบบวิธีการวิวัฒนาการโดยการวิเคราะห์คำสั่งอินพุตและกำหนดกฎวิวัฒนาการโดยอัตโนมัติ ซึ่งจะเพิ่มความซับซ้อนและความหลากหลายของชุดข้อมูล
ในแง่ของการประเมินประสิทธิภาพ Auto Evol-Instruct ทำงานได้ดีในการทดสอบเกณฑ์มาตรฐานหลายรายการ ตัวอย่างเช่น โดยการปรับแต่ง Mixtral-8x7B โดยใช้ข้อมูล ShareGPT ที่พัฒนาแล้วเพียง 10,000 รายการ เฟรมเวิร์กได้คะแนน 8.09 คะแนนบน MT-Bench และ 91.4 คะแนนบน AlpacaEval ซึ่งเหนือกว่า GPT-3.5-Turbo และ WizardLM-70B และการแข่งขันกับ Claude2.0 นั้น เทียบเท่า.
นอกจากนี้ ด้วยการใช้ข้อมูลการฝึกอบรม GSM8K ที่พัฒนาแล้วเพียง 7K เฟรมเวิร์กก็ได้คะแนน 82.49 บน GSM8K ในแง่ของการสร้างโค้ด ด้วยการปรับแต่ง DeepSeek-Coder-Base-33B อย่างละเอียดโดยใช้ Code Alpaca ที่พัฒนาแล้ว 20K เฟรมเวิร์กก็ได้คะแนน 82.49 บน HumanEval ได้คะแนน 77.4 แซงหน้ารุ่นคู่แข่งอื่นๆ
จะเห็นได้ว่าเฟรมเวิร์กใหม่นี้ทำงานได้ดีในการทดสอบเกณฑ์มาตรฐานหลายรายการ รวมถึง MT-Bench, AlpacaEval, GSM8K และ HumanEval ซึ่งแสดงให้เห็นถึงศักยภาพในการปรับปรุงความสามารถในการปฏิบัติตามคำสั่ง การใช้เหตุผลทางคณิตศาสตร์ และความสามารถในการสร้างโค้ด
ที่อยู่กระดาษ: https://arxiv.org/abs/2406.00770
ไฮไลท์:
Auto Evol-Instruct เป็นเฟรมเวิร์ก AI อัตโนมัติเต็มรูปแบบที่สามารถวิเคราะห์และพัฒนาชุดข้อมูลคำแนะนำได้โดยอัตโนมัติโดยไม่ต้องมีการแทรกแซงจากมนุษย์
กรอบงานเพิ่มความซับซ้อนและความหลากหลายของชุดข้อมูลได้อย่างมีประสิทธิภาพโดยการปรับวิธีการวิวัฒนาการให้เหมาะสม ซึ่งจะช่วยเพิ่มประสิทธิภาพและความสามารถในการปรับตัวของ LLM ในงานต่างๆ
ผลลัพธ์ของ Auto Evol-Instruct สาธิตวิธีการชี้แนะวิวัฒนาการของชุดข้อมูลผ่านระบบอัตโนมัติ
การเกิดขึ้นของกรอบงาน Auto Evol-Instruct ถือเป็นนวัตกรรมที่สำคัญในวิธีการวิวัฒนาการของข้อมูลการฝึกอบรม LLM ฟีเจอร์อัตโนมัติและมีประสิทธิภาพจะส่งเสริมการพัฒนา LLM อย่างมาก และให้การสนับสนุนที่แข็งแกร่งสำหรับการสร้างแบบจำลอง AI ที่ทรงพลังและปรับเปลี่ยนได้ มีการตีพิมพ์บทความที่เกี่ยวข้องแล้ว และผู้อ่านที่สนใจสามารถศึกษาได้ในเชิงลึก