ทีมวิจัย MIT ได้สร้างความก้าวหน้าครั้งสำคัญเมื่อเร็ว ๆ นี้ในการพัฒนารูปแบบการฝึกอบรมหุ่นยนต์ใหม่ที่ยืมวิธีการฝึกอบรมของแบบจำลองภาษาขนาดใหญ่ (LLMs) และไม่ต้องอาศัยชุดข้อมูลที่เฉพาะเจาะจงอีกต่อไป แต่ใช้ข้อมูลจำนวนมากสำหรับการฝึกอบรม นวัตกรรมนี้คาดว่าจะแก้ข้อ จำกัด ที่พบโดยวิธีการฝึกอบรมหุ่นยนต์แบบดั้งเดิมในการตอบสนองต่อการเปลี่ยนแปลงสิ่งแวดล้อมและความท้าทายใหม่ ๆ วางรากฐานที่แข็งแกร่งสำหรับการวิจัยและพัฒนาสมองหุ่นยนต์ทั่วไป ความสำคัญของการศึกษาครั้งนี้คือมันมีศักยภาพที่จะเปลี่ยนอนาคตของหุ่นยนต์ช่วยให้หุ่นยนต์ปรับตัวเข้ากับสภาพแวดล้อมที่ซับซ้อนและเปลี่ยนแปลงได้ดีขึ้นและดำเนินงานที่หลากหลาย
MIT ในสัปดาห์นี้นำเสนอรูปแบบการฝึกอบรมหุ่นยนต์ใหม่อย่างสมบูรณ์ซึ่งละทิ้งวิธีการฝึกอบรมก่อนหน้านี้ที่มุ่งเน้นไปที่ชุดข้อมูลเฉพาะและใช้ข้อมูลจำนวนมากที่ใช้เมื่อการฝึกอบรมในรูปแบบภาษาขนาดใหญ่ (LLMs)
นักวิจัยชี้ให้เห็นว่าการเรียนรู้การเลียนแบบ - นั่นคือตัวแทนเรียนรู้โดยการเลียนแบบบุคคลที่ปฏิบัติงาน - ล้มเหลวเมื่อต้องเผชิญกับความท้าทายเล็กน้อย ความท้าทายเหล่านี้อาจรวมถึงสภาพแสงที่แตกต่างกันการตั้งค่าสิ่งแวดล้อมที่แตกต่างกันหรืออุปสรรคใหม่ ในกรณีเหล่านี้หุ่นยนต์ไม่มีข้อมูลเพียงพอที่จะปรับให้เข้ากับการเปลี่ยนแปลงเหล่านี้
ทีมยืมโมเดลเช่น GPT-4 และใช้วิธีการแก้ปัญหาที่ขับเคลื่อนด้วยข้อมูลคร่าวๆ
"ในด้านภาษาข้อมูลเป็นประโยค" Lirui Wang ผู้เขียนหลักของบทความกล่าว “ ในสาขาหุ่นยนต์เนื่องจากความหลากหลายของข้อมูลหากคุณต้องการฝึกอบรมล่วงหน้าในลักษณะเดียวกันเราต้องการสถาปัตยกรรมที่แตกต่างกัน”
ทีมแนะนำสถาปัตยกรรมใหม่ที่เรียกว่า Transformer ที่ได้รับการฝึกฝนมาก่อน (HPT) ซึ่งรวมข้อมูลจากเซ็นเซอร์ที่แตกต่างกันและสภาพแวดล้อมที่แตกต่างกัน ข้อมูลจะถูกรวมเข้ากับรูปแบบการฝึกอบรมโดยใช้หม้อแปลง ตัวแปลงที่ใหญ่ขึ้นเท่าไหร่ผลลัพธ์ก็จะยิ่งดีขึ้นเท่านั้น
จากนั้นผู้ใช้จะเข้าสู่การออกแบบการกำหนดค่าและงานที่พวกเขาต้องการให้สำเร็จ
“ ความฝันของเราคือการมีสมองหุ่นยนต์สากลที่คุณสามารถดาวน์โหลดและใช้สำหรับหุ่นยนต์ของคุณได้โดยไม่ต้องฝึกอบรมใด ๆ ” เดวิดกล่าวรองศาสตราจารย์ที่มหาวิทยาลัย Carnegie Mellon “ แม้ว่าเราจะเพิ่งเริ่มต้น แต่เราจะทำงานหนักต่อไปโดยหวังว่าการขยายขนาดจะนำไปสู่การพัฒนาในกลยุทธ์หุ่นยนต์เช่นโมเดลภาษาขนาดใหญ่”
การศึกษาครั้งนี้ได้รับทุนสนับสนุนจากสถาบันโตโยต้า เมื่อปีที่แล้วที่ TechCrunch Disrupt Tri แสดงวิธีฝึกหุ่นยนต์ข้ามคืน เมื่อเร็ว ๆ นี้มันมาถึงหุ้นส่วนลุ่มน้ำที่รวมการวิจัยการเรียนรู้หุ่นยนต์เข้ากับฮาร์ดแวร์ของ Boston Dynamics
งานวิจัยนี้โดย MIT ได้นำความเป็นไปได้ใหม่ ๆ มาสู่สาขาหุ่นยนต์และการพัฒนาในอนาคตนั้นคุ้มค่าที่จะรอคอย ด้วยการวาดประสบการณ์ที่ประสบความสำเร็จของแบบจำลองภาษาขนาดใหญ่แบบจำลองนี้คาดว่าจะส่งเสริมความก้าวหน้าที่สำคัญยิ่งขึ้นในเทคโนโลยีหุ่นยนต์ในที่สุดก็ตระหนักถึงความฝันของสมองหุ่นยนต์ทั่วไปเพื่อให้หุ่นยนต์สามารถให้บริการมนุษย์ได้อย่างยืดหยุ่นและชาญฉลาดมากขึ้น