การวิจัยเกี่ยวกับขนาดของข้อมูลในด้านการจัดการหุ่นยนต์เป็นความท้าทายที่สำคัญในด้านการเรียนรู้หุ่นยนต์ การวิจัยที่มีอยู่มุ่งเน้นไปที่สาขาการประมวลผลภาษาธรรมชาติและการมองเห็นคอมพิวเตอร์ในขณะที่การวิจัยเกี่ยวกับการจัดการหุ่นยนต์ค่อนข้างหายาก บทความนี้แนะนำผลการวิจัยล่าสุดของทีมวิจัยของมหาวิทยาลัย Tsinghua
การพัฒนาอย่างรวดเร็วของการเรียนรู้อย่างลึกซึ้งนั้นแยกออกไม่ได้จากชุดข้อมูลขนาดใหญ่โมเดลและปริมาณการคำนวณ ในด้านการประมวลผลภาษาธรรมชาติและการมองเห็นคอมพิวเตอร์นักวิจัยได้ค้นพบความสัมพันธ์ของกฎหมายพลังงานระหว่างประสิทธิภาพของโมเดลและมาตราส่วนข้อมูล อย่างไรก็ตามสาขาหุ่นยนต์โดยเฉพาะการจัดการหุ่นยนต์ยังไม่ได้กำหนดกฎหมายขนาดที่คล้ายกัน
ทีมวิจัยที่มหาวิทยาลัย Tsinghua เพิ่งตีพิมพ์บทความสำรวจขนาดของข้อมูลในการเรียนรู้การเลียนแบบหุ่นยนต์และเสนอกลยุทธ์การรวบรวมข้อมูลที่มีประสิทธิภาพซึ่งรวบรวมข้อมูลเพียงพอในบ่ายวันหนึ่งเพื่อให้ความสามารถด้านกลยุทธ์เพื่อให้ได้อัตราความสำเร็จประมาณ 90% สำหรับใหม่ สภาพแวดล้อมและวัตถุใหม่
นักวิจัยแบ่งความสามารถทั่วไปออกเป็นสองมิติ: การวางนัยทั่วไปด้านสิ่งแวดล้อมและการวางนัยทั่วไปของวัตถุและใช้กรามมือถือเพื่อรวบรวมข้อมูลการสาธิตของมนุษย์ในสภาพแวดล้อมที่หลากหลายและวัตถุที่แตกต่างกันและจำลองข้อมูลเหล่านี้โดยใช้กลยุทธ์การแพร่กระจาย นักวิจัยมุ่งเน้นไปที่สองงานของการเทน้ำและการจัดวางเมาส์
ผลการวิจัยแสดงให้เห็นว่า:
ความสามารถในการวางนัยทั่วไปของกลยุทธ์ไปยังวัตถุใหม่สภาพแวดล้อมใหม่หรือทั้งสองอย่างคือกฎหมายพลังงานที่เกี่ยวข้องกับจำนวนวัตถุการฝึกอบรมสภาพแวดล้อมการฝึกอบรมหรือการฝึกอบรมสิ่งแวดล้อม-คู่วัตถุตามลำดับ
การเพิ่มความหลากหลายของสภาพแวดล้อมและวัตถุนั้นมีประสิทธิภาพมากกว่าการเพิ่มจำนวนการสาธิตสำหรับแต่ละสภาพแวดล้อมหรือวัตถุ
รวบรวมข้อมูลในสภาพแวดล้อมให้มากที่สุดเท่าที่จะเป็นไปได้ (ตัวอย่างเช่น 32 สภาพแวดล้อม) ด้วยวัตถุปฏิบัติการที่ไม่ซ้ำกันและการสาธิต 50 ครั้งในแต่ละสภาพแวดล้อมคุณสามารถฝึกอบรมกลยุทธ์ที่มีความสามารถในการวางนัยทั่วไปที่แข็งแกร่ง (อัตราความสำเร็จ 90%) เพื่อให้สามารถทำงานใหม่ได้ สภาพแวดล้อมและวัตถุใหม่
ตามกฎหมายมาตราส่วนข้อมูลเหล่านี้นักวิจัยได้เสนอกลยุทธ์การรวบรวมข้อมูลที่มีประสิทธิภาพ พวกเขาแนะนำให้รวบรวมข้อมูลในสภาพแวดล้อมที่แตกต่างกันมากที่สุดโดยใช้วัตถุที่ไม่ซ้ำกันเพียงชิ้นเดียวในแต่ละสภาพแวดล้อม เมื่อจำนวนคู่วัตถุสิ่งแวดล้อมทั้งหมดถึง 32 มันมักจะเพียงพอที่จะฝึกอบรมกลยุทธ์ที่สามารถทำงานในสภาพแวดล้อมใหม่และโต้ตอบกับวัตถุที่ไม่เคยเห็นมาก่อน สำหรับคู่วัตถุสิ่งแวดล้อมแต่ละคู่ขอแนะนำให้รวบรวม 50 การสาธิต
ในการตรวจสอบการบังคับใช้สากลของกลยุทธ์การรวบรวมข้อมูลนักวิจัยได้นำไปใช้กับงานใหม่สองงาน: พับผ้าเช็ดตัวและถอดปลั๊กเครื่องชาร์จ ผลการวิจัยพบว่ากลยุทธ์นี้ยังสามารถฝึกฝนกลยุทธ์ด้วยความสามารถในการวางนัยทั่วไปที่แข็งแกร่งในงานใหม่ทั้งสองนี้
การศึกษาแสดงให้เห็นว่ากลยุทธ์งานเดียวที่สามารถนำไปใช้กับสภาพแวดล้อมและวัตถุใด ๆ โดยการลงทุนเวลาและทรัพยากรที่ค่อนข้างเรียบง่ายสามารถเรียนรู้ได้ เพื่อสนับสนุนความพยายามของนักวิจัยในเรื่องนี้ทีม Tsinghua ได้เปิดตัวรหัสข้อมูลและโมเดลโดยหวังว่าจะสร้างแรงบันดาลใจให้การวิจัยเพิ่มเติมในสาขาและในที่สุดก็ใช้หุ่นยนต์สากลที่สามารถแก้ปัญหาที่ซับซ้อนและเปิดกว้างได้
ที่อยู่กระดาษ: https://arxiv.org/pdf/2410.18647
การศึกษาครั้งนี้ให้คำแนะนำเชิงทฤษฎีที่สำคัญและวิธีการปฏิบัติสำหรับการเรียนรู้การเลียนแบบหุ่นยนต์และวางรากฐานที่มั่นคงสำหรับการสร้างระบบอัจฉริยะหุ่นยนต์ทั่วไปมากขึ้น แหล่งโอเพ่นซอร์สของผลการวิจัยนี้ยังให้ทรัพยากรที่มีค่าสำหรับนักวิจัยคนอื่น ๆ เพื่อส่งเสริมการพัฒนาสาขา