Penelitian tentang skala data di bidang manipulasi robot selalu menjadi tantangan utama di bidang pembelajaran robot. Penelitian yang ada berfokus pada bidang pemrosesan bahasa alami dan visi komputer, sementara penelitian di bidang manipulasi robot relatif langka. Artikel ini memperkenalkan hasil penelitian terbaru dari tim peneliti Universitas Tsinghua.
Perkembangan cepat pembelajaran mendalam tidak dapat dipisahkan dari set data skala besar, model dan volume komputasi. Di bidang pemrosesan bahasa alami dan visi komputer, para peneliti telah menemukan hubungan hukum-hukum antara kinerja model dan skala data. Namun, bidang robot, terutama manipulasi robot, belum menetapkan hukum skala yang serupa.
Sebuah tim peneliti di Universitas Tsinghua baru -baru ini menerbitkan sebuah makalah yang mengeksplorasi skala data dalam pembelajaran robot imitasi dan mengusulkan strategi pengumpulan data yang efisien yang mengumpulkan cukup data hanya dalam satu sore untuk membuat kemampuan strategi untuk mencapai tingkat keberhasilan sekitar 90% pada yang baru lingkungan dan objek baru.
Para peneliti membagi kemampuan generalisasi menjadi dua dimensi: generalisasi lingkungan dan generalisasi objek, dan menggunakan rahang genggam untuk mengumpulkan data demonstrasi manusia di berbagai lingkungan dan objek yang berbeda, dan memodelkan data ini menggunakan strategi difusi. Para peneliti pertama -tama berfokus pada dua tugas penempatan air dan mouse.
Hasil penelitian menunjukkan bahwa:
Kemampuan generalisasi strategi untuk objek baru, lingkungan baru atau keduanya adalah hukum yang terkait dengan jumlah objek pelatihan, lingkungan pelatihan atau pasangan pelatihan lingkungan-objek.
Meningkatkan keragaman lingkungan dan objek lebih efektif daripada meningkatkan jumlah demonstrasi untuk setiap lingkungan atau objek.
Kumpulkan data di lingkungan sebanyak mungkin (misalnya, 32 lingkungan), dengan objek operasi yang unik dan 50 demonstrasi di setiap lingkungan, Anda dapat melatih strategi dengan kemampuan generalisasi yang kuat (tingkat keberhasilan 90%) untuk membuatnya dapat beroperasi dengan yang baru lingkungan dan objek baru.
Berdasarkan undang -undang skala data ini, para peneliti telah mengusulkan strategi pengumpulan data yang efisien. Mereka merekomendasikan pengumpulan data di sebanyak mungkin lingkungan yang berbeda, hanya menggunakan satu objek unik di setiap lingkungan. Ketika jumlah total pasangan objek lingkungan mencapai 32, biasanya cukup untuk melatih strategi yang dapat beroperasi di lingkungan baru dan berinteraksi dengan objek yang belum pernah terlihat sebelumnya. Untuk setiap pasangan objek lingkungan, 50 demo disarankan untuk mengumpulkan.
Untuk memverifikasi penerapan universal dari strategi pengumpulan data, para peneliti menerapkannya pada dua tugas baru: melipat handuk dan mencabut pengisi daya. Hasilnya menunjukkan bahwa strategi ini juga dapat melatih strategi dengan kemampuan generalisasi yang kuat pada dua tugas baru ini.
Studi ini menunjukkan bahwa strategi tugas tunggal yang dapat digunakan untuk lingkungan dan objek apa pun dengan menginvestasikan waktu dan sumber daya yang relatif sederhana dapat dipelajari. Untuk lebih mendukung upaya peneliti dalam hal ini, tim Tsinghua merilis kode, data, dan model mereka, berharap untuk menginspirasi penelitian lebih lanjut di lapangan dan pada akhirnya menerapkan robot universal yang dapat memecahkan masalah dunia terbuka yang kompleks.
Alamat kertas: https://arxiv.org/pdf/2410.18647
Studi ini memberikan panduan teoritis yang penting dan metode praktis untuk pembelajaran robot imitasi, dan meletakkan dasar yang kuat untuk membangun sistem cerdas robot yang lebih umum. Sumber terbuka dari hasil penelitian ini juga menyediakan sumber daya yang berharga bagi para peneliti lain untuk mempromosikan pengembangan lapangan.