Tim peneliti MIT telah membuat terobosan besar baru -baru ini untuk mengembangkan model pelatihan robot baru yang meminjam metode pelatihan model bahasa besar (LLM) dan tidak lagi bergantung pada set data tertentu, tetapi menggunakan informasi besar digunakan untuk pelatihan. Inovasi ini diharapkan untuk menyelesaikan keterbatasan yang dihadapi oleh metode pelatihan robot tradisional dalam menanggapi perubahan lingkungan dan tantangan baru, meletakkan dasar yang kuat untuk penelitian dan pengembangan otak robot umum. Pentingnya penelitian ini adalah bahwa ia memiliki potensi untuk mengubah masa depan robotika, memungkinkan robot untuk lebih beradaptasi dengan lingkungan yang kompleks dan dapat diubah dan melakukan berbagai tugas yang lebih luas.
MIT minggu ini menyajikan model pelatihan robot yang benar -benar baru yang meninggalkan metode pelatihan sebelumnya yang berfokus pada set data tertentu dan sebaliknya menggunakan sejumlah besar informasi yang digunakan saat pelatihan dalam model bahasa besar (LLM).
Para peneliti menunjukkan bahwa pembelajaran imitasi - yaitu, agen belajar dengan meniru individu yang melakukan tugas - dapat gagal ketika dihadapkan dengan tantangan kecil. Tantangan -tantangan ini mungkin termasuk kondisi pencahayaan yang berbeda, pengaturan lingkungan yang berbeda atau hambatan baru. Dalam kasus ini, robot tidak memiliki data yang cukup untuk beradaptasi dengan perubahan ini.
Tim meminjam model seperti GPT-4 dan mengadopsi metode pemecahan masalah yang digerakkan oleh data yang kasar.
"Di bidang bahasa, data adalah kalimat," kata Lirui Wang, penulis utama surat kabar itu. "Di bidang robotika, mengingat keragaman data, jika Anda ingin pra-kereta dengan cara yang sama, kami membutuhkan arsitektur yang berbeda."
Tim memperkenalkan arsitektur baru yang disebut Heterogenous Pre-Found Transformer (HPT), yang mengintegrasikan informasi dari berbagai sensor dan lingkungan yang berbeda. Data kemudian diintegrasikan ke dalam model pelatihan menggunakan transformator. Semakin besar konverter, semakin baik hasil output.
Pengguna kemudian memasuki desain robot, konfigurasi, dan tugas yang ingin mereka capai.
“Impian kami adalah memiliki otak robot universal yang dapat Anda unduh dan gunakan untuk robot Anda tanpa pelatihan apa pun,” kata David Held, associate professor di Universitas Carnegie Mellon, dari penelitian ini. "Meskipun kami baru memulai, kami akan terus bekerja keras, berharap bahwa peningkatan dapat menyebabkan terobosan dalam strategi robot seperti model bahasa besar."
Studi ini sebagian didanai oleh Institut Toyota. Tahun lalu di TechCrunch Disrupt, Tri menunjukkan cara untuk melatih robot dalam semalam. Baru -baru ini, ia mencapai kemitraan daerah aliran sungai yang menggabungkan penelitian robotnya dengan perangkat keras Boston Dynamics.
Penelitian oleh MIT ini telah membawa kemungkinan baru ke bidang robotika, dan perkembangannya di masa depan layak untuk ditunggu. Dengan memanfaatkan pengalaman sukses model bahasa besar, model ini diharapkan untuk mempromosikan kemajuan yang lebih signifikan dalam teknologi robot, akhirnya mewujudkan impian otak robot umum, sehingga robot dapat melayani manusia dengan lebih fleksibel dan cerdas.