Untuk waktu yang lama, gerakan gesit robot humanoid telah menjadi tantangan besar di bidang penelitian robot. Perbedaan fisik antara lingkungan yang disimulasikan dan dunia nyata menyulitkan robot untuk secara langsung menerapkan hasil pelatihan simulasi ke kenyataan. Artikel ini memperkenalkan kerangka kerja baru yang disebut ASAP (menyelaraskan simulasi dan fisika nyata), yang secara efektif memecahkan masalah ini dengan secara cerdik menyelaraskan simulasi dan karakteristik fisik nyata, memungkinkan robot humanoid untuk mencapai gerakan tubuh penuh yang lebih fleksibel dan terkoordinasi.
Untuk waktu yang lama, orang telah bermimpi bahwa robot humanoid bisa sefleksibel manusia, dan bahkan melampaui manusia. Namun, karena perbedaan fisik antara lingkungan yang disimulasikan dan dunia nyata, mencapai koordinasi seluruh tubuh dan pergerakan robot yang gesit tetap menjadi tantangan besar. Metode tradisional identifikasi sistem dan pengacakan domain sering mengandalkan penyesuaian parameter yang rumit, atau menyebabkan gerakan robot terlalu konservatif, mengorbankan kelincahan. Sekarang, kerangka kerja baru yang disebut ASAP (menyelaraskan simulasi dan fisika nyata) muncul.
Kerangka kerja ASAP dibagi menjadi dua tahap utama. Pertama, selama fase pra-pelatihan, para peneliti akan menggunakan data video gerak manusia untuk mengubah tindakan ini ke robot humanoid, dan kemudian melatih robot untuk mempelajari tindakan-tindakan ini dalam lingkungan yang disimulasikan. Namun, menerapkan strategi terlatih dalam lingkungan simulasi ke robot nyata secara langsung akan sering menyebabkan degradasi kinerja karena ada perbedaan dinamis antara lingkungan yang disimulasikan dan dunia nyata. Untuk mengatasi masalah ini, kerangka kerja ASAP memasuki fase kedua - fase pasca -pelatihan. Pada tahap ini, para peneliti akan meminta robot untuk melakukan tindakan terlatih di dunia nyata dan merekam lintasan gerak robot yang sebenarnya.
Selanjutnya, kerangka kerja ASAP akan menggunakan data gerak dunia nyata ini untuk mereproduksi gerakan robot di simulator. Karena perbedaan dalam lingkungan yang disimulasikan dan dunia nyata, lintasan gerak yang disimulasikan sering menyimpang dari lintasan gerak nyata. Perbedaan ini kebetulan memberi para peneliti sinyal untuk dipelajari. ASAP melatih "model aksi perbedaan" yang mempelajari dan mengkompensasi perbedaan dinamis antara simulasi dan kenyataan. Model ini seperti "koreksi kesalahan" yang dapat memperbaiki kekurangan dalam simulator dan membawanya lebih dekat ke karakteristik fisik dunia nyata. Akhirnya, para peneliti akan mengintegrasikan "model aksi perbedaan" ini ke dalam simulator dan menggunakannya untuk menyempurnakan strategi pelacakan gerak pra-terlatih, sehingga gerakan robot dapat dengan lebih baik beradaptasi dengan sifat fisik dunia nyata. Strategi yang disesuaikan dapat secara langsung digunakan ke robot dunia nyata tanpa perlu menggunakan "Model Tindakan Perbedaan".
Untuk memverifikasi efektivitas kerangka kerja ASAP, para peneliti melakukan beberapa percobaan, termasuk migrasi antara simulator yang berbeda dan pengujian pada robot humanoid asli Unitree G1. Hasil eksperimen menunjukkan bahwa kerangka kerja ASAP secara signifikan meningkatkan kelincahan dan koordinasi robot seluruh tubuh dalam berbagai gerakan dinamis.
Keberhasilan kerangka kerja ASAP adalah bahwa ia dapat secara efektif menjembatani perbedaan dinamis antara lingkungan yang disimulasikan dan dunia nyata, sehingga robot humanoid yang dilatih di lingkungan yang disimulasikan benar -benar dapat menunjukkan kelincahan yang luar biasa di dunia nyata, yang membuat pengembangan lebih fleksibel dan Robot humanoid multi-fungsional menunjukkan arah baru.
Teknologi utama dari kerangka kerja ASAP meliputi:
Pra-pelatihan menggunakan data gerak manusia: Konversi gerakan gesit manusia menjadi tujuan pembelajaran robot untuk memberikan robot data gerak berkualitas tinggi.
Pelatihan Model Tindakan Diferensial: Dengan mempelajari perbedaan antara dunia nyata dan lingkungan simulasi, secara dinamis mengimbangi kekurangan simulator dan meningkatkan keakuratan simulasi.
Penyempurnaan strategi berdasarkan model aksi diferensial: memungkinkan strategi robot untuk beradaptasi dengan karakteristik fisik dunia nyata dan pada akhirnya mencapai kinerja gerak yang lebih tinggi.
Verifikasi eksperimental dari kerangka kerja ASAP menunjukkan bahwa:
Dalam migrasi antara simulator, ASAP mampu secara signifikan mengurangi kesalahan pelacakan gerak, yang lebih unggul dari metode benchmark lainnya.
Dalam menguji robot nyata, ASAP juga dapat secara signifikan meningkatkan kinerja gerak robot, memungkinkan robot untuk menyelesaikan gerakan gesit yang sulit.
Studi ini juga mengeksplorasi mendalam faktor-faktor kunci dari model aksi diferensial pelatihan, termasuk ukuran kumpulan data, durasi pelatihan dan bobot norma tindakan. Selain itu, para peneliti membandingkan berbagai strategi penggunaan model tindakan diferensial dan akhirnya mengkonfirmasi bahwa metode penyempurnaan pembelajaran penguatan dapat mencapai kinerja yang optimal.
Terlepas dari kemajuan yang luar biasa dari kerangka kerja ASAP, ia masih memiliki beberapa keterbatasan, seperti keterbatasan perangkat keras, ketergantungan pada sistem penangkapan gerak, dan tuntutan data yang tinggi. Arah penelitian di masa depan dapat mencakup pengembangan arsitektur strategis yang dapat merasakan kerusakan perangkat keras, memanfaatkan estimasi pose bebas tanda atau fusi sensor onboard untuk mengurangi ketergantungan pada sistem penangkapan gerak, dan mengeksplorasi teknik adaptif yang lebih efisien untuk model aksi diferensial.
Munculnya kerangka kerja ASAP telah membawa harapan baru ke bidang robot humanoid. Dengan secara cerdik memecahkan perbedaan dinamis antara simulasi dan kenyataan, ASAP memungkinkan robot humanoid untuk menguasai keterampilan motorik yang lebih gesit dan terkoordinasi, meletakkan dasar yang kuat untuk aplikasi robot humanoid yang meluas di dunia nyata di masa depan.
Alamat Proyek: https://agile.human2humanoid.com/
Alamat kertas: https://arxiv.org/pdf/2502.01143
Kerangka kerja ASAP memberikan solusi yang efektif untuk memecahkan kesenjangan antara simulasi robot humanoid dan kenyataan. Itu akan segera hadir. Penelitian di masa depan dapat lebih jauh mengoptimalkan kerangka kerja ASAP untuk membuatnya lebih kuat dan efisien dalam aplikasi praktis.