カリフォルニア大学バークレー校のBair Laboratoryの研究チームは、Robotsが現実世界で複雑な運用スキルを学ぶ能力を大幅に向上させるHil-Serlと呼ばれる強化学習フレームワークを開発しました。人間のデモンストレーション、修正、効率的な強化学習アルゴリズムを巧みに組み合わせて、ロボットが短時間でさまざまな精度操作を習得できるようにし、以前のゆっくりとした学習とエラーが発生しやすいロボットのボトルネックを突破します。この画期的なテクノロジーは、ロボットの学習と適用方法に革命をもたらし、産業自動化のための強固な基盤と日常生活におけるロボットの普及に革命をもたらすことが期待されています。
最近、カリフォルニア大学バークレー校のBair LaboratoryのSergey Levine Researchチームは、現実世界で複雑な運用スキルを学習するロボットの問題を解決するために、Hil-Serlと呼ばれる強化学習フレームワークを提案しました。
この新しいテクノロジーは、人間のデモと補正と効率的な強化学習アルゴリズムを組み合わせて、ロボットが動的操作、精密アセンブリ、2アームコラボレーションなどのさまざまな洗練された器用な動作タスクを1〜2.5時間で習得できるようにします。
過去には、いたずらな子供に宿題をするように教えるように教えるように、ロボットに新しいスキルを学ばせることは非常に困難でした。さらに厄介なのは、現実の世界のさまざまな状況が複雑でゆっくりと学習し、すぐに忘れることです。
HIL-SERLフレームワークは、ロボットに「家庭教師」、つまり人間のデモと修正を尋ねるだけでなく、ロボットがさまざまなスキルをすばやく習得するのに役立つように装備されています。
数回だけデモを行う必要があり、ロボットは、ビルディングブロックで遊んだり、パンケーキをひっくり返したり、家具を組み立てたり、サーキットボードを設置したりすることまで、まともな方法でさまざまな操作を完了することができます。
ロボットをより速く、より良く学習させるために、Hil-Serlは人間のコンピューターの相互作用の補正メカニズムも導入します。簡単に言えば、ロボットが間違いを犯した場合、人間のオペレーターはそれを修正するために間に合うように介入し、これらの修正情報をロボットにフィードバックできます。このようにして、ロボットは間違いから絶えず学習し、間違いを繰り返し行わないようにし、最終的に本当のマスターになることができます。
一連の実験の後、Hil-Serlの効果は驚くべきものです。さまざまなタスクでは、ロボットはわずか1〜2.5時間でほぼ100%の成功率を達成しており、動作速度は以前よりもほぼ2倍高速です。
さらに重要なことに、Hil-Serlは、現実の世界での強化学習を使用して、画像入力ベースのデュアルアーム調整を実装する最初のシステムです。つまり、2つのロボットアームが協力して、より複雑なタスクを完了することです同期ベルトには、高度に調整された操作が必要です。
Hil-Serlの出現により、ロボット学習の大きな可能性を見ることができるだけでなく、将来の産業用途と研究の方向性も指摘しています。たぶん、私たち一人一人が私たちの家にロボットの「見習い」を持っているでしょう。
もちろん、Hil-Serlにもいくつかの制限があります。たとえば、長期的な計画を必要とするいくつかのタスクの場合、圧倒的に見えるかもしれません。 さらに、現在、HIL-SERLは主に実験室環境でテストされており、実際のシナリオでは大規模に検証されていません。 しかし、テクノロジーの進歩により、これらの問題は徐々に解決されると思います。
紙の住所:https://hil-serl.github.io/static/hil-serl-paper.pdf
プロジェクトアドレス:https://hil-serl.github.io/
要約すると、HIL-SERLフレームワークはロボット学習の分野に大きな進歩をもたらし、その効率的な学習能力とヒューマンコンピューターの相互作用メカニズムにより、実際のアプリケーションで大きな可能性を示すことができました。まだいくつかの制限がありますが、将来の開発の見通しは楽しみにしています。