L'éditeur de Downcodes a appris que l'équipe de recherche de Sergey Levine du laboratoire BAIR de l'Université de Californie à Berkeley a développé avec succès un cadre d'apprentissage par renforcement appelé HIL-SERL, qui vise à briser le goulot d'étranglement des robots apprenant des compétences opérationnelles complexes, en particulier dans le domaine réel. -environnements mondiaux. Cette technologie combine démonstration humaine et correction, et applique des algorithmes d'apprentissage par renforcement efficaces, permettant aux robots de maîtriser une variété d'opérations précises en très peu de temps, améliorant ainsi considérablement l'efficacité et ouvrant une nouvelle direction pour le développement futur du domaine de la robotique.
Cette nouvelle technologie combine la démonstration et la correction humaines avec des algorithmes d'apprentissage par renforcement efficaces, permettant aux robots de maîtriser une variété de tâches opérationnelles de précision et de dextérité, telles que la manipulation dynamique, l'assemblage de précision et la collaboration à deux bras, en seulement 1 à 2,5 heures.
Dans le passé, il était difficile pour les robots d'acquérir de nouvelles compétences. C'était comme apprendre à un enfant méchant à écrire des devoirs. Il fallait les enseigner étape par étape et les corriger encore et encore. Ce qui est encore plus gênant, c'est que dans le monde réel, diverses situations sont complexes et changeantes, et les robots apprennent souvent lentement, oublient rapidement et se renversent accidentellement.
Après une série d’expériences, l’effet du HIL-SERL est étonnant. Dans diverses tâches, le robot a atteint un taux de réussite de près de 100 % en seulement 1 à 2,5 heures, et la vitesse de fonctionnement est près de 2 fois plus rapide qu'auparavant.
Plus important encore, HIL-SERL est le premier système à utiliser l'apprentissage par renforcement pour obtenir une coordination à deux bras basée sur la saisie d'images dans le monde réel, c'est-à-dire qu'il peut permettre à deux bras de robot de travailler ensemble pour accomplir des tâches plus complexes. L'assemblage des courroies de distribution est une opération qui nécessite un haut degré de coordination.
L’émergence de HIL-SERL nous permet non seulement de constater l’énorme potentiel de l’apprentissage robotique, mais indique également l’orientation des futures applications et recherches industrielles. Peut-être qu'à l'avenir, chacun de nous aura un tel « apprenti » robot à la maison, qui nous aidera dans les tâches ménagères, assemblera les meubles et jouera même à des jeux avec nous. C'est cool d'y penser !
Bien entendu, HIL-SERL présente également certaines limites. Par exemple, il peut ne pas être en mesure de gérer des tâches nécessitant une planification à long terme. De plus, HIL-SERL est actuellement principalement testé en laboratoire et n’a pas été vérifié dans des scénarios réels à grande échelle. Cependant, je crois qu’avec les progrès de la technologie, ces problèmes seront progressivement résolus.
Adresse papier : https://hil-serl.github.io/static/hil-serl-paper.pdf
Adresse du projet : https://hil-serl.github.io/
Les progrès révolutionnaires du cadre HIL-SERL ont apporté un nouvel espoir dans le développement de la technologie robotique, et ses perspectives d'application dans le monde réel sont vastes. Bien qu'il existe encore certaines limites à l'heure actuelle, nous pensons qu'avec la recherche et l'amélioration continues, HIL-SERL jouera un rôle plus important à l'avenir et apportera plus de commodité à la vie des gens.