O editor do Downcodes soube que a equipe de pesquisa de Sergey Levine no Laboratório BAIR da Universidade da Califórnia, Berkeley, desenvolveu com sucesso uma estrutura de aprendizagem por reforço chamada HIL-SERL, que visa romper o gargalo dos robôs que aprendem habilidades operacionais complexas, especialmente em condições reais. -ambientes mundiais. Esta tecnologia combina demonstração e correção humana e aplica algoritmos eficientes de aprendizagem por reforço, permitindo que os robôs dominem uma variedade de operações precisas em um tempo muito curto, melhorando significativamente a eficiência e fornecendo uma nova direção para o desenvolvimento futuro do campo da robótica.
Esta nova tecnologia combina demonstração e correção humana com algoritmos eficientes de aprendizagem por reforço, permitindo que os robôs dominem uma variedade de tarefas operacionais de precisão e destreza, como manipulação dinâmica, montagem de precisão e colaboração de braço duplo, em apenas 1 a 2,5 horas.
No passado, era difícil para os robôs aprenderem novas habilidades. Era como ensinar uma criança travessa a escrever o dever de casa. Tinha que ser ensinado passo a passo e corrigido continuamente. O que é ainda mais problemático é que, no mundo real, várias situações são complexas e mutáveis, e os robôs muitas vezes aprendem lentamente, esquecem rapidamente e capotam acidentalmente.
Após uma série de experimentos, o efeito do HIL-SERL é incrível. Em diversas tarefas, o robô alcançou uma taxa de sucesso de quase 100% em apenas 1 a 2,5 horas, e a velocidade de operação é quase 2 vezes mais rápida do que antes.
Mais importante ainda, HIL-SERL é o primeiro sistema a usar aprendizagem por reforço para obter coordenação de braço duplo com base na entrada de imagem no mundo real, ou seja, pode permitir que dois braços de robô trabalhem juntos para completar tarefas mais complexas, por exemplo, a montagem de correias dentadas é uma operação que requer um alto grau de coordenação.
O surgimento do HIL-SERL não só nos permite ver o enorme potencial da aprendizagem de robôs, mas também aponta a direção para futuras aplicações e pesquisas industriais. Talvez, no futuro, cada um de nós tenha um robô “aprendiz” em casa, nos ajudando nas tarefas domésticas, na montagem de móveis e até nos jogando.
É claro que o HIL-SERL também tem algumas limitações. Por exemplo, pode não ser capaz de realizar tarefas que exijam planeamento a longo prazo. Além disso, o HIL-SERL é atualmente testado principalmente em ambientes de laboratório e não foi verificado em cenários reais de grande escala. Porém, acredito que com o avanço da tecnologia, esses problemas serão resolvidos gradativamente.
Endereço do artigo: https://hil-serl.github.io/static/hil-serl-paper.pdf
Endereço do projeto: https://hil-serl.github.io/
O progresso revolucionário da estrutura HIL-SERL trouxe uma nova esperança ao desenvolvimento da tecnologia robótica, e as suas perspectivas de aplicação no mundo real são amplas. Embora ainda existam algumas limitações no momento, acreditamos que com pesquisas e melhorias contínuas, o HIL-SERL desempenhará um papel maior no futuro e trará mais comodidade à vida das pessoas.