El editor de Downcodes se enteró de que el equipo de investigación de Sergey Levine en el Laboratorio BAIR de la Universidad de California, Berkeley, desarrolló con éxito un marco de aprendizaje por refuerzo llamado HIL-SERL, cuyo objetivo es superar el cuello de botella que supone para los robots aprender habilidades operativas complejas, especialmente en situaciones reales. -ambientes mundiales. Esta tecnología combina demostración y corrección humana y aplica algoritmos eficientes de aprendizaje por refuerzo, lo que permite a los robots dominar una variedad de operaciones precisas en muy poco tiempo, mejorando significativamente la eficiencia y proporcionando una nueva dirección para el desarrollo futuro del campo de la robótica.
Esta nueva tecnología combina la demostración y corrección humana con algoritmos eficientes de aprendizaje por refuerzo, lo que permite a los robots dominar una variedad de tareas operativas de precisión y destreza, como manipulación dinámica, ensamblaje de precisión y colaboración con dos brazos, en solo 1 a 2,5 horas.
En el pasado, a los robots les resultaba difícil aprender nuevas habilidades. Era como enseñarle a un niño travieso a escribir sus deberes. Había que enseñarlos paso a paso y corregirlos una y otra vez. Lo que es aún más problemático es que en el mundo real, diversas situaciones son complejas y cambiantes, y los robots a menudo aprenden lentamente, olvidan rápidamente y se volcan accidentalmente.
Después de una serie de experimentos, el efecto de HIL-SERL es sorprendente. En diversas tareas, el robot ha logrado una tasa de éxito de casi el 100% en sólo 1 a 2,5 horas, y la velocidad de operación es casi 2 veces más rápida que antes.
Más importante aún, HIL-SERL es el primer sistema que utiliza el aprendizaje por refuerzo para lograr la coordinación de dos brazos basada en la entrada de imágenes en el mundo real, es decir, puede permitir que dos brazos robóticos trabajen juntos para completar tareas más complejas. El montaje de correas de distribución es una operación que requiere un alto grado de coordinación.
La aparición de HIL-SERL no sólo nos permite ver el enorme potencial del aprendizaje de robots, sino que también señala la dirección para futuras aplicaciones e investigaciones industriales. Tal vez, en el futuro, cada uno de nosotros tenga un "aprendiz" de robot en casa, que nos ayude con las tareas del hogar, monte muebles e incluso juegue con nosotros. ¡Se siente genial pensar en ello!
Por supuesto, HIL-SERL también tiene algunas limitaciones. Por ejemplo, es posible que no pueda realizar tareas que requieran una planificación a largo plazo. Además, HIL-SERL actualmente se prueba principalmente en entornos de laboratorio y no se ha verificado en escenarios del mundo real a gran escala. Sin embargo, creo que con el avance de la tecnología estos problemas se irán solucionando poco a poco.
Dirección del artículo: https://hil-serl.github.io/static/hil-serl-paper.pdf
Dirección del proyecto: https://hil-serl.github.io/
El gran progreso del marco HIL-SERL ha traído nuevas esperanzas al desarrollo de la tecnología robótica y sus perspectivas de aplicación en el mundo real son amplias. Aunque todavía existen algunas limitaciones en la actualidad, creemos que con investigación y mejoras continuas, HIL-SERL desempeñará un papel más importante en el futuro y brindará más comodidad a la vida de las personas.