El editor de Downcodes se enteró de que el equipo de investigación de NVIDIA logró un gran avance y desarrolló una nueva red neuronal llamada HOVER (Controlador multifunción humanoide). Esta red neuronal solo tiene 1,5 millones de parámetros, pero puede coordinar eficientemente el movimiento y el funcionamiento de robots humanoides. Su eficiente método de entrenamiento y sus potentes funciones llaman la atención. La aparición de HOVER marca un gran paso adelante en la tecnología de control de robots humanoides y ofrece nuevas posibilidades para el desarrollo de la tecnología robótica del futuro.
Jim Fan, director senior de investigación de NVIDIA, dijo: "No todos los modelos básicos necesitan ser enormes. La red neuronal de parámetros de 1,5 M que entrenamos está diseñada para controlar el cuerpo de un robot humanoide. Explicó además que HOVER puede capturar los movimientos humanos". procesos subconscientes para que los robots puedan realizar tareas complejas sin una programación engorrosa. Mencionó: "Los humanos requieren mucho procesamiento subconsciente cuando caminan, mantienen el equilibrio y controlan sus extremidades con flexibilidad".
Durante el proceso de formación, HOVER utilizó la plataforma de simulación Isaac de NVIDIA, que puede acelerar la simulación física 10.000 veces más rápido que el tiempo real.
Jim Fan reveló que este modelo tardó un año en entrenarse en un entorno virtual y, en realidad, solo tomó unos 50 minutos de tiempo real, que se completó en una sola GPU. Dijo que esta capacitación eficiente permite que la red neuronal se transfiera sin problemas a aplicaciones del mundo real sin necesidad de realizar ajustes.
HOVER tiene la capacidad de responder a una variedad de comandos de movimiento de alto nivel, incluido el uso de dispositivos XR (como Vision Pro de Apple) para controlar la postura de la cabeza y las manos, u obtener la postura de todo el cuerpo mediante captura de movimiento y cámaras RGB, e incluso obtener articulaciones desde el ángulo del exoesqueleto, u obtener el comando de velocidad de la raíz desde el joystick. Fan enfatizó que HOVER proporciona una interfaz unificada para robots que controlan diferentes dispositivos de entrada, facilitando así la recopilación de datos de teleoperación para entrenamiento.
Además, HOVER está integrado con el modelo de acción, lenguaje visual ascendente, lo que permite convertir los comandos de movimiento en señales motoras de bajo nivel a alta frecuencia. Este modelo es compatible con cualquier robot humanoide que pueda simularse en Isaac, lo que permite a los usuarios darle vida al robot fácilmente.
A principios de este año, NVIDIA también anunció un proyecto llamado GR00T, que es un modelo base general diseñado para robots humanoides. Los robots impulsados por GR00T (Tecnología Generalista Robot00) pueden comprender el lenguaje natural e imitar los movimientos humanos observando los movimientos, lo que les permite aprender rápidamente coordinación, flexibilidad y otras habilidades necesarias para interactuar de manera efectiva en el mundo real.
URL del artículo: https://arxiv.org/pdf/2410.21229
La aparición de HOVER ha traído nuevas esperanzas al campo del control de robots humanoides. Sus eficientes métodos de entrenamiento y sus potentes funciones indican que la tecnología robótica del futuro será más inteligente y humana. Este avance tecnológico promoverá en gran medida la aplicación de robots humanoides en diversos campos. ¡Esperamos más desarrollos interesantes en el futuro!