O editor do Downcodes soube que a equipe de pesquisa da NVIDIA fez um grande avanço e desenvolveu uma nova rede neural chamada HOVER (Humanoid Multi-Function Controller). Esta rede neural possui apenas 1,5 milhão de parâmetros, mas pode coordenar com eficiência o movimento e a operação de robôs humanóides. Seu método de treinamento eficiente e funções poderosas são atraentes. O surgimento do HOVER marca um grande avanço na tecnologia de controle de robôs humanóides e oferece novas possibilidades para o desenvolvimento da futura tecnologia robótica.
Jim Fan, gerente sênior de pesquisa da NVIDIA, disse: "Nem todos os modelos básicos precisam ser enormes. A rede neural de parâmetro de 1,5M que treinamos foi projetada para controlar o corpo de um robô humanóide." processos subconscientes para que os robôs possam realizar tarefas complexas sem programação complicada. Ele mencionou: “Os humanos exigem muito processamento subconsciente quando andam, mantêm o equilíbrio e controlam seus membros com flexibilidade”.
Durante o processo de treinamento, a HOVER utilizou a plataforma de simulação Isaac da NVIDIA, que pode acelerar a simulação física 10.000 vezes mais rápido que o tempo real.
Jim Fan revelou que este modelo levou um ano para ser treinado em um ambiente virtual e, na verdade, levou apenas cerca de 50 minutos de tempo real, que foi concluído em uma única GPU. Ele disse que esse treinamento eficiente permite que a rede neural seja transferida suavemente para aplicações do mundo real, sem a necessidade de ajustes finos.
O HOVER tem a capacidade de responder a uma variedade de comandos de movimento de alto nível, incluindo o uso de dispositivos XR (como o Vision Pro da Apple) para controle da postura da cabeça e das mãos, ou a obtenção da postura de corpo inteiro por meio de captura de movimento e câmeras RGB, e até mesmo a obtenção de articulações do ângulo dos exoesqueletos ou obtenha o comando de velocidade raiz do joystick. Fan enfatizou que o HOVER fornece uma interface unificada para robôs que controlam diferentes dispositivos de entrada, facilitando assim a coleta de dados de teleoperação para treinamento.
Além disso, o HOVER está integrado ao modelo de ação de linguagem visual upstream, permitindo que comandos de movimento sejam convertidos em sinais motores de baixo nível em alta frequência. Este modelo é compatível com qualquer robô humanóide que possa ser simulado no Isaac, permitindo aos usuários dar vida ao robô facilmente.
Já no início deste ano, a NVIDIA também anunciou um projeto chamado GR00T, que é um modelo básico geral projetado para robôs humanóides. Os robôs conduzidos pela GR00T (Generalist Robot00Technology) podem compreender a linguagem natural e imitar os movimentos humanos observando os movimentos, permitindo-lhes aprender rapidamente a coordenação, flexibilidade e outras habilidades necessárias para interagir eficazmente no mundo real.
URL do artigo: https://arxiv.org/pdf/2410.21229
O surgimento do HOVER trouxe uma nova esperança ao campo do controle de robôs humanóides. Seus métodos de treinamento eficientes e funções poderosas indicam que a tecnologia robótica do futuro será mais inteligente e humana. Este avanço tecnológico promoverá enormemente a aplicação de robôs humanóides em vários campos. Esperamos desenvolvimentos mais interessantes no futuro!