Downcodes小編獲悉,NVIDIA的研究團隊取得重大突破,開發出名為HOVER(人形多功能控制器)的新型神經網路。這款僅擁有150萬參數的神經網絡,卻能夠高效地協調人形機器人的運動和操作,其高效的訓練方式和強大的功能令人矚目。 HOVER的出現,標誌著人形機器人控制技術向前邁進了一大步,為未來機器人技術的發展提供了新的可能性。
NVIDIA 的高級研究經理Jim Fan 表示:「並不是所有基礎模型都需要龐大。我們訓練的這個1.5M 參數的神經網絡,旨在控制人形機器人的身體。」他進一步解釋,HOVER 能夠捕捉到人類運動中的潛意識過程,這樣一來,機器人就可以在沒有繁瑣程式的情況下執行複雜任務。他提到,“人類在行走、保持平衡,以及靈活操控四肢時,都需要大量的潛意識處理。”
在訓練過程中,HOVER 使用了NVIDIA 的Isaac 模擬平台,這個平台能夠加速物理仿真,速度是現實時間的10,000倍。
Jim Fan 透露,這個模型在虛擬環境中經過了一年的訓練,實際上只花了大約50分鐘的真實時間,這在單一GPU 上完成。他表示,這種高效的訓練使得神經網路能夠順利轉移到現實應用中,而不需要微調。
HOVER 具備回應多種高層運動指令的能力,包括使用XR 裝置(如蘋果的Vision Pro)進行頭部和手部姿勢的控制,或透過動作捕捉和RGB 相機獲取全身姿勢,甚至可以從外骨骼獲取關節角度,或從操縱桿取得根速度指令。 Fan 強調,HOVER 為控制不同輸入設備的機器人提供了一個統一的接口,從而便利了用於訓練的遙操作資料的收集。
此外,HOVER 還與上游的視覺- 語言- 動作模型集成,使得運動指令能夠高頻率地轉化為低級別的馬達訊號。這個模型與任何可以在Isaac 中模擬的人形機器人相容,使得使用者可以輕鬆地賦予機器人生命。
早在今年年初,NVIDIA 也宣布了一個名為GR00T 的項目,這是一個通用基礎模型,專為人形機器人設計。 GR00T(Generalist Robot00Technology)所驅動的機器人,能夠理解自然語言,並透過觀察動作來模仿人類的動作,這讓它們能夠快速學習協調、靈活性及其他在現實世界中有效互動所需的技能。
論文網址:https://arxiv.org/pdf/2410.21229
HOVER的出現為人形機器人控制領域帶來了新的希望,其高效的訓練方法和強大的功能,預示著未來機器人技術將更加智慧和人性化。這項技術突破將大大推動人形機器人在各領域的應用,並期待未來更多令人興奮的進展!