تعلن NVIDIA أن فريق الأبحاث قد طور شبكة عصبية جديدة تسمى Hover (Humanoid Multifunction Controller) ، وهي شبكة عصبية صغيرة ولكنها فعالة مع 1.5 مليون معلمة مخصصة للسيطرة على حركة الروبوتات البشرية وتشغيلها. ما هو فريد من نوعه هو قدرتها على التقاط العمليات اللاواعية في الحركة البشرية ، مما يسمح للروبوتات بأداء مهام معقدة دون برمجة مرهقة ، والتي تعد طفرة كبيرة في مجال التحكم في الروبوت. عملية التدريب الفعالة لها أيضًا بشكل مثير للإعجاب.
أعلن فريق البحث عن تقدم مثير في تطوير شبكة عصبية جديدة تسمى Hover (Humanoid Multifunctional Controller). تحتوي هذه الشبكة العصبية على 1.5 مليون معلمة وهي مصممة خصيصًا لتنسيق حركة وتشغيل الروبوتات البشرية.
"لا تحتاج جميع النماذج الأساسية إلى أن تكون ضخمة. تم تصميم الشبكة العصبية البالغة 1.5 متر التي قمنا بتدريبها للسيطرة على جسم الروبوت البشري." الروبوت لأداء المهام المعقدة دون برمجة مرهقة. وذكر أن "البشر يحتاجون إلى الكثير من المعالجة اللاواعية عند المشي ، والحفاظ على التوازن ، والتلاعب بأطرافهم بمرونة."
أثناء عملية التدريب ، استخدمت Hover منصة محاكاة ISAAC الخاصة بـ Nvidia ، والتي يمكن أن تسرع المحاكاة المادية بسرعة 10000 مرة في الوقت الحقيقي.
كشف جيم فان أن النموذج قد تم تدريبه في بيئة افتراضية لمدة عام ولم يستغرق الأمر سوى حوالي 50 دقيقة من الوقت الحقيقي ، وهو ما يتم على وحدة معالجة الرسومات الواحدة. وقال إن هذا التدريب الفعال يسمح بنقل الشبكات العصبية بسلاسة إلى تطبيقات العالم الحقيقي دون ضبطها.
يتمتع Hover بالقدرة على الاستجابة لمجموعة متنوعة من تعليمات الحركة عالية المستوى ، بما في ذلك التحكم في وضعية الرأس واليد باستخدام أجهزة XR مثل Apple's Vision Pro ، أو الحصول على مواقف الجسم الكاملة من خلال التقاط الحركة وكاميرات RGB ، وحتى المفاصل من الهيكل الخارجي زاوية ، أو الحصول على أمر سرعة الجذر من عصا التحكم. أكد المروحة أن Hover يوفر واجهة موحدة للروبوتات التي تتحكم في أجهزة الإدخال المختلفة ، وبالتالي تسهيل جمع البيانات التشغيلية عن بُعد للتدريب.
بالإضافة إلى ذلك ، يتم دمج Hover مع نماذج حركة النشوة في المنبع ، مما يسمح بتحويل تعليمات الحركة إلى إشارات محرك منخفض المستوى بتردد عالي. هذا النموذج متوافق مع أي روبوت بشري يمكن محاكاة في إسحاق ، مما يسمح للمستخدمين بإعطاء حياة الروبوت بسهولة.
مرة أخرى في أوائل هذا العام ، أعلنت NVIDIA أيضًا عن مشروع يسمى GR00T ، وهو نموذج للأغراض العامة المصمم للروبوتات البشرية. يمكن للروبوتات التي تعمل بالطاقة GR00T (Robot00Technology) التي تعمل بالطاقة أن تفهم اللغة الطبيعية وتقليد الحركات الإنسانية من خلال مراقبة الإجراءات ، مما يسمح لهم بالتعلم بسرعة التنسيق والمرونة والمهارات الأخرى اللازمة للتفاعل بفعالية في العالم الحقيقي.
عنوان URL الورقي: https://arxiv.org/pdf/2410.21229
النقاط الرئيسية:
- تطلق Nvidia Hover ، وهي شبكة عصبية 1.5 مليون معلمة تهدف إلى التحكم في حركة الروبوتات البشرية وتشغيلها.
- ⏳ تحوم تدرب في بيئة افتراضية لمدة عام واحد ، وكان وقت التدريب الفعلي 50 دقيقة فقط ، مما أدى إلى تحسين كفاءة تطبيقات الحياة الواقعية.
- يدعم Hover مجموعة متنوعة من إرشادات الحركة عالية المستوى ، ويمكن أن تعمل بالتعاون مع أجهزة إدخال مختلفة ، ويوفر واجهة موحدة للتحكم في الروبوت.
يمثل ظهور تحويم قفزة كبيرة في تكنولوجيا التحكم في الروبوتات البشرية. نتطلع إلى هذه التكنولوجيا التي تجلب المزيد من التطبيقات والابتكارات المثيرة في المستقبل.