علم محرر Downcodes أن فريق البحث في NVIDIA قد حقق تقدمًا كبيرًا وقام بتطوير شبكة عصبية جديدة تسمى HOVER (وحدة التحكم متعددة الوظائف Humanoid). تحتوي هذه الشبكة العصبية على 1.5 مليون معلمة فقط، لكنها يمكنها تنسيق حركة وتشغيل الروبوتات البشرية بكفاءة، كما أن أسلوب تدريبها الفعال ووظائفها القوية ملفتة للنظر. يمثل ظهور HOVER خطوة كبيرة إلى الأمام في تكنولوجيا التحكم في الروبوتات البشرية ويوفر إمكانيات جديدة لتطوير تكنولوجيا الروبوتات المستقبلية.
قال جيم فان، كبير مديري الأبحاث في NVIDIA: "ليست كل النماذج الأساسية بحاجة إلى أن تكون ضخمة. إن الشبكة العصبية ذات المعلمة 1.5 مليون التي قمنا بتدريبها مصممة للتحكم في جسم الروبوت البشري." وأوضح أيضًا أن HOVER يمكنه التقاط الحركات البشرية العمليات اللاواعية حتى تتمكن الروبوتات من أداء مهام معقدة دون برمجة مرهقة. وذكر أن "البشر يحتاجون إلى الكثير من المعالجة اللاواعية عندما يمشون، ويحافظون على التوازن، ويتحكمون بمرونة في أطرافهم".
أثناء عملية التدريب، استخدمت HOVER منصة محاكاة Isaac من NVIDIA، والتي يمكنها تسريع المحاكاة المادية أسرع بـ 10000 مرة من الوقت الفعلي.
كشف جيم فان أن هذا النموذج استغرق عامًا للتدريب في بيئة افتراضية وفي الواقع استغرق حوالي 50 دقيقة فقط من الوقت الفعلي، والذي تم استكماله على وحدة معالجة رسومات واحدة. وقال إن هذا التدريب الفعال يسمح بنقل الشبكة العصبية بسلاسة إلى تطبيقات العالم الحقيقي دون الحاجة إلى الضبط الدقيق.
تتمتع HOVER بالقدرة على الاستجابة لمجموعة متنوعة من أوامر الحركة عالية المستوى، بما في ذلك استخدام أجهزة XR (مثل Vision Pro من Apple) للتحكم في وضعية الرأس واليد، أو الحصول على وضعية الجسم بالكامل من خلال التقاط الحركة وكاميرات RGB، وحتى الحصول على المفاصل من زاوية الهياكل الخارجية، أو احصل على أمر سرعة الجذر من عصا التحكم. وأكد فان أن HOVER يوفر واجهة موحدة للروبوتات التي تتحكم في أجهزة الإدخال المختلفة، مما يسهل جمع بيانات التشغيل عن بعد للتدريب.
بالإضافة إلى ذلك، تم دمج HOVER مع نموذج حركة اللغة المرئية الأولية، مما يسمح بتحويل أوامر الحركة إلى إشارات حركية منخفضة المستوى بتردد عالٍ. هذا النموذج متوافق مع أي روبوت بشري يمكن محاكاته في إسحاق، مما يسمح للمستخدمين بإعادة الروبوت إلى الحياة بسهولة.
في وقت مبكر من بداية هذا العام، أعلنت NVIDIA أيضًا عن مشروع يسمى GR00T، وهو نموذج أساسي عام مصمم للروبوتات البشرية. يمكن للروبوتات التي تعمل بتقنية GR00T (Generist Robot00Technology) فهم اللغة الطبيعية وتقليد الحركات البشرية من خلال مراقبة الحركات، مما يسمح لها بتعلم التنسيق والمرونة والمهارات الأخرى اللازمة للتفاعل بفعالية في العالم الحقيقي بسرعة.
عنوان URL للورقة: https://arxiv.org/pdf/2410.21229
جلب ظهور HOVER أملًا جديدًا في مجال التحكم في الروبوتات البشرية، وتشير أساليب التدريب الفعالة ووظائفها القوية إلى أن تكنولوجيا الروبوتات المستقبلية ستكون أكثر ذكاءً وإنسانية. سيؤدي هذا التقدم التكنولوجي إلى تعزيز تطبيق الروبوتات البشرية بشكل كبير في مختلف المجالات، ونحن نتطلع إلى المزيد من التطورات المثيرة في المستقبل!