أصدرت Meta Fair Lab مؤخرًا تقنية تصور اللمسة متعددة الوسائط التي تسمى "Sparsh" ، والتي من المتوقع أن تحدث ثورة تمامًا في مجال التلاعب بالروبوت. يستخدم نموذج sparsh التعلم الخاضع للإشراف ذاتيًا لتدريب أكثر من 460،000 صورة عن طريق اللمس ، وتعلم تمثيلات اللمس العام دون وضع العلامات اليدوية للبيانات ، مع إدراك قدرة الإدراك اللمسية للروبوت التي تشبه البشر. إنه متوافق مع مجموعة متنوعة من أجهزة الاستشعار البصرية البصرية ويؤدي بشكل جيد في مهام متعددة مثل تقدير القوة والكشف المنزلق ، خاصة عندما تكون البيانات محدودة ، فإن أدائها يتجاوز بكثير نماذج النماذج التقليدية.
يعتمد نموذج Sparsh التعلم الخاضع للإشراف ذاتيًا ، وذلك باستخدام أكثر من 460،000 صورة عن طريق اللمس للتدريب المسبق ، ويتعلم تمثيلات اللمس العام دون وضع العلامات اليدوية للبيانات.
هذا النموذج قادر على دعم مجموعة متنوعة من أنواع المستشعرات البصرية ، بما في ذلك الأرقام ، Gelsight2017 و Gelsight Mini ، ويحسن أداء الروبوت بشكل كبير على مهام تصور اللمس مثل تقدير القوة ، والكشف عن الانزلاق ، وتقدير الوضع ، وتنبؤات استقرار الاستيلاء وتحديد النسيج ، إلخ. قام الباحثون أيضًا ببناء منصة قياسية موحدة تسمى TacBench لتقييم أداء أجهزة الاستشعار والنماذج المختلفة في مختلف المهام.
تُظهر نتائج الاختبار أن نموذج sparsh يعمل بشكل جيد في جميع المهام الستة في Tacbench ، خاصةً عندما يكون حجم البيانات محدودًا ، وأدائه يتجاوز بكثير النماذج التقليدية الخاصة بالمهمة والمستشعرات الخاصة. على سبيل المثال ، في حالة تقدير القوة ومهام الكشف المنزلق ، يمكن لنموذج sparsh تحقيق نتائج مرضية حتى لو تم استخدام 1 ٪ فقط من بيانات التعليقات التوضيحية. هذا يعني أن sparsh يمكن أن تساعد الروبوتات على فهم الخصائص الفيزيائية للكائنات بشكل أفضل وإجراء معالجة أكثر دقة.
يمثل إصدار نموذج sparsh اختراقًا كبيرًا في مجال التصور العاجل من الذكاء الاصطناعي. في المستقبل ، مع تراكم المزيد من البيانات وتحسين النماذج ، من المتوقع أن يغير Sparsh تمامًا الطريقة التي تتفاعل بها الروبوتات مع العالم المادي وتعزيز تطبيق الروبوتات في مجموعة واسعة من الحقول.
عنوان الورق:
https://scontent-sjc3-1.xx.fbcdn.net/v/t39.2365-6/464969941_1107633400780143_7479102347328147009_n.pdf؟_nc_cat=103&ccb=1. _nc_ohc = y8ui1Hew3BQQ7KNVGFE-EPU & _nc_zt = 14 & _nc_ht = scontent-sjc3-1. xx & _nc_gid = aeafsuzziasvwpfmqseozqu & oh = 00_ayamqxgq0atcysdxzwb0zt8bgskogymj13c9f3ytvtkmsg & oe = 672deee4
يشير ظهور تقنية sparsh إلى أن تقنية التصور الروبوتية قد وصلت إلى معلم جديد. إمكاناتها في التلاعب المكررة وتفاعل الحاسوب البشري ضخمة ، وآفاق تطبيقها المستقبلية تستحق التطلع إليها.