أطلقت المعانقة الوجه والذكاء المادي نموذج الروبوت الأساسي الثوري PI0 ، وهو أول نموذج مفتوح المصدر الذي يمكنه تحويل أوامر اللغة الطبيعية مباشرة إلى إجراءات آلية ، مما يمثل دخول حقبة جديدة من التكنولوجيا الآلية. لا تظهر تقنية الاختراق هذه إمكانات كبيرة في مجالات متعددة فحسب ، بل تشير أيضًا إلى اتجاه التطوير المستقبلي للروبوتات الذكية.
أطلقت الوجه المعانقة والذكاء المادي بشكل مشترك نموذج الروبوت الأساسي لصنع الحقبة ، وهو أول نموذج مفتوح المصدر يمكنه تحويل أوامر اللغة الطبيعية مباشرة إلى إجراءات آلية ، مما يمثل دخول حقبة جديدة من التكنولوجيا الآلية.
تم تدريب طراز PI0 على سبعة منصات روبوت مختلفة وماجستير 68 فريدة من نوعها ، قادرة على إجراء عمليات معقدة من طي الملابس إلى طاولات التعبئة. يستخدم النموذج تقنية مطابقة التدفق المبتكرة لتوليد مسارات حركة سلسة في الوقت الفعلي بتردد 50 هرتز ، مما يضمن دقة عالية للغاية.
والأكثر جدارة بالملاحظة هو أن فريق البحث والتطوير في وقت واحد أطلق الإصدار الذي تمت ترقيته من PI0-fast ، واعتماد مخطط علامات تسلسل جديد للفضاء ، مما يزيد من سرعة التدريب بمقدار 5 مرات ويوضح القدرة على التكيف بين الوصايا الأقوى.
وقال ريمي كادين ، كبير علماء الأبحاث في Hugging Face: "PI0 هو نموذج عمل اللغة البصرية الأكثر تقدماً ، والذي يمكنه تحويل أوامر اللغة الطبيعية مباشرة إلى سلوك مستقل." بحاجة إلى بضعة أسطر من الكود.
يمكن أن يعيد هذا الاختراق إعادة تشكيل صناعات متعددة: يمكن لمصانع التصنيع إعادة تكوين المهام الآلية من خلال التعليمات اللفظية ، يمكن للتخزين والخدمات اللوجستية نشر أنظمة أتمتة أكثر مرونة ، وحتى الشركات الصغيرة يمكن أن تتبنى الروبوتات بسهولة أكبر. ومع ذلك ، تبقى التحديات من حيث متطلبات موارد الحوسبة والموثوقية والأمن.
بالنسبة لصناعة الذكاء الاصطناعى بأكمله ، فإن إصدار PI0 هو الصحيح. مع المنافسة الشرسة بشكل متزايد في تطوير الذكاء الاصطناعي العام ، قامت هذه التكنولوجيا بنجاح ببناء جسر بين نماذج اللغة والعالم المادي ، مما يشير إلى اتجاه تطوير الروبوتات الذكية في المستقبل.
إن إطلاق نموذج PI0 ليس فقط قفزة في تكنولوجيا الروبوتات ، ولكن أيضًا علامة فارقة مهمة في التكامل العميق للذكاء الاصطناعي والعالم المادي ، مما يشير إلى أن الروبوتات الذكية ستكون أكثر شعبية وكفاءة في المستقبل.