أعلنت Waymo مؤخرًا عن اختراق كبير ، حيث قام بتطوير نموذج تدريبي جديد يعتمد على نموذج Gemini الكبير متعدد الوسائط في Google (MLLM) لتطوير سيارات الأجرة ذاتية القيادة. هذا النموذج الجديد ، المسمى EMMA (نموذج متعدد الوسائط من طرف إلى طرف للقيادة المستقلة) ، قادر على معالجة بيانات المستشعر لتوليد مسارات مستقبلية للمركبات المستقلة ، مما يساعد السيارات بدون سائق على تحديد مكان الذهاب وكيفية تجنب العقبات.
يعد نموذج EMMA أحد العلامات الأولى التي يخطط لها قادة في خطة القيادة المستقلة لاستخدام MLLMs في عملياتهم ، مما يشير إلى أن هذه LLMs يمكنها الهروب التطبيق في.
يقول فريق الأبحاث في Waymo مثل Gemini حلولًا مثيرة للاهتمام لأنظمة القيادة المستقلة لسببين: chatbots هي "خبير عام" "يمكن أن توفر أكثر من ذلك بعد تدريبها على كمية كبيرة من البيانات المزروعة من الإنترنت المعرفة "بالمحتوى الوارد في سجلات القيادة العادية.
يعمل نموذج إيما في Waymo بشكل جيد في التنبؤ بالمسار ، والكشف عن الكائنات ، وفهم خريطة الطريق ، ولكن لديه أيضًا قيود مثل عدم القدرة على دمج مدخلات المستشعرات ثلاثية الأبعاد من Lidar أو الرادار ويمكنها فقط معالجة عدد صغير من إطارات الصور في وقت واحد. إن استخدام MLLM لتدريب سيارات الأجرة ذاتية القيادة يطرح مخاطر ، مثل النماذج قد تواجه الهلوسة أو تفشل في إكمال المهام البسيطة
. لذلك ، قال Waymo إن هناك حاجة إلى مزيد من البحث لتخفيف هذه المشكلات وزيادة تطوير أحدث التقنيات في بنية نموذج القيادة المستقلة.
يوضح اختراق Waymo اتجاه التنمية المستقبلي لتكنولوجيا القيادة المستقلة ويجلب الأمل والتحديات الجديدة للصناعة.