Waymo เพิ่งประกาศความก้าวหน้าครั้งใหญ่พัฒนารูปแบบการฝึกอบรมใหม่ตามรูปแบบภาษาขนาดใหญ่หลายรูปแบบของ Google (MLLM) ราศีเมถุนสำหรับการพัฒนาแท็กซี่ขับรถด้วยตนเอง รุ่นใหม่นี้เรียกว่า EMMA (แบบจำลองมัลติโมดอลแบบ end-to-end สำหรับการขับขี่แบบอิสระ) สามารถประมวลผลข้อมูลเซ็นเซอร์เพื่อสร้างวิถีการเคลื่อนที่ในอนาคตสำหรับยานพาหนะอัตโนมัติช่วยรถยนต์ที่ไม่มีคนขับตัดสินใจว่าจะไปที่ไหนและจะหลีกเลี่ยงอุปสรรค
โมเดล EMMA เป็นหนึ่งในสัญญาณแรกที่ผู้นำในแผนการขับขี่แบบอิสระใช้ MLLMS ในการดำเนินงานของพวกเขาแนะนำว่า LLM เหล่านี้สามารถหลบหนีการใช้งานปัจจุบันของพวกเขาในฐานะแชทบอทผู้จัดการอีเมลและเครื่องกำเนิดภาพและในสภาพแวดล้อมใหม่บนท้องถนนค้นหา แอปพลิเคชันใน
ทีมวิจัยของ Waymo กล่าวว่า MLLMS เช่น Gemini เป็นโซลูชั่นที่น่าสนใจสำหรับระบบขับขี่แบบอิสระด้วยเหตุผลสองประการ: Chatbots เป็น "Generalist" ที่ "สามารถให้มากกว่านั้นหลังจากได้รับการฝึกฝนเกี่ยวกับข้อมูลจำนวนมากที่รวบรวมข้อมูลจากอินเทอร์เน็ต" ความรู้ของเนื้อหาที่มีอยู่ในบันทึกการขับขี่ทั่วไป
โมเดล EMMA ของ Waymo ทำงานได้ดีในการทำนายวิถีการตรวจจับวัตถุและความเข้าใจบนแผนงาน แต่ยังมีข้อ จำกัด เช่นการไร้ความสามารถในการรวมอินพุตเซ็นเซอร์ 3 มิติจาก LIDAR หรือเรดาร์และสามารถประมวลผลเฟรมภาพจำนวนน้อยในแต่ละครั้ง การใช้ MLLM เพื่อฝึกแท็กซี่ขับด้วยตนเองยังมีความเสี่ยงเช่นรุ่นอาจมีอาการหลอนหรือไม่สามารถทำงานได้อย่างง่าย
- ดังนั้น Waymo กล่าวว่าจำเป็นต้องมีการวิจัยเพิ่มเติมเพื่อบรรเทาปัญหาเหล่านี้และพัฒนาเทคโนโลยีล่าสุดในสถาปัตยกรรมแบบจำลองการขับขี่แบบอิสระ
ความก้าวหน้าของ Waymo แสดงให้เห็นถึงทิศทางการพัฒนาในอนาคตของเทคโนโลยีการขับขี่แบบอิสระและนำความหวังและความท้าทายใหม่ ๆ มาสู่อุตสาหกรรม