Waymo ใช้ Gemini แบบจำลองภาษาขนาดใหญ่หลายรูปแบบที่ทรงพลังของ Google เพื่อปฏิวัติวิธีการฝึกอบรมแท็กซี่ด้วยตนเอง หัวใจสำคัญของการพัฒนานี้เป็นแบบจำลองหลายรูปแบบแบบ end-to-end ที่เรียกว่า EMMA ซึ่งสามารถประมวลผลข้อมูลเซ็นเซอร์ได้อย่างมีประสิทธิภาพมากขึ้นซึ่งจะสร้างการคาดการณ์ที่แม่นยำยิ่งขึ้นของวิถีการขับขี่ในอนาคต การเคลื่อนไหวนี้ไม่เพียงช่วยปรับปรุงความฉลาดและความปลอดภัยของระบบขับขี่อิสระของ Waymo แต่ยังนับเป็นการก้าวกระโดดครั้งใหญ่ในการประยุกต์ใช้แบบจำลองภาษาขนาดใหญ่ในด้านการขับขี่แบบอิสระซึ่งบ่งชี้ว่าในอนาคตเทคโนโลยีการขับขี่แบบอิสระ ฉลาดขึ้นพัฒนาไปในทิศทางที่เป็นอิสระมากขึ้น
เมื่อเร็ว ๆ นี้ Waymo ได้ก้าวไปอีกขั้นในการขับขี่ด้วยตนเอง บริษัท ได้พิจารณาความร่วมมือกับ Google Deepmind มานานแล้วว่าเป็นข้อได้เปรียบในการแข่งขันและขณะนี้ใช้ประโยชน์จาก Gemini รุ่นใหญ่หลายรูปแบบของ Google เพื่อปรับปรุงการฝึกอบรมการขับขี่รถแท็กซี่ด้วยตนเอง
Waymo ได้เปิดตัวรายงานการวิจัยใหม่ที่แนะนำ "โมเดลหลายรูปแบบแบบ end-to-end" ที่เรียกว่า Emma ซึ่งสามารถประมวลผลข้อมูลเซ็นเซอร์เพื่อสร้างเส้นทางการขับขี่ในอนาคตของยานพาหนะอัตโนมัติ ซึ่งหมายความว่ายานพาหนะที่ไม่มีคนขับของ Waymo สามารถตัดสินใจขับรถได้อย่างชาญฉลาดและมีประสิทธิภาพมากขึ้นหลีกเลี่ยงอุปสรรค
ความสำคัญของเทคโนโลยีใหม่นี้ไม่เพียง แต่ในนวัตกรรมเท่านั้น แต่ยังมีศักยภาพในการเปลี่ยนขอบเขตของการใช้งานของแบบจำลองภาษาที่มีขนาดใหญ่ที่สุดในปัจจุบัน Waymo ต้องการเห็น MLLM เป็น“ พลเมืองระดับ 1” ของระบบขับขี่แบบอิสระซึ่งหมายความว่าการขับขี่แบบอิสระในอนาคตอาจแตกต่างจากแชทบอทหรือเครื่องกำเนิดภาพในปัจจุบัน
ในบทความนี้ Waymo กล่าวว่าระบบขับขี่แบบอิสระแบบดั้งเดิมมักจะพัฒนา "โมดูล" เฉพาะสำหรับฟังก์ชั่นต่าง ๆ รวมถึงการรับรู้การทำแผนที่การทำนายและการวางแผน ในขณะที่วิธีการนี้มีความคืบหน้าในช่วงไม่กี่ปีที่ผ่านมาข้อ จำกัด ของมันก็ชัดเจนเช่นกันโดยเฉพาะอย่างยิ่งเมื่อต้องรับมือกับสภาพแวดล้อมใหม่และซับซ้อน Waymo เชื่อว่า Mllms อย่างราศีเมถุนสามารถแก้ปัญหาเหล่านี้ได้เพราะพวกเขามี "ความรู้ระดับโลก" ที่กว้างขวางและสามารถดำเนินการ "การคิดการคิดโซ่" เพื่อจำลองการใช้เหตุผลเชิงตรรกะของมนุษย์
โมเดล EMMA ได้รับการพัฒนาขึ้นเพื่อช่วยแท็กซี่ขับรถด้วยตนเองของ Waymo ในสภาพแวดล้อมที่ซับซ้อน ตัวอย่างเช่นเมื่อเผชิญกับสถานการณ์เช่นสัตว์หรือการก่อสร้างถนนเอ็มม่าสามารถช่วยรถยนต์ที่ไม่มีคนขับค้นหาเส้นทางการขับขี่ที่ดีที่สุด อย่างไรก็ตาม Waymo ยังตระหนักว่า Emma มีข้อ จำกัด บางอย่างเช่นการไม่สามารถใช้กระแสไฟฟ้าในการประมวลผลอินพุตเซ็นเซอร์ 3 มิติจาก LiDAR หรือเรดาร์
การวิจัยของ Waymo ในพื้นที่นี้ต้องการความลึกมากขึ้น แต่พวกเขาหวังว่าความสำเร็จนี้จะสร้างแรงบันดาลใจให้กับการวิจัยเพิ่มเติมเพื่อแก้ไขปัญหาในปัจจุบันและส่งเสริมการพัฒนาเทคโนโลยีการขับขี่แบบอิสระ
ประเด็นสำคัญ:
Waymo ใช้รูปแบบ Gemini ของ Google เพื่อพัฒนาระบบการฝึกอบรมแท็กซี่แบบอิสระใหม่ Emma เพื่อปรับปรุงความสามารถในการตัดสินใจ
โมเดล EMMA สามารถประมวลผลข้อมูลเซ็นเซอร์ที่ซับซ้อนช่วยให้ยานพาหนะไร้คนขับหลีกเลี่ยงอุปสรรคอย่างชาญฉลาด
ในขณะที่เอ็มม่ามีศักยภาพ Waymo ยอมรับว่าการวิจัยเพิ่มเติมยังคงต้องใช้เพื่อเอาชนะข้อ จำกัด ที่มีอยู่
โมเดล EMMA ของ Waymo แสดงให้เห็นถึงการก้าวกระโดดอย่างมีนัยสำคัญในเทคโนโลยีการขับขี่แบบอิสระซึ่งใช้ประโยชน์จากแบบจำลองภาษาขนาดใหญ่เพื่อประมวลผลข้อมูลหลายรูปแบบเพื่อปูทางสำหรับระบบขับขี่ที่ปลอดภัยและฉลาดขึ้นในอนาคต แม้ว่าความท้าทายจะยังคงอยู่ แต่การศึกษาครั้งนี้ไม่ต้องสงสัยเลยว่าจะนำความหวังใหม่มาสู่การพัฒนาในอนาคตของสาขาการขับขี่แบบอิสระ