Waymo kündigte kürzlich einen großen Durchbruch an und entwickelte ein neues Trainingsmodell, das auf der selbstfahrenden Taxientwicklung von Google basierend auf dem multimodalen Großsprachmodell (MLLM) auf Basis von Google basiert. Dieses neue Modell namens EMMA (End-to-End-multimodales Modell für autonomes Fahren) kann Sensordaten verarbeiten, um zukünftige Trajektorien für autonome Fahrzeuge zu generieren und fahrerlose Autos dabei zu helfen, zu entscheiden, wohin sie gehen und wie man Hindernisse vermeidet.
Das Emma -Modell ist eines der ersten Anzeichen dafür, dass die Führungskräfte im autonomen Fahrplan MLLMs in ihren Operationen verwenden, was darauf hindeutet Anwendung in.
Laut dem Forschungsteam von Waymo bietet MLLMS wie Gemini aus zwei Gründen interessante Lösungen für autonome Fahrsysteme: Chatbots sind ein "Generalist", der "mehr als das liefern kann, nachdem sie auf einer großen Menge an Daten geschult wurden, die aus dem Internet gekrabbt sind" Wissen 'von Inhalten, die in gewöhnlichen treibenden Protokollen enthalten sind;
Das EMMA -Modell von Waymo ist in der Vorhersage von Trajektorien, Objekterkennung und Roadmap -Verständnis gut abgestimmt, weist aber auch Einschränkungen auf, z. Die Verwendung von MLLM zur Ausbildung von selbstfahrenden Taxis stellt auch Risiken dar, wie beispielsweise Modelle Halluzinationen erleben oder einfache Aufgaben nicht erledigen können
. Daher sagte Waymo, dass weitere Untersuchungen erforderlich sind, um diese Probleme zu lindern und die neuesten Technologien in der autonomen Fahrmodellarchitektur weiter zu entwickeln.
Der Durchbruch von Waymo zeigt die zukünftige Entwicklungsrichtung der autonomen Fahrtechnologie und bringt neue Hoffnung und Herausforderungen in die Branche.