Waymo verwendet Gemini von Google, um seine selbstfahrenden Taxi-Trainingsmethoden zu revolutionieren. Im Zentrum dieses Durchbruchs befindet sich ein multimodales Modell von End-to-End-namens Emma, das Sensordaten effizienter verarbeiten kann und damit genauere Vorhersagen für die zukünftige Fahrbahn generiert. Dieser Schritt verbessert nicht nur die Intelligenz und Sicherheit des autonomen Fahrsystems von Waymo, sondern markiert auch einen großen Sprung in der Anwendung von großsprachigen Modellen im Bereich des autonomen Fahrens, was darauf hinweist Seien Sie schlauer, entwickeln Sie sich in unabhängigerer Richtung.
Vor kurzem hat Waymo einen weiteren wichtigen Schritt im Bereich des autonomen Fahrens gemacht. Das Unternehmen hat seine Zusammenarbeit mit Google DeepMind lange als seinen Wettbewerbsvorteil angesehen und nutzt nun das multimodale Großsprachmodell von Google, Gemini, um die Ausbildung seiner selbstfahrenden Taxis zu verbessern.
Waymo hat ein neues Forschungspapier veröffentlicht, in dem ein "End-to-End-multimodales Modell" namens Emma eingeführt wird, das Sensordaten verarbeiten kann, um die zukünftige Fahrbahn autonomer Fahrzeuge zu generieren. Dies bedeutet, dass die fahrerlosen Fahrzeuge von Waymo Fahren intelligenter und effektiveren Hindernisse vermeiden können.
Die Bedeutung dieser neuen Technologie liegt nicht nur in ihrer Innovation, sondern auch in ihrem Potenzial, den Anwendungsbereich der meisten großartigen Sprachmodelle zu ändern. Waymo möchte MLLM als „Bürger der Klasse 1“ seines autonomen Fahrsystems ansehen, was bedeutet, dass zukünftige autonome Fahren möglicherweise sehr unterschiedlich von aktuellen Chatbots oder Bildgeneratoren unterscheiden.
In diesem Artikel erwähnte Waymo, dass traditionelle autonome Fahrsysteme normalerweise spezifische "Module" für verschiedene Funktionen entwickeln, einschließlich Wahrnehmung, Zuordnung, Vorhersage und Planung. Während dieser Ansatz in den letzten Jahren einige Fortschritte erzielt hat, sind seine Einschränkungen auch offensichtlich, insbesondere im Umgang mit neuen und komplexen Umgebungen. Waymo ist der Ansicht, dass MLLMs wie Gemini diese Probleme lösen können, weil sie über umfassendes "Weltwissen" verfügen und in der Lage sind, "Ketten -Denken" durchzuführen, um menschliches logisches Denken zu simulieren.
Das Emma-Modell wurde entwickelt, um Waymo's selbstfahrende Taxis in komplexen Umgebungen zu unterstützen. Wenn beispielsweise Situationen wie Tiere oder Straßenbau auftreten, kann Emma fahrerlosen Autos helfen, den besten Fahrweg zu finden. Waymo stellte jedoch auch fest, dass Emma einige Einschränkungen aufweist, wie z. B. die derzeitige Unfähigkeit, 3D -Sensoreingänge aus Lidar oder Radar zu verarbeiten.
Die Forschung von Waymo in diesem Bereich erfordert eine weitere Tiefe, hoffen jedoch, dass diese Leistung zu mehr Forschungsergebnissen inspirieren wird, um aktuelle Probleme anzugehen und die Entwicklung autonomer Fahrtechnologie zu fördern.
Schlüsselpunkte:
Waymo verwendet das Gemini-Modell von Google, um ein neues autonomes Taxi-Schulungssystem, Emma, zu entwickeln, um die Entscheidungsfunktionen zu verbessern.
Das EMMA -Modell kann komplexe Sensordaten verarbeiten und fahrerlose Fahrzeuge intelligent zu vermeiden.
Während Emma Potenzial hat, erkennt Waymo an, dass noch weitere Forschungen erforderlich sind, um seine bestehenden Einschränkungen zu überwinden.
Das EMMA -Modell von Waymo stellt einen erheblichen Sprung in der autonomen Fahrtechnologie dar, der große Sprachmodelle nutzt, um multimodale Daten zu verarbeiten, um den Weg für sicherere und intelligentere autonome Fahrsysteme in Zukunft zu ebnen. Obwohl die Herausforderungen bestehen bleiben, bringt diese Studie zweifellos neue Hoffnung für die zukünftige Entwicklung des Bereichs des autonomen Fahrens.