Waymoは、Googleの強力なマルチモーダル大手言語モデルGeminiを使用して、自動運転のタクシートレーニング方法に革命をもたらしています。このブレークスルーの中心には、EMMAと呼ばれるエンドツーエンドのマルチモーダルモデルがあり、センサーデータをより効率的に処理できるため、将来の運転軌道のより正確な予測を生成できます。この動きは、Waymoの自律運転システムの知性と安全性を改善するだけでなく、自律運転の分野での大規模な言語モデルの適用における大きな飛躍を示しています。より賢く、より独立した方向に発達します。
最近、Waymoは自律運転の分野におけるもう1つの重要な一歩を踏み出しました。同社は長い間、Google DeepMindとのコラボレーションを競争上の優位性と見なしており、現在ではGoogleのマルチモーダルな大手言語モデルであるGeminiを活用して、自動運転タクシーのトレーニングを改善しています。
Waymoは、EMMAと呼ばれる「エンドツーエンドマルチモーダルモデル」を導入する新しい研究論文をリリースしました。これは、センサーデータを処理して、自律車の将来の駆動軌道を生成することができます。これは、Waymoの無人車両が運転の決定をよりインテリジェントに、そして効果的に障害を回避できるようにすることを意味します。
この新しいテクノロジーの重要性は、その革新だけでなく、現在のほとんどの大規模な言語モデルのアプリケーションの範囲を変える可能性にもあります。 Waymoは、MLLMを自律運転システムの「クラス1市民」と見なしたいと考えています。つまり、将来の自律運転は現在のチャットボットや画像ジェネレーターとは大きく異なる可能性があります。
この論文では、Waymoは、従来の自律駆動システムが通常、知覚、マッピング、予測、計画など、さまざまな機能に対して特定の「モジュール」を開発すると述べました。このアプローチは過去数年間である程度進歩しましたが、特に新しい環境を扱う場合、その制限も明らかです。 Waymoは、GeminiのようなMLLMがこれらの問題を解決できると考えています。なぜなら、彼らは広範な「世界知識」を持ち、人間の論理的推論をシミュレートするために「チェーン思考の推論」を実行できるからです。
EMMAモデルは、Waymoの自動運転タクシーが複雑な環境でナビゲートするのを支援するために開発されました。たとえば、動物や道路建設などの状況に遭遇すると、エマは無人車が最適な運転道を見つけるのを助けることができます。しかし、Waymoはまた、Emmaには、Lidarまたはレーダーから3Dセンサー入力を処理できないことなど、いくつかの制限があることに気付きました。
この分野でのWaymoの研究にはさらに深さが必要ですが、この成果が現在の問題に対処し、自律運転技術の開発を促進するためのより多くの研究を刺激することを望んでいます。
キーポイント:
Waymoは、GoogleのGeminiモデルを使用して、意思決定能力を向上させるために、新しい自律タクシートレーニングシステムEmmaを開発しています。
EMMAモデルは、複雑なセンサーデータを処理することができ、ドライバーレス車両が障害物をインテリジェントに回避するのに役立ちます。
エマには可能性がありますが、Waymoは、既存の制限を克服するためにさらなる研究が依然として必要であることを認めています。
WaymoのEMMAモデルは、自律運転技術の大幅な飛躍を表しています。これは、大規模な言語モデルを活用してマルチモーダルデータを処理して、将来より安全でよりスマートな自律運転システムへの道を開いています。課題は残っていますが、この研究は間違いなく、自律運転の分野の将来の発展に対する新しい希望をもたらします。