Le dernier modèle de conduite autonome multimodal de bout en bout de Waymo, Emma, a attiré l'attention de l'industrie. Le modèle EMMA est construit sur le modèle de langue Gémeaux de Google. Le modèle a d'excellentes performances dans les tâches critiques telles que la prédiction de chemin, la détection d'objets et la compréhension de la carte routière. Pour le développement futur de la technologie de conduite autonome.
Récemment, Waymo a officiellement publié un modèle de recherche sur l'IA intitulé «Modèle de conduite autonome multimodal de bout en bout» (EMMA). Le modèle est spécialement formé et affiné pour la technologie de conduite autonome, tirant parti des connaissances approfondies de Gemini pour mieux comprendre les scénarios routiers complexes. Waymo détaille la philosophie de conception et les avantages techniques du modèle dans son article de recherche publié et explore les avantages et les inconvénients des approches pures de bout en bout.
Waymo a déclaré que le modèle Emma est basé sur les Gémeaux, tirant pleinement parti de ses capacités pour se concentrer sur des tâches de conduite autonomes telles que la planification de mouvement et la détection d'objets 3D. Ce modèle démontre de bonnes capacités de migration des tâches dans plusieurs tâches de conduite autonomes critiques. Waymo a souligné qu'Emma a considérablement amélioré les performances de la prédiction du chemin, de la détection d'objets et de la compréhension de la feuille de route, par rapport à la formation de modèles individuels pour chaque tâche.
Les résultats de la recherche de Waymo montrent que la construction d'Emma fournit une orientation de recherche prometteuse pour la combinaison de tâches de conduite autonomes plus de base à l'avenir. Drago Anguelov, vice-président et chef de la recherche chez Waymo, a déclaré: «Emma démontre les capacités puissantes et l'importance des modèles multimodaux dans le domaine de la conduite autonome, et nous sommes impatients d'explorer plus loin comment les méthodes et les composants multimodaux peuvent aider à construire plus polyvalent et plus Système de conduite adaptable. »
Emma a également bien performé dans sa capacité à traiter les données brutes d'entrée de caméra et de texte. Il peut générer divers résultats de conduite et améliorer l'efficacité de la planification de bout en bout en établissant un espace linguistique unifié, en utilisant pleinement les connaissances mondiales et les capacités du raisonnement des Gémeaux.
Waymo a souligné que l'importance de cette recherche ne se limite pas à l'application de véhicules autonomes, mais élargit également les capacités de l'IA dans des environnements dynamiques complexes en appliquant des technologies d'IA avancées aux tâches du monde réel.
Points clés:
Le modèle Emma est conçu pour une formation autonome de conduite, en utilisant les connaissances Gemini pour comprendre les scénarios routiers complexes.
Par rapport aux modèles traditionnels, Emma montre des performances plus efficaces à des fins critiques de mission.
Les résultats de la recherche sont non seulement appliqués à la conduite autonome, mais aussi pour étendre le potentiel d'application de l'IA dans des environnements dynamiques.
En bref, la publication du modèle EMMA marque un progrès significatif dans le domaine de la technologie de conduite autonome. Technologie d'intelligence artificielle.