L'éditeur de Downcodes a appris que Waymo avait lancé un nouveau modèle d'IA EMMA - un modèle de conduite autonome multimodal de bout en bout. Ce modèle est basé sur le puissant système d'intelligence artificielle Gemini et vise à améliorer la compréhension et les capacités de prise de décision de la technologie de conduite autonome dans des conditions routières complexes. Le modèle EMMA a démontré d'excellentes performances dans plusieurs tâches clés telles que la planification de mouvements et la détection d'objets 3D, et en intégrant des données multimodales, il a considérablement amélioré la précision de la prédiction de chemin, de la détection d'objets et de la compréhension des feuilles de route. Les résultats de la recherche de Waymo ouvrent de nouvelles orientations pour l’innovation future en matière de technologie de conduite autonome.
Waymo a déclaré que le modèle EMMA exploite pleinement les connaissances approfondies et les capacités de raisonnement de Gemini, et peut traiter les entrées brutes de la caméra et les données textuelles pour générer diverses sorties de conduite, et en établissant un espace linguistique unifié, améliorer le processus de prise de décision et améliorer l'efficacité. de planification de bout en bout. Cela témoigne de l’énorme potentiel des modèles multimodaux dans le domaine de la conduite autonome et ouvre également de nouvelles possibilités pour l’application de la technologie de l’IA dans des environnements dynamiques complexes. Drago Anguelov, vice-président et responsable de la recherche chez Waymo, est confiant dans le développement futur d'EMMA et a hâte d'explorer davantage le rôle des méthodes multimodales dans la construction de systèmes de conduite plus polyvalents et adaptables.
Les résultats de la recherche de Waymo montrent que la construction d’EMMA offre une direction de recherche prometteuse pour la combinaison de tâches de conduite autonome plus essentielles à l’avenir. Drago Anguelov, vice-président et responsable de la recherche chez Waymo, a déclaré : « EMMA démontre la puissance et l'importance des modèles multimodaux dans le domaine de la conduite autonome. Nous sommes impatients d'explorer davantage comment les méthodes et composants multimodaux peuvent aider à créer des modèles plus polyvalents et adaptables. .système de conduite.
EMMA fonctionne également bien en termes de capacité à gérer les entrées brutes de la caméra et les données textuelles. Il peut générer divers résultats moteurs et exploiter pleinement les connaissances mondiales et les capacités de raisonnement de Gemini en établissant un espace linguistique unifié pour améliorer le processus de prise de décision et améliorer l'efficacité de la planification de bout en bout.
Waymo a souligné que l'importance de cette recherche ne se limite pas à l'application des voitures autonomes, mais étend également les capacités de l'IA dans des environnements dynamiques complexes en appliquant une technologie avancée d'IA à des tâches du monde réel.
Le modèle EMMA publié par Waymo constitue non seulement un saut technologique dans le domaine de la conduite autonome, mais fournit également de nouvelles idées pour l'application de l'intelligence artificielle dans des scénarios complexes. Son intégration multimodale et son concept de conception de bout en bout favoriseront le développement de la technologie de conduite autonome dans une direction plus sûre et plus fiable. Nous attendons avec impatience que le modèle EMMA nous apporte encore plus de surprises à l'avenir !