El editor de Downcodes se enteró de que Waymo ha lanzado un nuevo modelo de IA EMMA, un modelo de conducción autónoma multimodal de extremo a extremo. Este modelo se basa en el potente sistema de inteligencia artificial Gemini y tiene como objetivo mejorar la comprensión y las capacidades de toma de decisiones de la tecnología de conducción autónoma en condiciones complejas de la carretera. El modelo EMMA ha demostrado un rendimiento excelente en múltiples tareas clave, como la planificación de movimiento y la detección de objetos 3D, y al integrar datos multimodales, ha mejorado significativamente la precisión de la predicción de rutas, la detección de objetos y la comprensión de mapas de carreteras. Los resultados de la investigación de Waymo brindan nuevas direcciones para la innovación futura en tecnología de conducción autónoma.
Waymo dijo que el modelo EMMA aprovecha al máximo el amplio conocimiento y las capacidades de razonamiento de Gemini y puede procesar entradas de cámara y datos de texto sin procesar para generar diversas salidas de conducción y, al establecer un espacio de lenguaje unificado, mejorar el proceso de toma de decisiones y mejorar la eficiencia. de planificación de extremo a extremo. Esto marca el enorme potencial de los modelos multimodales en el campo de la conducción autónoma y también abre nuevas posibilidades para la aplicación de la tecnología de IA en entornos dinámicos complejos. Drago Anguelov, vicepresidente y jefe de investigación de Waymo, confía en el desarrollo futuro de EMMA y espera explorar más a fondo el papel de los métodos multimodales en la construcción de sistemas de conducción más versátiles y adaptables.
Los resultados de la investigación de Waymo muestran que la construcción de EMMA proporciona una dirección de investigación prometedora para la combinación de tareas más básicas de conducción autónoma en el futuro. Drago Anguelov, vicepresidente y jefe de investigación de Waymo, dijo: “EMMA demuestra el poder y la importancia de los modelos multimodales en el campo de la conducción autónoma. Esperamos seguir explorando cómo los métodos y componentes multimodales pueden ayudar a construir modelos más versátiles y adaptables. . sistema de conducción”.
EMMA también funciona bien en términos de su capacidad para manejar datos de texto y entradas de cámara sin procesar. Puede generar diversos resultados impulsores y aprovechar al máximo el conocimiento mundial y las capacidades de razonamiento de Gemini al establecer un espacio de lenguaje unificado para mejorar el proceso de toma de decisiones y mejorar la eficiencia de la planificación de un extremo a otro.
Waymo enfatizó que la importancia de esta investigación no se limita a la aplicación de vehículos autónomos, sino que también amplía las capacidades de la IA en entornos dinámicos complejos mediante la aplicación de tecnología avanzada de IA a tareas del mundo real.
El modelo EMMA lanzado por Waymo no sólo supone un salto tecnológico en el campo de la conducción autónoma, sino que también aporta nuevas ideas para la aplicación de la inteligencia artificial en escenarios complejos. Su integración multimodal y su concepto de diseño de extremo a extremo promoverán el desarrollo de la tecnología de conducción autónoma en una dirección más segura y confiable. ¡Esperamos que el modelo EMMA nos traiga más sorpresas en el futuro!