Zhipu AI lanzó recientemente un nuevo producto basado en la tecnología GLM, Autoglm, un cuerpo inteligente que puede simular el funcionamiento humano de los teléfonos móviles y realizar varias tareas diarias. La aparición de autoglm marca un gran avance en la IA en el campo de las aplicaciones de teléfonos móviles. vida. . Su lógica operativa es similar a la de los humanos, sin procesos complejos, y el umbral de uso es extremadamente bajo.
Autoglm puede realizar una variedad de tareas, como y comentar sobre momentos de WeChat, comprar productos de pedido histórico en Taobao, reservar hoteles en Ctrip, comprar boletos de tren en 12306, ordenar comida para llevar en Meituan, etc. Sus escenarios de aplicación no se limitan a esto.
Actualmente, los usuarios pueden experimentar autoglm-Web mediante la instalación del complemento "Zhipu Qingyan", que es un asistente de navegador que puede simular a los usuarios que visitan páginas web, haciendo clic en páginas web y completar automáticamente la búsqueda de búsqueda, resumen y contenido avanzado en el sitio web. Además, AutoGLM también ha abierto una aplicación para pruebas internas en sistemas Android y ha llevado a cabo una profunda cooperación con fabricantes de teléfonos móviles como Honor.
La tecnología de AutoGLM se basa en la autodescarrabilidad de la "interfaz intermedia de desacoplamiento de agentes básicos de Zhipu" y el "marco de aprendizaje reforzado con el curso en línea de la autoevolución", que resuelve el antagonismo de la capacidad, las tareas de capacitación y la escasez de datos en la planificación de tareas de los agentes de modelos grandes y la ejecución de la acción. problemas como las señales de retroalimentación escasa y la distribución de la estrategia a la deriva. Autoglm puede mejorarse continuamente y mejorar continuamente su propio rendimiento constantemente, similar a las personas que constantemente obtienen nuevas habilidades durante su crecimiento.
En términos de desafíos técnicos, AutoGlm resuelve el problema de la "ejecución de acción" insuficiente y la "planificación de tareas" insuficiente. A través del diseño de la "interfaz intermedia de desacoplamiento de agentes básicos", desacopla las dos etapas de "planificación de tareas" y "ejecución de acción" a través de la interfaz intermedia del lenguaje natural, logrando una gran mejora en las capacidades del agente. Al mismo tiempo, Autoglm adopta el "Marco de aprendizaje de refuerzo de cursos en línea de autoevolución" para aprender y mejorar las capacidades de los agentes de modelos grandes en los entornos de la web y telefónica en entornos en línea reales.
AutoGLM ha logrado mejoras significativas de rendimiento tanto en el uso del teléfono como en el uso del navegador web, y ha superado el rendimiento de GPT-4O y Claude-3.5-Ennet en AndroidLab Evaluation Benchs. En el punto de referencia de evaluación de Webarena-Lite, AutoGlm logró aproximadamente el 200% de mejora del rendimiento en comparación con GPT-4O, reduciendo la brecha en la tasa de éxito entre humanos y agentes modelo grandes en la manipulación de la GUI.
Dirección del proyecto: https://xiao9905.github.io/autoglm
Con sus poderosas funciones e innovación tecnológica, Autoglm ha demostrado el enorme potencial de inteligencia artificial en el campo de la operación de teléfonos móviles, lo que brinda más conveniencia a la vida cotidiana de las personas. Su excelente rendimiento en las pruebas de rendimiento también demuestra su fuerza técnica. En el futuro, con el avance continuo de la tecnología, se espera que AutoGLM alcance aplicaciones más amplias y cree más valor para los usuarios.