La Universidad de Tsinghua desarrolla el nuevo modelo de lenguaje visual CogAgent para profundizar la comprensión y navegación de la GUI
El equipo de Zhipu AI de la Universidad de Tsinghua lanzó CogAgent, un modelo de lenguaje visual centrado en mejorar la comprensión y navegación de interfaces gráficas de usuario (GUI), utilizando un sistema de codificador dual para procesar elementos GUI
2025-01-10