A Zhipu AI lançou recentemente um novo produto baseado na tecnologia GLM, AutoGlm, um órgão inteligente que pode simular a operação humana de telefones celulares e executar várias tarefas diárias. O surgimento de autoglm marca um grande avanço na IA no campo dos aplicativos de telefones celulares. vida. . Sua lógica operacional é semelhante à dos seres humanos, sem processos complexos, e o limiar para uso é extremamente baixo.
A AutoGlm pode executar uma variedade de tarefas, como e comentar os momentos do WeChat, comprando produtos de pedidos históricos no Taobao, reservando hotéis no CTRIP, comprando bilhetes de trem em 12306, ordenando concursos em Meituan, etc. Seus cenários de aplicação não se limitam a isso.
Atualmente, os usuários podem experimentar o AutoGLM-Web instalando o plug-in "Zhipu Qingyan", que é um assistente de navegador que pode simular usuários que visitam páginas da web, clicando em páginas da Web e concluir automaticamente a pesquisa avançada, o resumo e a geração de conteúdo no site. Além disso, a AutoGLM também abriu um aplicativo de testes internos em sistemas Android e realizou uma cooperação aprofundada com fabricantes de telefonia móvel, como a honra.
A tecnologia da AutoGLM é baseada na auto-desenvolvida "agente básico de Zhipu, interface intermediária" e "Curso on-line de auto-evolução da estrutura de aprendizagem reforçada", que resolve o antagonismo da capacidade, as tarefas de treinamento e a escassez de dados no planejamento de tarefas de grandes modelos de modelos e execução de ação. Problemas como sinais de feedback escassos e desvio de distribuição de estratégia. O AutoGlm pode melhorar continuamente e melhorar continuamente seu próprio desempenho constantemente, semelhante às pessoas constantemente obtendo novas habilidades durante seu crescimento.
Em termos de desafios técnicos, o AutoGLM resolve o problema de "execução de ação" insuficientes e "planejamento de tarefas" insuficientes. Através do design da "interface intermediária do agente básico", ele decompa os dois estágios de "planejamento de tarefas" e "execução de ação" através da interface intermediária de linguagem natural, alcançando uma grande melhoria nas capacidades do agente. Ao mesmo tempo, a AutoGLM adota a "estrutura de aprendizado de reforço de curso on-line de auto-evolução" para aprender e melhorar as capacidades de agentes de grandes modelos nos ambientes da Web e do telefone em ambientes on-line reais.
A AutoGLM alcançou melhorias significativas de desempenho no uso do telefone e no uso do navegador da Web e superou o desempenho dos GPT-4O e do Claude-3.5 Sonet nos benchmarks de avaliação do Androidlab. Na referência de avaliação de Webarena-Lite, a AutoGlM alcançou cerca de 200% de melhoria de desempenho em comparação com o GPT-4O, reduzindo a lacuna na taxa de sucesso entre humanos e grandes agentes modelo na manipulação da GUI.
Endereço do projeto: https://xiao9905.github.io/autoglm
Com suas poderosas funções e inovação tecnológica, a AutoGLM demonstrou o enorme potencial de inteligência artificial no campo da operação de telefones celulares, trazendo mais conveniência à vida cotidiana das pessoas. Seu excelente desempenho nos testes de desempenho também prova sua força técnica. No futuro, com o avanço contínuo da tecnologia, a AutoGLM deve alcançar aplicativos mais amplos e criar mais valor para os usuários.