O Instituto de Pesquisa da Indústria Inteligente (AIR) da Universidade de Tsinghua lançou o mais recente modelo de IA AutoDroid-V2 em 24 de dezembro de 2024, com o objetivo de melhorar significativamente a eficiência do controle de automação de dispositivos móveis. Este modelo adota de forma inovadora um método de script baseado em um modelo de linguagem pequena em vez de depender de um modelo de linguagem grande na nuvem. Ele resolve efetivamente os problemas de alto consumo de tráfego e altos riscos de privacidade e segurança nos métodos tradicionais, melhorando assim a experiência do usuário e reduzindo. custos operacionais do lado do servidor.
Recentemente, o Instituto de Pesquisa da Indústria Inteligente (AIR) da Universidade Tsinghua lançou um modelo de IA chamado AutoDroid-V2 em 24 de dezembro de 2024, com o objetivo de otimizar as capacidades de controle de automação de dispositivos móveis. Este modelo melhora significativamente a eficiência das operações dos usuários através da linguagem natural através da aplicação de pequenos modelos de linguagem.
O AutoDroid-V2 adota uma abordagem baseada em script, diferente da abordagem tradicional que depende de grandes modelos de linguagem (LLM) na nuvem. Esta inovação permite que o dispositivo execute com eficiência as instruções do usuário e reduza a dependência de serviços em nuvem, melhorando significativamente a privacidade e a segurança. Ao mesmo tempo, também reduz o consumo de tráfego do lado do utilizador e os custos operacionais do lado do servidor, e promove a aplicação generalizada de dispositivos móveis.
No contexto do projeto, nos últimos anos, o surgimento de grandes modelos de linguagem e de modelos de linguagem visual tornou possível controlar dispositivos móveis através de comandos de linguagem natural. Essas tecnologias fornecem novas maneiras de resolver tarefas complexas do usuário. No entanto, a abordagem tradicional do "agente GUI passo a passo" tem problemas com alto consumo de tráfego e riscos de segurança de privacidade, fazendo com que a implantação em larga escala enfrente obstáculos.
A inovação do AutoDroid-V2 é que ele pode gerar scripts de várias etapas com base nas instruções do usuário para executar várias operações da GUI ao mesmo tempo. Este método reduz bastante a frequência de consulta, reduz o consumo de recursos e pode gerar e executar scripts de tarefas diretamente no dispositivo do usuário. Esse modelo cria a documentação do aplicativo off-line, estabelecendo a base para a geração subsequente de scripts.
No teste de desempenho, o AutoDroid-V2 conduziu um teste de benchmark de 226 tarefas em 23 aplicativos móveis. Em comparação com modelos anteriores, como AutoDroid e SeeClick, a taxa de conclusão de tarefas aumentou 10,5% para 51,7%. Além disso, seu consumo de token de entrada e saída é reduzido para 1/43,5 e 1/5,8, respectivamente, e a latência de inferência do modelo é reduzida para 5,7 a 13,4 vezes do original. Estes resultados mostram a eficiência e confiabilidade do AutoDroid-V2 em aplicações práticas.
Destaques:
AutoDroid-V2 é um novo modelo de IA lançado pela Universidade Tsinghua que melhora a eficiência do controle de linguagem natural de dispositivos móveis.
Este modelo reduz a dependência de serviços em nuvem através de modelos de linguagem pequena e aumenta a privacidade e a segurança do usuário.
Testes de benchmark mostram que o AutoDroid-V2 apresenta melhorias significativas na taxa de conclusão de tarefas e no consumo de recursos, demonstrando um forte potencial de aplicação.
Em suma, o AutoDroid-V2 oferece uma nova solução para o controle automatizado de dispositivos móveis com alta eficiência, segurança e baixo custo, mostrando suas enormes perspectivas de aplicação. Vale a pena aguardar seu desenvolvimento futuro e aplicações mais amplas.