智譜AI推出AutoGLM智能體：輸入指令即可模擬人類操作手機- AI文章

作者：Eve Cole 更新時間：2025-02-08 21:16:01

智譜AI近期發布了基於GLM技術的新產品AutoGLM，這是一個能夠模擬人類操作手機，執行各種日常任務的智能體。 AutoGLM的出現標誌著AI在手機應用領域的重大突破，它能夠在微信、淘寶、攜程、12306、美團等常用應用上完成各種操作，極大提升了用戶效率，並將AI應用融入日常生活。其操作邏輯與人類相似，無需複雜的流程搭建，使用門檻極低。

微信截图_20241026150533.png

AutoGLM能夠執行多種任務，如在微信上點贊並評論朋友圈、在淘寶上購買歷史訂單產品、在攜程上預訂酒店、在12306上購買火車票、在美團上點外賣等。它的應用場景不僅限於此，理論上，AutoGLM可以完成人類在可視化電子設備上能做的任何事，操作邏輯與人類類似，無需複雜的工作流搭建。

目前，用戶可以通過安裝“智譜清言”插件體驗AutoGLM-Web，這是一個瀏覽器助手，能夠模擬用戶訪問網頁、點擊網頁，並在網站上自動完成高級檢索、總結與內容生成。此外，AutoGLM也在安卓系統上開放了內測申請，並與榮耀等手機廠商開展了深度合作。

微信截图_20241026150714.png

AutoGLM的技術基於智譜自研的“基礎智能體解耦合中間界面”和“自進化在線課程強化學習框架”，解決了大模型智能體任務規劃和動作執行中的能力拮抗、訓練任務和數據稀缺、反饋信號稀少和策略分佈漂移等問題。 AutoGLM能夠不斷自我改進、持續穩定地提高自身性能，類似於人在成長過程中不斷獲取新技能。

在技術挑戰方面，AutoGLM解決了“動作執行”不夠精確和“任務規劃”不夠靈活的問題。它通過“基礎智能體解耦合中間界面”設計，將“任務規劃”與“動作執行”兩個階段通過自然語言中間界面進行解耦合，實現了智能體能力的極大提升。同時，AutoGLM採用了“自進化在線課程強化學習框架”，在真實在線環境中學習和提升大模型智能體在Web和Phone環境中的能力。

AutoGLM在Phone Use和Web Browser Use上都取得了顯著的性能提升，並在AndroidLab評測基准上超越了GPT-4o和Claude-3.5-Sonnet的表現。在WebArena-Lite評測基準中，AutoGLM相對GPT-4o取得了約200%的性能提升，縮小了人類和大模型智能體在GUI操控上的成功率差距。

項目地址:https://xiao9905.github.io/AutoGLM

AutoGLM憑藉其強大的功能和技術創新，展現了人工智能在手機操作領域的巨大潛力，為人們的日常生活帶來了更多便利。其在性能測試中的優異表現也證明了其技術實力。未來，隨著技術的不斷進步，AutoGLM有望實現更廣泛的應用，為用戶創造更多價值。