智譜AI近期發布了基於GLM技術的新產品AutoGLM,這是一個能夠模擬人類操作手機,執行各種日常任務的智能體。 AutoGLM的出現標誌著AI在手機應用領域的重大突破,它能夠在微信、淘寶、攜程、12306、美團等常用應用上完成各種操作,極大提升了用戶效率,並將AI應用融入日常生活。其操作邏輯與人類相似,無需複雜的流程搭建,使用門檻極低。
AutoGLM能夠執行多種任務,如在微信上點贊並評論朋友圈、在淘寶上購買歷史訂單產品、在攜程上預訂酒店、在12306上購買火車票、在美團上點外賣等。它的應用場景不僅限於此,理論上,AutoGLM可以完成人類在可視化電子設備上能做的任何事,操作邏輯與人類類似,無需複雜的工作流搭建。
目前,用戶可以通過安裝“智譜清言”插件體驗AutoGLM-Web,這是一個瀏覽器助手,能夠模擬用戶訪問網頁、點擊網頁,並在網站上自動完成高級檢索、總結與內容生成。此外,AutoGLM也在安卓系統上開放了內測申請,並與榮耀等手機廠商開展了深度合作。
AutoGLM的技術基於智譜自研的“基礎智能體解耦合中間界面”和“自進化在線課程強化學習框架”,解決了大模型智能體任務規劃和動作執行中的能力拮抗、訓練任務和數據稀缺、反饋信號稀少和策略分佈漂移等問題。 AutoGLM能夠不斷自我改進、持續穩定地提高自身性能,類似於人在成長過程中不斷獲取新技能。
在技術挑戰方面,AutoGLM解決了“動作執行”不夠精確和“任務規劃”不夠靈活的問題。它通過“基礎智能體解耦合中間界面”設計,將“任務規劃”與“動作執行”兩個階段通過自然語言中間界面進行解耦合,實現了智能體能力的極大提升。同時,AutoGLM採用了“自進化在線課程強化學習框架”,在真實在線環境中學習和提升大模型智能體在Web和Phone環境中的能力。
AutoGLM在Phone Use和Web Browser Use上都取得了顯著的性能提升,並在AndroidLab評測基准上超越了GPT-4o和Claude-3.5-Sonnet的表現。在WebArena-Lite評測基準中,AutoGLM相對GPT-4o取得了約200%的性能提升,縮小了人類和大模型智能體在GUI操控上的成功率差距。
項目地址:https://xiao9905.github.io/AutoGLM
AutoGLM憑藉其強大的功能和技術創新,展現了人工智能在手機操作領域的巨大潛力,為人們的日常生活帶來了更多便利。其在性能測試中的優異表現也證明了其技術實力。未來,隨著技術的不斷進步,AutoGLM有望實現更廣泛的應用,為用戶創造更多價值。