Zhipu AIは最近、携帯電話の人間の操作をシミュレートし、さまざまな毎日のタスクを実行できるインテリジェントボディであるGLMテクノロジーAutoGLMに基づいた新製品をリリースしました。 AutoGLMの出現は、携帯電話アプリケーションの分野でAIで大きなブレークスルーを示しています。人生。 。その動作ロジックは、複雑なプロセスがない人間の論理と類似しており、使用のしきい値は非常に低いです。
AutoGLMは、WeChatの瞬間、Taobaoでの歴史的注文製品の購入、Ctripでのホテルの予約、12306年の列車の購入、Meituanでのテイクアウトの注文など、さまざまなタスクを実行したり、WeChatの瞬間にコメントしたり、ホテルを予約したりできます。そのアプリケーションのシナリオは、理論的には、AutoGLMは視覚的な電子デバイスでできることを達成でき、複雑なワークフロー構造を必要としません。
現在、ユーザーは「Zhipu Qingyan」プラグインをインストールすることでAutoGLM-Webを体験できます。これは、Webページにアクセスしているユーザーをシミュレートし、Webページをクリックし、Webサイトに高度な検索、要約、コンテンツ生成を自動的に完了できるブラウザアシスタントです。さらに、AutoGLMはAndroidシステムでの内部テストのアプリケーションも開設し、Honorなどの携帯電話メーカーとの詳細な協力を実施しています。
AutoGLMのテクノロジーは、Zhipuの自己開発の「基本エージェントデカップリング中間インターフェイス」と「自己進化コース強化学習フレームワーク」に基づいています。スパースフィードバックシグナルや戦略分布ドリフトなどの問題。 AutoGLMは、成長中に常に新しいスキルを獲得している人々と同様に、継続的にそれ自体を改善し、独自のパフォーマンスを着実に継続的に改善できます。
技術的な課題の観点から、AutoGLMは、「アクション実行」が不十分で「タスク計画」が不十分であるという問題を解決します。 「基本エージェントデカップリング中間インターフェイス」の設計により、自然言語の中間インターフェイスを介して「タスク計画」と「アクション実行」の2つの段階を切り離し、エージェントの機能を大幅に改善します。同時に、AutoGLMは「自己進化オンラインコース強化学習フレームワーク」を採用して、実際のオンライン環境でWebおよび電話環境で大規模なモデルエージェントの機能を学び、改善します。
AutoGLMは、携帯電話の使用とWebブラウザーの両方で大幅なパフォーマンスの改善を達成し、AndroidLab評価ベンチマークでGPT-4OとClaude-3.5-Sonnetのパフォーマンスを上回りました。 Webarena-Lite評価ベンチマークでは、AutoGLMはGPT-4Oと比較して約200%のパフォーマンス改善を達成し、GUI操作における人間と大規模なモデルエージェントの間の成功率のギャップを狭めました。
プロジェクトアドレス:https://xiao9905.github.io/autoglm
その強力な機能と技術革新により、AutoGLMは携帯電話の操作の分野で人工知能の大きな可能性を実証し、人々の日常生活により多くの利便性をもたらしています。パフォーマンステストにおけるその優れたパフォーマンスは、その技術的な強さも証明しています。将来的には、テクノロジーの継続的な進歩により、AutoGLMはより広いアプリケーションを達成し、ユーザーにより多くの価値を生み出すことが期待されています。