人間のデバイスを乗っ取るAIエージェント(知能エージェント)は、かつてはSF映画の舞台にすぎなかったが、今では株式市場で話題となっている。
ちょうど 10 月 23 日、アメリカの大手 AI モデル会社 Anthropic が、新しい Claude 3.5 Haiku と Sonnet のアップグレード版を発売しました。 Sonnet は、画面の表示、カーソルの移動、クリック、仮想キーボードによる入力など、人間のようにコンピュータを操作できる新しい AI エクスペリエンス「コンピュータの使用」をもたらします。
2日後、Zhipu AIはAnthropicの先例に従い、ユーザーの携帯電話をパーソナルアシスタントとして「制御」するという明確な目標を掲げてAutoGLMをリリースした。 WeChat との対話、テイクアウトの注文、赤い封筒の受け取りなどのパーソナライズされたタスクを個別に実行できます。これは主に、WeChat、淘宝、美団、小紅書などのアプリでの一般的なユーザー操作を対象としています。
これら 2 つの製品は、AI がチャット マシンからツールを使用して問題を解決する段階への移行を表しており、AI エージェントが徐々に現実の実用的な製品に移行できるようになります。
この AI エージェントのトレンドはすぐに資本市場に衝撃を与えました。
10月28日午前中に市場が開くと、Parallel Technology、Capital Online、Startup Dark Horse、Doushen Education、Chuanzhi Education、Dianguang MediaなどのZhipu関連のコンセプト株の多くが大幅に上昇した。在庫は 1 日あたりの上限に達し、20% から 30% 増加します。
資本市場の素早い反応は、AIエージェントの商用化見通しに対する高い期待を反映している。しかし本質的には、関連するアプリケーションはまだ市場の初期段階にあるため、この価格上昇の波は市場のセンチメントや憶測を排除することはできません。
AI エージェントは将来のテクノロジーの長期的なトレンドですか、それとも短期的なトレンドですか?
技術的な観点から見ると、「Computer Use」(コンピュータの使用)と「Phone Use」(携帯電話の使用)に焦点を当てた AI エージェントの台頭は、単一言語の理解から徐々に複雑なタスクの実行に拡張する AI の発展を示しています。
Anthropic の Claude Sonnet と Zhipu の AutoGLM は、自然言語の会話を処理するだけでなく、ユーザーのデバイスを直接制御して特定の操作を実行します。これは、人間とコンピューターの対話の新しい段階です。 Anthropic の Sonnet のデモは、コード作成やデータ分析などのタスクを処理でき、エラーが発生した場合にはさまざまな解決策を試すこともできることを示しており、この柔軟性は AI が一定の「実行力」を持ち始めていることを示しています。
Zhipu の AutoGLM は携帯電話シーンに焦点を当てています。 OCR テクノロジーを通じて UI コンポーネントを理解し、連鎖思考トレーニングを通じてコンポーネントの機能を理解することで、AutoGLM はユーザーの携帯電話画面上のさまざまなコンポーネントを識別し、その機能を理解して、指示に従って操作を実行できます。たとえば、WeChat インタラクションや電子商取引の注文の自動化などです。 。
しかし、そのような製品にはユーザーエクスペリエンスや商品化において依然として限界があります。
AutoGLM は携帯電話の操作をよりインテリジェントにしますが、プライバシーとセキュリティの問題についても懸念が生じます。ユーザーは利便性のためにプライバシー保護の一部を放棄するでしょうか?さらに、AutoGLM は現時点でも明確な指示を必要とし、クロスプラットフォームの適応性と操作精度に限界があります。真にシームレスな自動化を実現するには、継続的な最適化が必要です。
真の「インテリジェンス」という点では、AutoGLM にも改善の余地があります。たとえば、CITIC証券は調査レポートの中で、AutoGLMがラッキンコーヒーを注文する際に18元以上を支払ったことを指摘しており、これは明らかなプレミアムであり、まだ複雑な「掴み」を習得していないようだ。これらのブランドのクーポン」ゲームプレイ。
具体的な商品化に関しては、Zhipu と Honor は 9 月に共同 AI 大型モデル技術研究所を設立し、業界が端末アプリケーションにおける AI エージェントの可能性を認識できるようにしました。ただし、この機能をサポートする携帯電話ブランドの数が限られているため、実際の大規模な適用にはまだ時間がかかります。 IDC によると、中国市場における AI 携帯電話と AI PC の市場シェアは、2027 年にそれぞれ 50% と 80% を超えると予想されています。
大手テクノロジー企業のレイアウト アクションから判断すると、AI エージェントは大型モデルの分野で確かに重要な戦場です。
公開情報によると、OpenAIは年末までに独自のAIエージェントソフトウェアOrionをリリースする予定で、Appleも来月iOS 18.1にApple Intelligenceを追加する予定だという。 Microsoft は、自動チケット予約などの機能を実行できる画面解析ツール OmniParser をオープンソース化しました。 GoogleのGeimini 2.0は12月にリリースされる予定で、Chrome Webページのタスクを自動化するための新しい同様のプロジェクト「Project Jarvis」が開発されている。
これは、AI エージェントが実験室製品から大量アプリケーションへ移行し続けていることを意味しており、その背後にある巨大企業も市場の占有を目指して強化しています。
シリコンバレーのベンチャーキャピタルの動向を見ると、ますます多くの企業が AI インフラストラクチャからアプリケーション レベルに移行しており、より垂直にセグメント化された AI アプリケーションがブームになっていることがわかります。ただし、現在の AI エージェント テクノロジーは、クロスプラットフォームの操作機能が不十分であること、指示への依存度が高いこと、最適化が必要なパーソナライズされたエクスペリエンスなどの課題に依然として直面しています。 AIエージェントが主流市場に完全に参入するには、機能を向上させるだけでなく、プライバシーとデータセキュリティの面で社会の信頼を獲得する必要があります。
短期的には、AI エージェントの適用範囲はまだ限られていますが、AI エージェントがもたらす効率性と利便性は十分に魅力的です。技術的およびプライバシーの問題が解決されれば、AI エージェントは人間の生活の中でインテリジェントなアプリケーションを進歩させる機会が増えるでしょう。