GLM-PC オープンエクスペリエンスマルチモーダルエージェントアップグレードでコンピュータを自律的に動作させる - AI 記事

著者：Eve Cole 更新時間：2025-01-28 14:32:01

北京芝浦華庄科技有限公司は、マルチモーダルインテリジェントエージェント GLM-PC エクスペリエンスを正式に一般公開し、人間とコンピューターのインタラクションにおける新たなマイルストーンをマークしました。 GLM-PC は、Wisdom のマルチモーダル大規模モデル CogAgent をベースにしており、コンピュータを自律的に操作し、よりスマートで効率的なコンピュータエクスペリエンスをユーザーに提供できます。 Enter を押すだけの簡単な操作で、コード生成、論理的推論、GUI の理解などの強力な機能を体験でき、作業効率が大幅に向上します。 GLM-PC は 11 月 29 日のリリース以来、社内テスト段階にあり、このアップグレードにより、より完全な機能とよりスムーズなユーザーエクスペリエンスが一般に提供されます。

GLM-PC v1.0 は 2024 年 11 月 29 日にリリースされて以来、内部テスト段階にありました。このバージョンでは、「ディープシンキング」モード、新しい論理的推論およびコード生成機能が追加され、Windows システムもサポートされます。 GLM-PC の機能は、コード生成、ロジック実行、グラフィカルユーザーインターフェイス (GUI) の理解などの多くの側面をカバーしており、インテリジェントな運用における強力な可能性を示しています。

コード生成とロジック実行に関して、GLM-PC は目標とリソースを包括的に分析し、実行ロードマップを生成し、大きなタスクを管理可能な小さなサブタスクに分解して効率的なタスク計画を達成する機能を備えています。タスク計画が完了すると、エージェントは周期実行用のコード生成モジュールを開始して、タスクを正確に完了することができます。同時に、GLM-PC は長期的に考える能力も備えており、リアルタイムで修正を調整および反映し、ユーザーと対話してソリューションを最適化することができます。

画像および GUI の認識に関して、GLM-PC はボタンやアイコンなどのグラフィカルインターフェイスの要素を正確に識別して理解し、ユーザーの履歴操作情報に基づいてインテリジェントな推奨事項を提供します。画像意味解析機能により、複雑な画像を深く分析し、傾向や指標などの重要な情報を抽出できます。さらに、GLM-PC は画像とテキスト情報を融合して、ユーザーに包括的な認識結果を提供し、ユーザーが正確な操作計画を立てるのに役立ちます。

人工知能テクノロジーの継続的な開発により、GLM-PC の発売は間違いなくユーザーにより効率的でインテリジェントなコンピューターエクスペリエンスをもたらし、人間とコンピューターの相互作用に重要な進歩をもたらすでしょう。

GLM-PC のオープンエクスペリエンスは、人間とコンピューターのインタラクションの効率を向上させる人工知能テクノロジーの大きな可能性を示しており、将来的にはより多くの分野に適用され、ユーザーにより便利でインテリジェントな生活体験をもたらすことが期待されています。今後もGLM-PCの改良を継続し、ユーザーに更なる驚きをもたらすことを期待しています。

GLM-PC オープン エクスペリエンス マルチモーダル エージェント アップグレードでコンピュータを自律的に動作させる - AI 記事

GLM-PC オープンエクスペリエンスマルチモーダルエージェントアップグレードでコンピュータを自律的に動作させる - AI 記事