世界初の一般向けのすぐに使えるコンピュータインテリジェンス GLM-PC が、2025 年 1 月 23 日に再度アップグレードされました。スマート マルチモーダル大型モデル CogAgent をベースにしており、「監視」と「操作」の機能を備えています。人間と同じように、コンピューターの機能により、さまざまなコンピュータータスクを効率的に実行できます。今回のアップグレードの焦点は、新しい「Deep Thinking」モードで、論理的推論とコード生成機能が強化され、Windows システムのサポートが実装され、複雑なタスクを処理する能力とその適用範囲が大幅に向上します。 GLM-PC の「左脳」は論理的推論とタスクの実行を担当し、「右脳」は奥行き知覚とインタラクティブな体験に焦点を当てます。この 2 つは連携してデータ収集、情報抽出などをうまく実行します。強い適応力、創造性、汎化能力を発揮します。
2025 年 1 月 23 日、世界初の一般向けの、入力して使用できるコンピューター インテリジェンスである GLM-PC が再びアップグレードされ、幅広い注目を集めました。 GLM-PC は、大規模なマルチモーダル スマート スペクトル モデルである CogAgent をベースにしており、人間のようにコンピュータを「観察」し、「操作」することができ、ユーザーがさまざまなコンピュータ タスクを効率的に完了できるように支援します。
GLM-PC v1.0 がリリースされ、2024 年 11 月 29 日に内部テストが開始されて以来、エージェントは継続的に最適化およびアップグレードされてきました。新たに導入された「Deep Thinking」モードには、論理的推論とコード生成機能が追加され、GLM-PC が複雑なタスクをより快適に処理できるようになります。さらに、GLM-PC は Windows システムもサポートしており、アプリケーション シナリオがさらに広がります。
GLM-PC のアーキテクチャ設計は、エージェントのモデル機能の向上とコラボレーション アーキテクチャの最適化を十分に考慮しています。完全なエージェントは、テキスト、画像、ビデオ、オーディオなどの複数の信号を知覚レベルで受信できる必要があり、論理的思考、タスク計画能力、効率的な知覚、および思考レベルでの柔軟な操作能力を備えている必要があります。実行レベルで完全な GUI 空間操作を完了し、環境がフィードバックを受け取り、それ自体を修正します。 GLM-PC は、人間の「左脳」と「右脳」の役割分担を利用し、コード生成とグラフィカル インターフェイスの理解を通じて論理的推論と知覚的認知の深い組み合わせを実現し、論理と創造性のバランスをとる能力を与えます。 。
実際のアプリケーションでは、GLM-PC は強力な機能を発揮します。その「左脳」は厳密な論理的推論とタスクの実行を担当し、詳細なタスク計画計画を迅速に策定でき、ループ実行メカニズムを通じてタスクの正確な実行と高度な自動化を保証します。たとえば、GLM-PC は、写真内の商品データを自動的に抽出して Excel に保存し、淘宝網のショッピング カートに商品を自動的に追加して、ワンストップ ショッピング プロセスを実現します。その「右脳」は奥行き知覚とインタラクティブな体験に焦点を当てており、グラフィカルインターフェイス要素を正確に識別し、ユーザーの行動を理解し、複雑な画像の詳細な意味分析を実行し、画像とテキストの情報を統合して包括的な知覚結果を形成することができます。このため、GLM-PC はデータの分類と情報の抽出に優れています。
GLM-PC は左脳と右脳のコラボレーションの強力な能力も実証していることは言及する価値があります。 GLM-PC は、複雑な論理タスクを処理しながら、未解決の問題に対してより高い適応性、創造性、一般化能力を発揮することもできます。 GLM-PC は、動的な最適化と状況認識を通じて、特にループ タスク処理、複数ステップの推論実行、およびロングチェーン タスク管理において、ユーザーがより効率的なソリューションを探索するのに役立ちます。
さらに、Zhipu は、GLM-PC と有名な PC メーカーとの協力を積極的に推進し、AIPC (AI パーソナル コンピュータ) の革新と開発を共同で推進しています。 AIPC は単なるコンピューターではなく、パーソナル コンピューティングの分野における AI エージェントの新しいアプリケーションでもあり、より効率的でインテリジェントな仕事と生活のエクスペリエンスをユーザーに提供できます。
ダウンロード&体験:https://cogagent.miner.cn
全体として、GLM-PC のアップグレードは、パーソナル コンピューターの分野における人工知能の大きな可能性を示しており、その強力な機能と便利な操作体験により、ユーザーはより効率的でインテリジェントなコンピューティング エクスペリエンスを得ることができ、その将来に期待する価値があります。開発とアプリケーション。