近年、大規模言語モデル技術が急速に発展していますが、既存の AI エージェントの多くは受動的に命令を実行し、主体性がありません。この記事では、清華大学と Face Wall Intelligence が共同開発した新しい AI エージェントを紹介します。これは、ユーザーの行動に基づいてニーズを予測し、積極的にサポートを提供し、ユーザー エクスペリエンスを大幅に向上させることができます。エージェントは、さまざまなユーザーの行動を記録する ProactiveBench と呼ばれるデータセットに基づいてトレーニングされ、AI の行動が人間の期待に応えているかどうかを判断する報酬モデルのトレーニングに使用され、最終的に AI イニシアチブを実現します。
近年、ChatGPTに代表される大規模言語モデルがAI分野に新たな波を起こしている。これらの強力な言語モデルは、人間の指示を理解するだけでなく、計画を立て、環境を探索し、ツールを使用して複雑なタスクを解決することもできるため、ロボット工学、パーソナル アシスタント、プロセス オートメーションなどの分野で大きな可能性を示します。
しかし、既存の AI エージェント システムのほとんどは受動的であり、タスクを実行するには人間による明確な指示が必要です。会議をスケジュールするには、時間と場所を手動で入力する必要があり、参加者さえも 1 人ずつリストする必要があります。単純に自分でやるより面倒です!
同僚から会議を提案する電子メールを受信し、パッシブ AI エージェントが会議のスケジュールを明示的に指示するのを待っていると想像してください。アクティブな AI エージェントは電子メールに気づき、積極的に会議を要求します。この積極性により、ユーザーの認知負荷が大幅に軽減されるだけでなく、人間が明確に表現できなかった潜在的なニーズも特定されます。
AI アシスタントが受動的すぎるという問題を解決するために、清華大学と Wall-Facing Intelligence は協力して、まったく新しい AI エージェントを提案しました。これは、もはや「言われたことに従う」機械ではなく、「予測する」ことができる機械です。以前は、私が率先して物事をわかりやすく整理するお手伝いをしました。
この「魔法の」AI エージェントはどのように機能するのでしょうか? 秘密兵器は ProactiveBench データ セットです。このデータ セットは、コンピューターの前で入力するすべての情報を含む、さまざまな人間の活動を記録する「百科事典」のようなものです。リンクをクリックすると、コピー&ペーストした内容も鮮明に記録されます。
研究者らはこのデータセットを使用して、「人間の脳をシミュレート」し、AIエージェントの行動が人間の期待と一致しているかどうかを判断できるスーパーコンピューターのような報酬モデルをトレーニングした。 AIエージェントが良いパフォーマンスを見せた場合は報酬が与えられ、そうでない場合は減点されます。トレーニングを繰り返すと、AI エージェントは人間と同じようにユーザーの行動に基づいてユーザーのニーズを予測し、必要なときに積極的に支援を提供できるようになります。
たとえば、同僚から会議を提案する電子メールを受信すると、この「予測」AI エージェントが電子メールの内容を自動的に識別し、会議をスケジュールする必要があるかどうかを事前に尋ねます。同意すると、時間と場所を自動的に調整し、会議への招待状も送信します。今日の AI アシスタントよりもはるかに「賢い」のでしょうか?
実験結果は、ProactiveBench データセットを使用してトレーニングされた AI エージェントが非常に優れたパフォーマンスを示していることを示しています。たとえば、Qwen2-7B-Instruct モデルは、積極的な支援の提供において 66.47% の F1 スコアを示し、すべてのオープンソース モデルとクローズド ソース モデルを上回っています。
この「予測」AI エージェントはまだ研究段階にありますが、人間と機械のコラボレーションの将来の進歩に新たな希望をもたらします。近い将来、真に「あなたを理解する」AI アシスタントが登場し、「従う」だけでなく、さまざまな問題を積極的に解決し、あなたの生活をより便利にします。
論文アドレス: https://arxiv.org/pdf/2410.12361
この研究結果は、AI エージェントがアクティブ サービスの方向に発展する大きな可能性を示しており、ProactiveBench データ セットの適用により、将来の AI モデルのトレーニングに新しいアイデアも提供されます。テクノロジーの絶え間ない進歩により、AI アシスタントは将来、より賢く、人間のニーズにより敏感になり、私たちの生活において真に強力なアシスタントになると私は信じています。