MultiOn が最近リリースしたインテリジェント エージェント Agent Q は、実際のタスクにおいて 95.4% という驚異的な成功率を達成したと主張しており、業界で広く注目を集めています。同社の CEO は Twitter でイチゴの絵文字を頻繁に使用していますが、これは OpenAI の謎に満ちた Q プロジェクトを彷彿とさせ、エージェント Q の背後にあるテクノロジーについて多くの憶測を引き起こしています。 Agent Q は、検索、内省、強化学習などのテクノロジーを組み合わせて計画と自己修復を行い、自律的なデータ収集を通じてタスクの完了率を大幅に向上させます。 Open Table の実際の予約タスクでは、LLaMa-3 のゼロサンプル成功率が 18.6% から 81.7% に向上しました。これは目覚ましいものです。
さらに驚くべきことは、MultiOn CEO の Div Garg が Twitter でイチゴの絵文字を頻繁に使用していることです。これは人々に OpenAI の謎めいた Q プロジェクトを思い出させます。
ネチズンはエージェント Q の背後にあるテクノロジーについて好奇心でいっぱいです。この背景には、OpenAI の Q* プロジェクトからの支援があるのではないかと推測する人もいます。 MultiOn は Agent Q 用に独立した Twitter アカウントを開設しただけでなく、アカウントの背景画像と基本情報がイチゴに関連しているため、その背後にあるテクノロジーに対する人々の好奇心が高まったことは間違いありません。
エージェント Q は、探索、内省、強化学習を組み合わせて、計画と自己修復を可能にします。新しい学習および推論フレームワークを導入することで、以前の LLM トレーニング手法の限界に対処し、自律的な Web ページ ナビゲーションを可能にします。
オンライン ストアをシミュレートするタスクで、Agent Q はその強力な検索機能を実証しました。 Open Table の実際の予約タスクでは、エージェント Q は LLaMa-3 のゼロサンプル成功率を 18.6% から 81.7% に増加させ、スコアは 340% 増加しました。これは、1 日の独立したデータ収集後にのみでした。
エージェント Q は評価実験では良好なパフォーマンスを示しましたが、現在使用されている方法にはまだ議論と改善の余地が多くあります。たとえば、推論アルゴリズムの設計、検索戦略の選択、オンラインのセキュリティとインタラクションはすべて、さらなる研究と最適化を必要とします。
エージェント Q の出現は、AI エージェントの分野における大きな進歩であることは間違いありませんが、それが AI 分野の新興企業になれるか、それとも単なる巧妙な誇大宣伝に過ぎないのかは、時間が経てば分かるでしょう。いずれにせよ、Agent Q のリリースは AI の開発に新たな可能性と啓示をもたらします。
参考文献:
https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities
Agent Q の成功率と技術革新は素晴らしいものですが、その背後にあるテクノロジーにはまださらなる検証と改善が必要です。将来的には、エージェント Q のような AI エージェントはより多くの分野で役割を果たし、人工知能技術の継続的な開発を促進し、人々の生活にさらなる利便性をもたらすでしょう。