Openaiは、ユーザーがさまざまなタスクをオンラインで実行できるように設計された強力なツールである最新のAIプロキシ「オペレーター」を立ち上げました。 GPT-4Oの視覚能力と強化学習のための高度な推論を組み合わせて、グラフィカルユーザーインターフェイス(GUI)と対話し、カスタムAPI統合なしでネットワーク上で独立して行動することができます。現在、オペレーターは調査プレビュー段階にあり、Pro SubscriptionユーザーのChatgptが200米ドルでのみ利用できます。この記事では、オペレーターの機能、セキュリティ、将来の開発計画を詳細に紹介します。
Openaiは、ユーザーがネットワーク上でさまざまなタスクを実行できるように設計されたツールである最新のAIエージェント「オペレーター」の発売を発表しました。 Openaiはブログで、オペレーターは「Research Preview」を実施しており、最初は米国のChatGPT Proサブスクリプションユーザーをターゲットにしており、月額料金は200ドルであると述べました。
オペレーターの設計哲学は、GPT-4Oの視覚機能と高度な推論と強化学習を組み合わせた「コンピューター使用エージェント」と呼ばれるモデルを介して、グラフィカルユーザーインターフェイス(GUI)と対話することです。 Openaiは、オペレーターが組み込みのブラウザを介してWebページを表示し、タイピング、クリック、スクロールしてページと対話できると説明しています。このテクノロジーの利点は、オペレーターがカスタマイズされたAPI統合を必要とせずにネットワーク上で独立して動作できることです。
使用中、オペレーターは推論能力を使用して「自分自身を修正」するだけでなく、困難に遭遇したときにユーザーへのコントロールを引き渡すこともできます。ウェブサイトがログイン資格情報などの機密情報を要求すると、オペレーターはユーザーに操作を引き継ぐかどうかを尋ねます。さらに、オペレーターは、ユーザーが電子メールの送信などのトランザクションを処理する際に確認する必要があります。 Openaiは、有害な要求を拒否し、不正なコンテンツをブロックすることを目指して、セキュリティに特に重点を置いてオペレーターが設計されていることを強調しています。
Openaiはまた、オペレーターがDoordash、Instacart、Opentable、Priceline、StubHub、Thumbtack、Uberなどのいくつかの有名な企業と協力して、実際のニーズを満たし、確立された業界の規範に従うことを確認していることを明らかにしました。ただし、Openaiは、スライドショーの作成やカレンダーの管理など、複雑なインターフェイスを扱う際にツールが現在困難を経験する可能性があることをユーザーに思い出させます。
OpenAIは、オペレーターをPlus、チーム、およびエンタープライズユーザーに拡大し、これらの機能をChatGPTに統合する予定です。これは、より多くのユーザーがこの最先端のテクノロジーによってもたらされる利便性を体験する機会を得ることができることを意味します。
公式ポッドキャスト:https://openai.com/index/introducing-operator/
ポイント:
Openaiは、ユーザーがオンラインでタスクを実行できるように「オペレーター」AIエージェントを起動し、CHATGPT Proユーザーを最初にターゲットとしています。
オペレーターは、ブラウザを介してWebページと対話でき、セキュリティを確保するために自己修正とユーザー制御の機能を備えています。
Openaiは、多くの有名な企業と協力して実際のニーズを満たし、将来より多くのユーザーに拡大することも計画しています。
要するに、オペレーターは、AIプロキシの分野でOpenaiによる大胆な試みであり、ネットワークタスクの自動化におけるAIの大きな可能性を示しています。それはまだ初期段階にありますが、その将来の発展は楽しみにしている価値があり、AIが将来人間と対話する可能性をより多く示しています。