OpenAI a lancé le dernier "opérateur" proxy AI, un outil puissant conçu pour aider les utilisateurs à effectuer diverses tâches en ligne. Il combine les capacités visuelles de GPT-4O et le raisonnement avancé pour l'apprentissage du renforcement, et est capable d'interagir avec les interfaces utilisateur graphiques (GUIS) et d'agir indépendamment sur le réseau sans intégration API personnalisée. L'opérateur est actuellement dans la phase de prévisualisation de la recherche et n'est disponible que pour les utilisateurs d'abonnement US Chatgpt Pro, avec des frais mensuels de 200 $ US. Cet article présentera en détail les fonctionnalités, la sécurité et les futurs plans de développement de l'opérateur.
OpenAI a annoncé le lancement de son dernier agent AI "Opérateur", un outil conçu pour aider les utilisateurs à effectuer diverses tâches sur le réseau. Openai a déclaré dans son blog que l'opérateur mène un "aperçu de recherche" et cible initialement les utilisateurs d'abonnement ChatGpt Pro aux États-Unis, avec des frais mensuels de 200 $.
La philosophie de conception de l'opérateur consiste à interagir avec une interface utilisateur graphique (GUI) via un modèle appelé «agent d'utilisation de l'ordinateur» qui combine les capacités visuelles de GPT-4O et le raisonnement avancé avec l'apprentissage par renforcement. OpenAI explique que l'opérateur peut afficher les pages Web via son navigateur intégré et interagir avec les pages en tapant, en cliquant et en faisant défiler. L'avantage de cette technologie est que les opérateurs peuvent fonctionner indépendamment sur le réseau sans avoir besoin d'une intégration API personnalisée.
Pendant l'utilisation, l'opérateur peut non seulement utiliser la capacité de raisonnement à "se corriger", mais également remettre le contrôle à l'utilisateur lors de la rencontre des difficultés. Lorsqu'un site Web demande des informations sensibles, telles que les informations d'identification de connexion, l'opérateur demande à l'utilisateur de reprendre l'opération. De plus, l'opérateur exige également que les utilisateurs confirment lors de la gestion des transactions telles que l'envoi d'e-mails. OpenAI souligne que les opérateurs sont conçus avec un accent particulier sur la sécurité, visant à rejeter les demandes nuisibles et à bloquer le contenu non autorisé.
OpenAI a également révélé que l'opérateur travaille avec plusieurs sociétés bien connues telles que Doordash, Instacart, Opentable, Priceline, StubHub, Thumbtack et Uber pour s'assurer qu'elles répondent aux besoins du monde réel et suivent les normes établies de l'industrie. Cependant, OpenAI rappelle également aux utilisateurs que l'outil peut actuellement rencontrer des difficultés lorsqu'ils traitent des interfaces complexes, telles que la création de diaporamas ou la gestion des calendriers.
OpenAI prévoit d'étendre l'opérateur à des utilisateurs de plus, d'équipe et d'entreprise et d'intégrer ces capacités dans le chatgpt. Cela signifie que davantage d'utilisateurs auront la possibilité de vivre la commodité apportée par cette technologie de pointe.
Podcast officiel: https://openai.com/index/introducing-operator/
Points:
OpenAI lance l'agent "opérateur" pour aider les utilisateurs à effectuer des tâches en ligne, et est le premier à cibler les utilisateurs de Chatgpt Pro.
L'opérateur peut interagir avec les pages Web via le navigateur et a les fonctions d'auto-correction et de contrôle des utilisateurs pour assurer la sécurité.
OpenAI coopère avec de nombreuses entreprises bien connues pour répondre aux besoins réels, tout en prévoyant de s'étendre à davantage d'utilisateurs à l'avenir.
En bref, l'opérateur est une tentative audacieuse d'OpenAI dans le domaine de l'IA proxy, qui démontre le grand potentiel de l'IA dans l'automatisation des tâches de réseau. Bien qu'il en soit encore à ses débuts, son développement futur vaut la peine d'être attendu et indique également plus de possibilités pour l'IA d'interagir avec les humains à l'avenir.