Récemment, il a été rapporté qu'OpenAI lancerait bientôt un nouvel outil d'IA appelé « Operator », capable de contrôler directement les ordinateurs personnels et d'effectuer diverses tâches de manière autonome, ce qui a attiré une large attention. Selon l'ingénieur logiciel Tibor Blaho, il a confirmé la nouvelle en découvrant des options cachées dans le client OpenAI ChatGPT macOS et des informations associées sur le site officiel d'OpenAI (pas encore public), et a prédit que sa sortie serait en janvier 2025. Cette nouvelle fait également écho aux rapports précédents de Bloomberg et d’autres médias, augmentant encore sa crédibilité. L'émergence de « Operator » apportera des changements révolutionnaires dans la manière dont les ordinateurs personnels sont utilisés et ouvrira également un nouveau chapitre dans l'exploration des applications pratiques de la technologie de l'intelligence artificielle.
Récemment, on a appris qu'OpenAI était sur le point de lancer un outil d'IA appelé « Operator », qui a la capacité de contrôler un ordinateur personnel et d'effectuer des tâches en son nom. L'ingénieur logiciel Tibor Blaho a révélé la nouvelle sur les réseaux sociaux, affirmant qu'il avait découvert les derniers indices sur l'outil. Auparavant, de nombreux médias, dont Bloomberg, avaient rapporté des rumeurs concernant « l'opérateur », affirmant qu'il pourrait accomplir de manière autonome plusieurs tâches telles que l'écriture de code et la réservation de voyages.
Selon Blaho, OpenAI prévoit de sortir « Operator » en janvier 2025. Il a découvert que le client ChatGPT macOS d'OpenAI dispose d'une nouvelle option cachée qui peut définir des touches de raccourci pour « changer d'opérateur » et « forcer la fermeture de l'opérateur ». En outre, des informations relatives à « Opérateur » sont également apparues sur le site Web d’OpenAI, bien que ces informations n’aient pas encore été rendues publiques.
Blaho a également mentionné qu'il existe des tableaux sur le site Web d'OpenAI qui comparent les performances de « Operator » avec d'autres systèmes d'IA informatisés, et que ces tableaux peuvent n'être que des espaces réservés. Si les données du tableau sont exactes, les performances d'affichage de « Opérateur » ne sont pas toujours fiables, selon la tâche effectuée.
Dans un test de référence réalisé par OSWorld, « OpenAI Computer Usage Agent (CUA) » a obtenu un score de 38,1 %. Bien qu'il ait dépassé le modèle contrôlé par ordinateur d'Anthropic, il était encore bien inférieur au score humain de 72,4 %. Les performances de l'opérateur ont dépassé les performances humaines lors du test de WebVoyager, mais sont tombées en dessous des performances humaines lors du test de WebArena. Pour certaines tâches simples, comme l'inscription auprès d'un fournisseur de services cloud et le démarrage d'une machine virtuelle, le taux de réussite de l'opérateur n'est que de 60 % et pour la tâche de création d'un portefeuille Bitcoin, son taux de réussite n'est que de 10 % ;
L'entrée d'OpenAI sur le marché des agents d'IA intervient à un moment où d'autres concurrents comme Anthropic et Google se précipitent également pour lancer des technologies similaires. Bien que les agents d’IA en soient encore à leurs balbutiements, la société d’analyse de marché Markets and Markets prédit que le marché des agents d’IA atteindra 47,1 milliards de dollars d’ici 2030.
Bien que la technologie actuelle des agents d’IA soit encore relativement basique, certains experts ont exprimé des inquiétudes quant à ses risques potentiels pour la sécurité. Les données divulguées par Blaho montrent que l'opérateur a obtenu de bons résultats lors de certaines évaluations de sécurité et a été capable de répondre efficacement aux tests visant à inciter le système à effectuer des « activités illégales » ou à rechercher des « données personnelles sensibles ». Les tests de sécurité sont considérés comme l’une des raisons du long cycle de développement d’Operator.
Wojciech Zaremba, co-fondateur d'OpenAI, a critiqué sur les réseaux sociaux le manque de sécurité des agents publiés par Anthropic. Il a déclaré que si OpenAI lançait un produit similaire, cela pourrait déclencher une réponse négative.
Souligner:
L’outil « Operator » d’OpenAI, qui sera bientôt publié, contrôlera de manière autonome les ordinateurs pour effectuer des tâches telles que l’écriture de code et la réservation de voyages.
Selon des informations divulguées, l'opérateur a un taux de réussite relativement faible sur certaines tâches et est moins performant que les humains.
Bien que l'opérateur ait obtenu de bons résultats lors des évaluations de sécurité, les experts s'inquiètent des risques potentiels pour la sécurité.
Au total, l’outil « Operator » d’OpenAI démontre le grand potentiel de la technologie de l’IA dans le domaine de l’automatisation, mais il est également confronté à des défis de maturité technologique et de sécurité. À l'avenir, avec le développement et l'amélioration continus de la technologie, « Operator » pourrait changer la façon dont nous interagissons avec les ordinateurs, mais en même temps, nous devons être prudents quant à ses risques potentiels.