L'agent intelligent Agent Q récemment publié par MultiOn affirme avoir atteint un taux de réussite étonnant de 95,4 % dans des tâches réelles, ce qui a attiré une large attention dans l'industrie. Son PDG utilise fréquemment des émoticônes de fraise sur Twitter, ce qui rappelle davantage le mystérieux projet Q d'OpenAI, déclenchant de nombreuses spéculations sur la technologie derrière l'agent Q. L'agent Q combine des technologies telles que la recherche, l'auto-réflexion et l'apprentissage par renforcement pour planifier et s'auto-guérir, et améliore considérablement les taux d'achèvement des tâches grâce à la collecte de données autonome. Dans la tâche de réservation réelle d'Open Table, il a amélioré le taux de réussite sans échantillon de LLaMa-3 de 18,6 % à 81,7 %, ce qui est impressionnant.
Ce qui est encore plus frappant, c'est que le PDG de MultiOn, Div Garg, utilise fréquemment des émoticônes de fraise sur Twitter, ce qui rappelle aux gens le mystérieux projet Q d'OpenAI.
Les internautes sont très curieux de connaître la technologie derrière l'agent Q. Certaines personnes pensent qu’il pourrait y avoir un soutien du projet Q* d’OpenAI derrière cela. MultiOn a non seulement ouvert un compte Twitter indépendant pour l'agent Q, mais l'image d'arrière-plan et les informations de base du compte sont liées aux fraises, ce qui a sans aucun doute accru la curiosité des gens pour la technologie qui se cache derrière.
L'agent Q combine la recherche, l'auto-réflexion et l'apprentissage par renforcement pour permettre la planification et l'auto-guérison. Il répond aux limites des techniques de formation LLM précédentes en introduisant un nouveau cadre d'apprentissage et d'inférence, permettant une navigation autonome sur les pages Web.
Dans la tâche de simulation d'une boutique en ligne, l'agent Q a démontré ses puissantes capacités de recherche. Dans la tâche de réservation réelle d'Open Table, l'agent Q a augmenté le taux de réussite de LLaMa-3 sans échantillon de 18,6 % à 81,7 %, avec une augmentation du score de 340 %, et seulement après une journée de collecte de données indépendante.
Bien que l'agent Q ait obtenu de bons résultats lors des expériences d'évaluation, il reste encore beaucoup de place à la discussion et à l'amélioration des méthodes actuellement utilisées. Par exemple, la conception d’algorithmes d’inférence, la sélection de stratégies de recherche, ainsi que la sécurité et l’interaction en ligne nécessitent toutes des recherches et une optimisation plus approfondies.
L'émergence de l'Agent Q constitue sans aucun doute un progrès majeur dans le domaine des agents d'IA, mais il reste à tester avec le temps s'il peut devenir un parvenu dans le domaine de l'IA ou s'il s'agit simplement d'un battage médiatique intelligent. Quoi qu’il en soit, la sortie de l’Agent Q apporte de nouvelles possibilités et révélations au développement de l’IA.
Références :
https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-Generation-of-ai-agents-with-planning-and-self-healing-capabilities
Le taux de réussite et l’innovation technologique de l’Agent Q sont impressionnants, mais la technologie qui la sous-tend doit encore être vérifiée et améliorée. À l'avenir, les agents d'IA comme l'agent Q joueront un rôle dans davantage de domaines, favoriseront le développement continu de la technologie de l'intelligence artificielle et apporteront plus de commodité à la vie des gens.