El agente inteligente Agent Q lanzado recientemente por MultiOn afirma haber logrado una sorprendente tasa de éxito del 95,4% en tareas reales, lo que ha atraído una amplia atención en la industria. Su director ejecutivo utiliza con frecuencia emoticones de fresa en Twitter, que recuerdan más al misterioso proyecto Q de OpenAI, lo que generó mucha especulación sobre la tecnología detrás del Agente Q. Agent Q combina tecnologías como la búsqueda, la autorreflexión y el aprendizaje por refuerzo para planificar y autocurarse, y mejora significativamente las tasas de finalización de tareas mediante la recopilación de datos autónoma. En la tarea de reserva real de Open Table, mejoró la tasa de éxito de muestra cero de LLaMa-3 del 18,6% al 81,7%, lo cual es impresionante.
Lo que es aún más sorprendente es que el director ejecutivo de MultiOn, Div Garg, utiliza con frecuencia emoticones de fresa en Twitter, lo que recuerda a la gente el misterioso proyecto Q de OpenAI.
Los internautas están llenos de curiosidad sobre la tecnología detrás del Agente Q. Algunas personas especulan que puede haber apoyo del proyecto Q* de OpenAI detrás de esto. MultiOn no sólo abrió una cuenta de Twitter independiente para el Agente Q, sino que la imagen de fondo y la información básica de la cuenta están relacionadas con las fresas, lo que sin duda aumentó la curiosidad de la gente sobre la tecnología detrás de ella.
Agent Q combina búsqueda, autorreflexión y aprendizaje por refuerzo para permitir la planificación y la autocuración. Aborda las limitaciones de las técnicas de formación LLM anteriores mediante la introducción de un nuevo marco de aprendizaje e inferencia, que permite la navegación autónoma por páginas web.
En la tarea de simular una tienda online, Agent Q demostró sus potentes capacidades de búsqueda. En la tarea de reserva real de Open Table, el Agente Q aumentó la tasa de éxito de muestra cero de LLaMa-3 del 18,6% al 81,7%, con un aumento de puntuación del 340%, y solo después de un día de recopilación de datos independiente.
Aunque el Agente Q tuvo un buen desempeño en los experimentos de evaluación, todavía hay mucho margen de discusión y mejora en los métodos utilizados actualmente. Por ejemplo, el diseño de algoritmos de inferencia, la selección de estrategias de búsqueda y la seguridad e interacción en línea requieren más investigación y optimización.
La aparición del Agente Q es sin duda un gran progreso en el campo de los agentes de IA, pero el tiempo aún debe probar si puede convertirse en un advenedizo en el campo de la IA o si es solo una exageración inteligente. En cualquier caso, el lanzamiento del Agente Q trae nuevas posibilidades y revelaciones al desarrollo de la IA.
Referencias:
https://www.multion.ai/blog/introduciendo-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities
La tasa de éxito y la innovación tecnológica del Agente Q son impresionantes, pero la tecnología detrás de él aún necesita más verificación y mejora. En el futuro, los agentes de inteligencia artificial como el Agente Q desempeñarán un papel en más campos, promoverán el desarrollo continuo de la tecnología de inteligencia artificial y brindarán más comodidad a la vida de las personas.