Operai ha lanzado el último "operador" de AI proxy, una poderosa herramienta diseñada para ayudar a los usuarios a realizar varias tareas en línea. Combina las capacidades visuales de GPT-4O y el razonamiento avanzado para el aprendizaje de refuerzo, y puede interactuar con las interfaces gráficas de usuario (GUI) y actuar de forma independiente en la red sin integración de API personalizada. El operador se encuentra actualmente en la etapa de vista previa de la investigación y solo está disponible para los usuarios de suscripción de US ChatGPT Pro, con una tarifa mensual de US $ 200. Este artículo presentará en detalle la funcionalidad, seguridad y futuros planes de desarrollo del operador.
Operai anunció el lanzamiento de su último "operador" de AI Agent, una herramienta diseñada para ayudar a los usuarios a realizar varias tareas en la red. Operai dijo en su blog que el operador está llevando a cabo una "vista previa de investigación" e inicialmente se dirige a los usuarios de suscripción de ChatGPT Pro en los Estados Unidos, con una tarifa mensual de $ 200.
La filosofía de diseño del operador es interactuar con una interfaz gráfica de usuario (GUI) a través de un modelo llamado "Agente de uso de la computadora" que combina las capacidades visuales de GPT-4O y el razonamiento avanzado con el aprendizaje de refuerzo. Operai explica que el operador puede ver las páginas web a través de su navegador incorporado e interactuar con las páginas escribiendo, haciendo clic y desplazándose. La ventaja de esta tecnología es que los operadores pueden operar de forma independiente en la red sin la necesidad de integración de API personalizada.
Durante el uso, el operador no solo puede usar la capacidad de razonamiento para "corregirse", sino también entregar el control al usuario al encontrar dificultades. Cuando un sitio web solicita información confidencial, como las credenciales de inicio de sesión, el operador pregunta al usuario si se hace cargo de la operación. Además, el operador también requiere que los usuarios confirmen al manejar transacciones, como enviar correos electrónicos. Operai enfatiza que los operadores están diseñados con especial énfasis en la seguridad, con el objetivo de rechazar las solicitudes dañinas y bloquear el contenido no autorizado.
Operai también reveló que el operador está trabajando con varias compañías conocidas como Doordash, Instacart, OpenTable, Priceline, Stubhub, Thumbtack y Uber para garantizar que satisfagan las necesidades del mundo real y sigan las normas de la industria establecidas. Sin embargo, OpenAI también recuerda a los usuarios que la herramienta puede experimentar dificultades cuando se trata de interfaces complejas, como crear presentaciones de diapositivas o administrar calendarios.
Operai planea expandir el operador a los usuarios Plus, Team y Enterprise e integrar estas capacidades en CHATGPT. Esto significa que más usuarios tendrán la oportunidad de experimentar la conveniencia traída por esta tecnología de vanguardia.
Podcast oficial: https://openai.com/index/introducing-operator/
Agujas:
OpenAI inicia el agente de inteligencia artificial "Operador" para ayudar a los usuarios a realizar tareas en línea, y es el primero en apuntar a los usuarios de ChatGPT Pro.
El operador puede interactuar con las páginas web a través del navegador y tiene las funciones de autocorrección y control del usuario para garantizar la seguridad.
Operai coopera con muchas compañías conocidas para satisfacer las necesidades reales, al tiempo que planea expandirse a más usuarios en el futuro.
En resumen, el operador es un intento audaz de OpenAI en el campo del proxy de IA, que demuestra el gran potencial de IA en la automatización de tareas de red. Aunque todavía está en sus primeras etapas, vale la pena esperar su desarrollo futuro y también indica más posibilidades para que la IA interactúe con los humanos en el futuro.