Recentemente, foi relatado que a OpenAI está prestes a lançar uma nova ferramenta de IA chamada "Operador", que pode controlar diretamente computadores pessoais e realizar diversas tarefas de forma autônoma, o que tem atraído a atenção generalizada. Segundo o engenheiro de software Tibor Blaho, ele confirmou a notícia ao descobrir opções ocultas no cliente OpenAI ChatGPT macOS e informações relevantes no site oficial da OpenAI (ainda não público), e previu que seu lançamento será em janeiro de 2025. Esta notícia também ecoa relatórios anteriores da Bloomberg e de outros meios de comunicação, aumentando ainda mais a sua credibilidade. O surgimento do “Operador” trará mudanças revolucionárias na forma como os computadores pessoais são utilizados e também acrescentará um novo capítulo à exploração de aplicações práticas da tecnologia de inteligência artificial.
Recentemente, há notícias de que a OpenAI lançará em breve uma ferramenta de IA chamada “Operador”, que tem a capacidade de controlar um computador pessoal e realizar tarefas em seu nome. O engenheiro de software Tibor Blaho revelou a notícia nas redes sociais, dizendo ter descoberto as últimas pistas sobre a ferramenta. Anteriormente, muitos meios de comunicação, incluindo a Bloomberg, haviam relatado rumores sobre o “Operador”, dizendo que ele poderia realizar múltiplas tarefas de forma autônoma, como escrever códigos e reservar viagens.
De acordo com Blaho, a OpenAI planeja lançar o “Operator” em janeiro de 2025. Ele descobriu que o cliente ChatGPT macOS da OpenAI tem uma nova opção oculta que pode definir teclas de atalho para "trocar de operador" e "forçar o encerramento do operador". Além disso, informações relacionadas ao “Operador” também apareceram no site da OpenAI, embora esta informação ainda não tenha sido divulgada.
Blaho também mencionou que existem algumas tabelas no site da OpenAI comparando o desempenho do “Operador” com outros sistemas de IA baseados em computador, e essas tabelas podem ser apenas espaços reservados. Se os dados da tabela forem precisos, o desempenho da exibição do “Operador” nem sempre é confiável, dependendo da tarefa que está sendo executada.
Em um teste de benchmark da OSWorld, o "OpenAI Computer Usage Agent (CUA)" obteve pontuação de 38,1%. Embora tenha superado o modelo controlado por computador da Anthropic, ainda foi muito inferior à pontuação humana de 72,4%. O desempenho do operador excedeu o desempenho humano no teste do WebVoyager, mas ficou abaixo do desempenho humano no teste do WebArena. Para algumas tarefas simples, como registrar-se em um provedor de serviços em nuvem e iniciar uma máquina virtual, a taxa de sucesso da Operadora é de apenas 60% e para a tarefa de criar uma carteira Bitcoin, sua taxa de sucesso é de apenas 10%.
A entrada da OpenAI no mercado de agentes de IA ocorre num momento em que outros concorrentes, como Anthropic e Google, também correm para lançar tecnologias semelhantes. Embora os agentes de IA ainda estejam em sua infância, a empresa de análise de mercado Markets and Markets prevê que o mercado de agentes de IA valerá US$ 47,1 bilhões até 2030.
Embora a atual tecnologia de agentes de IA ainda seja relativamente básica, alguns especialistas expressaram preocupações sobre os seus potenciais riscos de segurança. Dados divulgados por Blaho mostraram que o Operador teve um bom desempenho em algumas avaliações de segurança e foi capaz de responder com eficácia a testes que tentavam fazer com que o sistema realizasse “atividades ilegais” ou buscasse “dados pessoais confidenciais”. Os testes de segurança são considerados um dos motivos do longo ciclo de desenvolvimento do Operador.
Wojciech Zaremba, cofundador da OpenAI, criticou a falta de segurança dos agentes divulgados pela Anthropic nas redes sociais. Ele disse que se a OpenAI lançar um produto semelhante, poderá desencadear uma resposta negativa.
Destaque:
A ferramenta “Operator” da OpenAI, que será lançada em breve, controlará computadores de forma autônoma para executar tarefas como escrever código e reservar viagens.
De acordo com informações vazadas, o Operador tem uma taxa de sucesso relativamente baixa em algumas tarefas e tem um desempenho pior que o dos humanos.
Embora o Operador tenha tido um bom desempenho nas avaliações de segurança, os especialistas estão preocupados com os seus potenciais riscos de segurança.
Em suma, a ferramenta “Operator” da OpenAI demonstra o enorme potencial da tecnologia de IA no campo da automação, mas também enfrenta desafios de maturidade tecnológica e segurança. No futuro, com o contínuo desenvolvimento e melhoria da tecnologia, o “Operador” poderá mudar a forma como interagimos com os computadores, mas, ao mesmo tempo, precisamos de ser cautelosos quanto aos seus riscos potenciais.