近日,有消息指出OpenAI即將發布一款名為「Operator」的全新AI工具,該工具能夠直接控制個人電腦並自主執行各種任務,引發了廣泛關注。根據軟體工程師Tibor Blaho爆料,他透過發現OpenAI ChatGPT macOS客戶端中的隱藏選項以及OpenAI官網上的相關資訊(目前尚未公開),證實了這一消息,並預測其發佈時間為2025年1月。這項消息也與先前彭博社等媒體的報道相呼應,進一步增加了其可信度。 「Operator」的出現,將對個人電腦的使用方式帶來革命性的改變,同時也為人工智慧技術在實際應用中的探索增添了新的篇章。
近日,有消息指出OpenAI 即將推出一款名為「Operator」 的AI 工具,該工具具備控制個人電腦並代為執行任務的能力。軟體工程師Tibor Blaho 在社群媒體上透露了這一消息,稱他發現了關於這款工具的最新線索。此前,包括《彭博社》在內的多家媒體曾報道「Operator」 的傳聞,稱其能夠自主完成如編寫程式碼和預定旅行等多項任務。
據Blaho 透露,OpenAI 計劃在2025年1月發布「Operator」。他發現OpenAI 的ChatGPT macOS 用戶端中新增了隱密選項,可以定義「切換Operator」 和「強制退出Operator」 的快捷鍵。此外,OpenAI 的網站上也已經出現了“Operator” 的相關信息,儘管這些信息目前尚未對外公開。
Blaho 也提到,OpenAI 網站上有一些比較「Operator」 與其他電腦使用AI 系統效能的表格,這些表格可能只是佔位符。如果表格中的數據準確,那麼顯示「Operator」 的表現並不總是可靠,具體依賴執行的任務。
在OSWorld 的一項基準測試中,「OpenAI 電腦使用代理程式(CUA)」 的得分為38.1%,雖然超越了Anthropic 的電腦控制模型,但仍遠低於人類的72.4% 得分。在WebVoyager 的測試中,Operator 的表現超過了人類,而在WebArena 的測試中則不如人類的表現。對於一些簡單的任務,例如註冊雲端服務提供者並啟動虛擬機,Operator 的成功率僅為60%;而在創建比特幣錢包的任務中,其成功率僅為10%。
OpenAI 進入AI 代理商市場的時機恰逢其他競爭對手如Anthropic、Google等也在爭相推出類似技術。儘管AI 代理目前仍處於初級階段,但市場分析公司Markets and Markets 預計,到2030年,AI 代理市場的價值將達到471億美元。
雖然目前的AI 代理技術仍較為基礎,但一些專家對其潛在的安全隱患表示擔憂。 Blaho 透露的數據顯示,Operator 在某些安全評估中表現良好,能夠有效應對試圖讓系統執行「非法活動」 或搜尋「敏感個人資料」 的測試。安全測試被認為是Operator 開發週期較長的原因之一。
OpenAI 的共同創辦人Wojciech Zaremba 曾在社群媒體上批評Anthropic 發布的代理商缺乏安全保障,他表示如果OpenAI 發布類似產品,可能會引發負面反響。
劃重點:
OpenAI 即將發布的「Operator」 工具可自主控制電腦執行任務,如編寫程式碼和預定旅行。
根據洩漏訊息,Operator 在部分任務上的成功率相對較低,且表現不如人類。
儘管Operator 在安全評估中表現較好,但專家對其潛在的安全隱患表示關注。
總而言之,OpenAI的「Operator」工具展現了AI技術在自動化領域的巨大潛力,但同時也面臨技術成熟度和安全性的挑戰。未來,隨著科技的不斷發展與完善,「Operator」或許會改變我們與電腦互動的方式,但同時也需要謹慎對待其潛在的風險。