최근 OpenAI는 "연산자"라는 새로운 AI 도구를 출시하려고합니다.이 도구는 개인용 컴퓨터를 직접 제어하고 다양한 작업을 독립적으로 수행 할 수 있습니다. 소프트웨어 엔지니어 Tibor Blaho의 뉴스에 따르면, 그는 OpenAI ChatGpt MacOS 클라이언트의 숨겨진 옵션과 OpenAI의 공식 웹 사이트에 대한 관련 정보를 발견하여 뉴스를 확인했으며 릴리스 시간이 2025 년 1 월이라고 예측했습니다. 이 뉴스는 또한 Bloomberg와 다른 미디어의 보고서를 반향하여 신뢰성을 높였습니다. "운영자"의 출현은 개인용 컴퓨터의 사용에 혁신적인 변화를 가져올 것이며 실제 응용 분야에서 인공 지능 기술 탐색에 새로운 장을 추가합니다.
최근에 OpenAI는 개인용 컴퓨터를 제어하고 작업을 수행 할 수있는 "연산자"라는 AI 도구를 시작하려고합니다. 소프트웨어 엔지니어 Tibor Blaho는 소셜 미디어에 대한 뉴스를 공개 하여이 도구에 대한 최신 단서를 발견했다고 밝혔다. 이전에 Bloomberg News Agency를 포함한 많은 미디어는 "운영자"라는 소문을보고하여 코드 작성 및 예정된 여행과 같은 많은 작업을 완료 할 수 있다고 말했습니다.
Blaho에 따르면 Openai는 2025 년 1 월에 "운영자"를 발표 할 계획입니다. 그는 OpenAi의 ChatGpt MacOS 클라이언트가 새로운 비밀 옵션을 추가하여 "스위칭 연산자"와 "강제 운영자 철수"의 바로 가기 키를 정의 할 수 있음을 발견했습니다. 또한 정보는 아직 공개되지 않았지만 "운영자"는 OpenAI 웹 사이트에도 나타났습니다.
Blaho는 또한 OpenAI 웹 사이트에 "운영자"와 다른 컴퓨터를 비교하는 일부 테이블이 있다고 언급했습니다. 테이블의 데이터가 정확한 경우 실행 작업에 따라 "연산자"의 성능이 항상 신뢰할 수있는 것은 아닙니다.
Osworld의 벤치 마크 테스트에서 "Openai Computer (CUA)"점수는 38.1%입니다. WebVoyager 테스트에서 운영자의 성능은 인간을 초과하며 Webarena의 테스트에서는 인간의 성능만큼 좋지 않습니다. 등록 된 클라우드 서비스 제공 업체 및 시작 가상 머신과 같은 일부 간단한 작업의 경우, 성공률은 60%에 불과하며 성공률은 10%에 불과합니다.
OpenAI가 AI 에이전시 시장에 입력 할 시간은 Anthropic 및 Google과 같은 다른 경쟁 업체와 일치합니다. AI 에이전트는 여전히 초기 단계에 있지만 시장 분석 회사 인 Markets and Markets는 2030 년까지 AI 에이전시 시장의 가치가 471 억 달러에 달할 것으로 예상합니다.
현재 AI 프록시 기술은 여전히 더 기본이지만 일부 전문가들은 잠재적 안전 위험에 대한 우려를 표명했습니다. Blaho가 공개 한 데이터는 운영자가 특정 보안 평가에서 잘 수행되었으며 시스템이 "불법 활동"을 수행하거나 "민감한 개인 데이터"를 검색 할 수있는 테스트에 효과적으로 대응할 수 있음을 보여줍니다. 안전 테스트는 운영자의 긴 개발주기의 이유 중 하나로 간주됩니다.
Openai의 공동 창업자 Wojciech Zaremba는 보안 보증의 부족에 대한 Anthropic이 발표 한 에이전트를 비판했다.
전철기:
OpenAi의 다가오는 "운영자"도구는 코드 작성 및 예약 된 여행과 같은 컴퓨터 실행 작업을 독립적으로 제어 할 수 있습니다.
누설 정보에 따르면, 일부 작업에 대한 운영자의 성공률은 상대적으로 낮으며 인간만큼 좋지 않습니다.
보안 평가에서 운영자가 잘 수행되었지만 전문가들은 잠재적 안전 위험에주의를 기울였습니다.
OpenAI의 "운영자"도구는 자동화 분야에서 AI 기술의 큰 잠재력을 보여 주지만 기술 성숙도와 보안의 어려움에 직면 해 있습니다. 앞으로 기술의 지속적인 개발과 개선으로 "운영자"는 컴퓨터와의 상호 작용 방식을 바꿀 수 있지만 잠재적 위험을 신중하게 처리해야합니다.