OpenAi는 사용자가 온라인으로 다양한 작업을 수행 할 수 있도록 설계된 강력한 도구 인 최신 AI 프록시 "운영자"를 출시했습니다. 강화 학습을위한 GPT-4O의 시각적 기능과 고급 추론을 결합하고 그래픽 사용자 인터페이스 (GIS)와 상호 작용하고 사용자 지정 API 통합없이 네트워크에서 독립적으로 작동 할 수 있습니다. 운영자는 현재 Research Preview 단계에 있으며 US Chatgpt Pro 구독 사용자에게만 제공되며 월 $ 200의 수수료가 있습니다. 이 기사는 운영자의 기능, 보안 및 향후 개발 계획을 자세히 소개합니다.
OpenAI는 사용자가 네트워크에서 다양한 작업을 수행 할 수 있도록 설계된 도구 인 최신 AI 에이전트 "운영자"의 출시를 발표했습니다. OpenAi는 블로그에서 운영자가 "연구 미리보기"를 수행하고 있으며 처음에는 월 $ 200의 수수료로 미국의 ChatGpt Pro 가입 사용자를 대상으로하고 있다고 말했다.
운영자의 설계 철학은 GPT-4O의 시각적 기능과 고급 추론을 강화 학습과 결합하는 "컴퓨터 사용 에이전트"라는 모델을 통해 그래픽 사용자 인터페이스 (GUI)와 상호 작용하는 것입니다. OpenAi는 운영자가 내장 브라우저를 통해 웹 페이지를보고 타이핑, 클릭 및 스크롤을 통해 페이지와 상호 작용할 수 있다고 설명합니다. 이 기술의 장점은 운영자가 맞춤형 API 통합없이 네트워크에서 독립적으로 작동 할 수 있다는 것입니다.
사용하는 동안 운영자는 추론 능력을 사용하여 "스스로 수정"할 수있을뿐만 아니라 어려움에 직면 할 때 사용자에게 제어를 넘겨 줄 수 있습니다. 웹 사이트가 로그인 자격 증명과 같은 민감한 정보를 요청하면 운영자는 사용자에게 작업을 인수 할 것인지 묻습니다. 또한 운영자는 사용자가 이메일 전송과 같은 거래를 처리 할 때 확인해야합니다. OpenAI는 운영자가 유해한 요청을 거부하고 무단 컨텐츠를 차단하는 것을 목표로 보안에 특별히 강조하여 설계되었다고 강조합니다.
Openai는 또한 운영자가 Doordash, Instacart, Opentable, Priceline, Stubhub, Thumb 및 Uber와 같은 잘 알려진 여러 회사와 협력하여 실제 요구를 충족시키고 기존 업계 규범을 따르는 것으로 밝혀졌습니다. 그러나 OpenAI는 또한 사용자에게 슬라이드 쇼 생성 또는 캘린더 관리와 같은 복잡한 인터페이스를 처리 할 때 도구가 현재 어려움을 경험할 수 있음을 상기시킵니다.
OpenAI는 운영자를 플러스, 팀 및 엔터프라이즈 사용자로 확장하고 이러한 기능을 ChatGpt에 통합 할 계획입니다. 이는 더 많은 사용자 가이 최첨단 기술로 가져온 편의를 경험할 수있는 기회를 갖게 될 것임을 의미합니다.
공식 팟 캐스트 : https://openai.com/index/introducing-operator/
전철기:
OpenAI는 사용자가 온라인으로 작업을 수행 할 수 있도록 "운영자"AI 에이전트를 출시하며 ChatGpt Pro 사용자를 대상으로 한 최초의 사람입니다.
운영자는 브라우저를 통해 웹 페이지와 상호 작용할 수 있으며 보안을 보장하기 위해 자체 정정 및 사용자 제어 기능이 있습니다.
Openai는 많은 유명한 회사와 협력하여 실제 요구를 충족시키고 향후 더 많은 사용자에게 확장 할 계획입니다.
요컨대, 운영자는 AI 프록시 필드에서 OpenAI의 대담한 시도로 네트워크 작업을 자동화 할 때 AI의 큰 잠재력을 보여줍니다. 아직 초기 단계이지만 미래의 발전은 기대할 가치가 있으며 AI가 미래에 인간과 상호 작용할 수있는 더 많은 가능성을 나타냅니다.