인간의 기기를 대신하는 AI 에이전트(지능형 에이전트)는 한때 공상과학 영화의 한 장면에 불과했지만 오늘날 주식시장에서 화제가 되고 있다.
바로 10월 23일, 미국의 대규모 AI 모델 회사인 Anthropic이 새로운 Claude 3.5 Haiku와 업그레이드된 Sonnet 버전을 출시했습니다. Sonnet은 화면 보기, 커서 이동, 클릭, 가상 키보드를 통한 입력 등 컴퓨터를 인간처럼 조작할 수 있는 새로운 AI 경험 "컴퓨터 사용"을 제공합니다.
이틀 후 Zhipu AI는 Anthropic의 뒤를 이어 AutoGLM을 출시했으며, 개인 비서로서 사용자의 휴대폰을 "제어"한다는 명확한 목표를 가지고 있었습니다. WeChat과의 상호작용, 테이크아웃 주문, 빨간 봉투 집기 등의 개인화된 작업을 독립적으로 수행할 수 있습니다. 이는 주로 WeChat, Taobao, Meituan 및 Xiaohongshu와 같은 앱의 일반적인 사용자 작업을 대상으로 합니다.
이 두 제품은 AI가 채팅 머신에서 도구를 사용해 문제를 해결하는 단계로 전환해 AI 에이전트가 점차 현실의 실용적인 제품으로 나아갈 수 있다는 것을 의미한다.
이런 AI 에이전트 열풍은 자본시장에 즉각 충격을 안겼다.
10월 28일 오전 시장이 개장하자 병렬기술(Parallel Technology), 캐피털 온라인(Capital Online), 스타트업 다크호스(Startup Dark Horse), 도심교육(Doushen Education), 추안즈교육(Chuanzhi Education), 디앙광미디어(Dianguang Media) 등 지푸 관련 컨셉주가 빠르게 일일 한도를 기록했다. 주식은 20%에서 30% 증가하여 일일 한도에 도달했습니다.
자본시장의 빠른 반응은 AI 에이전트의 상용화 전망에 대한 높은 기대감을 반영한다. 그러나 본질적으로 관련 애플리케이션이 아직 시장 초기 단계에 있기 때문에 이러한 가격 상승의 물결은 시장 정서와 투기를 배제할 수 없습니다.
AI Agent는 미래 기술의 장기적인 추세인가, 아니면 단기적인 추세인가?
기술적인 관점에서 볼 때, "컴퓨터 사용"(컴퓨터 사용)과 "전화 사용"(휴대폰 사용)에 초점을 맞춘 AI 에이전트의 등장은 AI가 단일 언어 이해에서 점차 복잡한 작업 실행으로 확장되는 발전을 의미합니다.
Anthropic의 Claude Sonnet과 Zhipu의 AutoGLM은 자연어 대화를 처리할 뿐만 아니라 사용자의 장치를 직접 제어하여 특정 작업을 수행합니다. 이는 인간-컴퓨터 상호 작용의 새로운 단계입니다. Anthropic의 Sonnet 시연은 코드 작성 및 데이터 분석과 같은 작업을 처리할 수 있고 오류가 발생하면 다른 솔루션을 시도할 수도 있음을 보여줍니다. 이러한 유연성은 AI가 특정 "실행 능력"을 갖기 시작했음을 보여줍니다.
Zhipu의 AutoGLM은 휴대폰 장면에 중점을 둡니다. OCR 기술을 통해 UI 구성 요소를 이해하고 체인 사고 훈련을 통해 구성 요소 기능을 이해함으로써 AutoGLM은 사용자 휴대폰 화면의 다양한 구성 요소를 식별하고 해당 기능을 이해한 다음 WeChat 상호 작용 및 전자 상거래 주문 자동화와 같은 지침에 따라 작업을 실행할 수 있습니다. .
그러나 이러한 제품은 여전히 사용자 경험과 상용화에 한계가 있습니다.
AutoGLM은 휴대폰 작동을 더욱 지능적으로 만들지만 개인 정보 보호 및 보안 문제에 대한 우려도 제기합니다. 사용자가 편의를 위해 일부 개인 정보 보호를 포기할까요? 또한 AutoGLM은 현재 여전히 명확한 지침이 필요하며 플랫폼 간 적응성과 운영 정확성이 제한되어 있습니다. 진정으로 원활한 자동화를 달성하려면 지속적인 최적화가 필요합니다.
진정한 "지능" 측면에서 AutoGLM에도 개선의 여지가 있습니다. 예를 들어 CITIC 증권은 공식 시연 영상에서 AutoGLM이 루이싱 커피를 주문할 때 18위안 이상을 지불했다는 연구 보고서를 지적했는데, 이는 분명한 프리미엄이었다. 쿠폰' 이 브랜드의 게임 플레이. .
구체적인 상용화 측면에서 지난 9월 Zhipu와 Honor는 AI 대형 모델 기술 공동 연구소를 설립하여 업계가 단말기 애플리케이션에서 AI Agent의 잠재력을 확인할 수 있도록 했습니다. 하지만 이 기능을 지원하는 휴대폰 브랜드 수가 제한되어 있기 때문에 실제 대규모 적용에는 여전히 시간이 걸립니다. IDC에 따르면 2027년 중국 시장에서 AI 휴대폰과 AI PC 점유율은 각각 50%, 80%를 넘어설 것으로 예상된다.
거대 기술 기업의 레이아웃 활동으로 볼 때 AI Agent는 실제로 대형 모델 분야에서 중요한 전장입니다.
공개된 정보에 따르면 오픈AI는 연말까지 자체 AI 에이전트 소프트웨어인 오리온(Orion)을 출시할 예정이며, 애플도 다음 달 iOS 18.1에 애플 인텔리전스를 추가할 예정이다. Microsoft는 자동 티켓 예약과 같은 기능을 완료할 수 있는 화면 구문 분석 도구 OmniParser를 오픈 소스로 제공했습니다. Google의 Geimini 2.0은 12월에 출시될 예정이며 Chrome 웹페이지 작업을 자동화하기 위해 새로운 유사한 프로젝트인 "Project Jarvis"가 개발되고 있습니다.
이는 AI 에이전트가 실험실 제품에서 대량 애플리케이션으로 계속 이동하고 있으며, 이를 뒷받침하는 거대 기업도 시장을 점유하기 위해 한발 더 나아가고 있음을 의미합니다.
실리콘밸리의 벤처캐피탈 동향은 점점 더 많은 기업이 AI 인프라에서 애플리케이션 수준으로 전환하고 있으며, 수직적으로 세분화된 AI 애플리케이션이 호황을 누리고 있음을 보여줍니다. 그러나 현재의 AI 에이전트 기술은 크로스 플랫폼 운영 기능이 부족하고 지침에 대한 의존도가 높으며 최적화가 필요한 개인화된 경험 등의 문제에 여전히 직면해 있습니다. AI Agent가 주류 시장에 완전히 진입하기 위해서는 기능 개선뿐만 아니라 개인 정보 보호 및 데이터 보안 측면에서 대중의 신뢰를 얻어야 합니다.
아직 단기적으로 AI Agent의 적용 범위는 제한적이지만, AI Agent가 가져오는 효율성과 편의성은 충분히 매력적입니다. 기술 및 개인 정보 보호 문제가 해결되면 AI 에이전트는 인간 생활에서 지능형 애플리케이션을 발전시킬 수 있는 더 큰 기회를 갖게 될 것입니다.