Агент искусственного интеллекта «умного спектра», который может управлять мобильными телефонами, довел многие концептуальные акции до дневного лимита

Автор：Eve Cole Время обновления：2024-11-15 12:30:01

Агенты ИИ (интеллектуальные агенты), которые захватывают человеческие устройства, когда-то были просто декорациями в научно-фантастических фильмах, но сегодня они стали горячей темой на фондовом рынке.

Буквально 23 октября Anthropic, крупная американская компания, занимающаяся моделями искусственного интеллекта, выпустила новый Claude 3.5 Haiku и обновленную версию Sonnet. Sonnet предлагает новый опыт искусственного интеллекта «Использование компьютера», который может управлять компьютером как человек, например, просматривать экран, перемещать курсор, щелкать мышью, печатать с помощью виртуальной клавиатуры и т. д.

Двумя днями позже Zhipu AI последовала примеру Anthropic и выпустила AutoGLM с четкой целью «контролировать» мобильный телефон пользователя в качестве личного помощника. Он может самостоятельно выполнять персонализированные задачи, такие как взаимодействие с WeChat, размещение заказов на вынос и даже получение красных конвертов. Он в основном предназначен для обычных пользовательских операций в таких приложениях, как WeChat, Taobao, Meituan и Xiaohongshu.

Эти два продукта представляют собой переход ИИ от чат-машин к этапу использования инструментов для решения проблем, позволяя агентам ИИ постепенно переходить к практическим продуктам в реальности.

Эта тенденция в сфере ИИ-агентов немедленно вызвала шок на рынке капитала.

Когда рынок открылся утром 28 октября, концептуальные акции, связанные с Zhipu, быстро достигли дневного лимита. Акции таких компаний, как Parallel Technology, Capital Online, Startup Dark Horse, Doushen Education, Chuanzhi Education и Dianguang Media, сильно выросли. акции достигли дневного лимита, увеличившись на 20–30%.

Быстрая реакция рынка капитала отражает большие ожидания относительно перспектив коммерциализации AI Agent. Но по сути, поскольку соответствующие заявки все еще находятся на ранних стадиях рынка, эта волна роста цен не может исключить рыночные настроения и спекуляции.

AI Agent — это долгосрочная тенденция в технологиях будущего или краткосрочная тенденция?

С технической точки зрения появление агентов ИИ, которые фокусируются на «использовании компьютера» (использовании компьютера) и «использовании телефона» (использовании мобильных телефонов), знаменует собой развитие ИИ от понимания одного языка до постепенного расширения до выполнения сложных задач.

Claude Sonnet от Anthropic и AutoGLM от Zhipu будут не только обрабатывать диалоги на естественном языке, но и напрямую управлять устройством пользователя для выполнения определенных операций. Это новый этап взаимодействия человека и компьютера. Демонстрация Sonnet от Anthropic показывает, что он может справляться с такими задачами, как написание кода и анализ данных, и даже может пробовать разные решения при возникновении ошибок. Такая гибкость показывает, что ИИ начинает обладать определенной «силой выполнения».

AutoGLM от Zhipu фокусируется на сфере мобильных телефонов. Понимая компоненты пользовательского интерфейса с помощью технологии оптического распознавания символов и понимая функции компонентов с помощью обучения цепному мышлению, AutoGLM может идентифицировать различные компоненты на экране мобильного телефона пользователя, понимать их функции, а затем выполнять операции в соответствии с инструкциями, такие как автоматизация взаимодействия WeChat и заказов электронной коммерции. .

Однако такие продукты по-прежнему имеют ограничения в плане пользовательского опыта и коммерциализации.

Хотя AutoGLM делает операции с мобильными телефонами более интеллектуальными, это также вызывает обеспокоенность по поводу вопросов конфиденциальности и безопасности: откажутся ли пользователи от некоторой защиты конфиденциальности ради удобства? Кроме того, AutoGLM в настоящее время по-прежнему требует четких инструкций и ограничен в кроссплатформенной адаптивности и операционной точности — для достижения действительно бесшовной автоматизации требуется непрерывная оптимизация.

Что касается истинного «интеллекта», AutoGLM также есть куда совершенствоваться. Например, компания CITIC Securities указала в исследовательском отчете, что в официальном демонстрационном видеоролике AutoGLM заплатила более 18 юаней при размещении заказа Luckin Coffee, что было явной премией. Похоже, она еще не освоила сложный «захват». купоны" геймплей этих брендов. .

Что касается конкретной коммерциализации, в сентябре Zhipu и Honor создали совместную лабораторию технологий больших моделей искусственного интеллекта, чтобы позволить отрасли увидеть потенциал AI Agent в терминальных приложениях. Однако из-за ограниченного числа марок мобильных телефонов, поддерживающих эту функцию, создание настоящего крупномасштабного приложения все равно потребует времени. По данным IDC, в 2027 году доля рынка мобильных телефонов и ПК с искусственным интеллектом на китайском рынке превысит 50% и 80% соответственно.

Судя по макетным действиям технологических гигантов, AI Agent действительно является важным полем битвы в области больших моделей.

Согласно общедоступной информации, OpenAI, как ожидается, выпустит собственное программное обеспечение AI Agent Orion к концу года, а Apple также добавит Apple Intelligence в iOS 18.1 в следующем месяце. Microsoft открыла исходный код инструмента анализа экрана OmniParser, который может выполнять такие функции, как автоматическое бронирование билетов. Ожидается, что Google Geimini 2.0 будет запущен в декабре, а новый аналогичный проект Project Jarvis разрабатывается для автоматизации задач веб-страниц Chrome.

Это означает, что агенты ИИ продолжают переходить от лабораторных продуктов к массовым приложениям, а стоящие за ними гиганты также стремятся занять рынок.

Тенденции венчурного капитала в Кремниевой долине показывают, что все больше и больше компаний переходят от инфраструктуры искусственного интеллекта к уровню приложений, и все больше вертикально сегментированных приложений искусственного интеллекта переживают бум. Однако текущая технология AI Agent по-прежнему сталкивается с проблемами, такими как недостаточные возможности кросс-платформенной работы, сильная зависимость от инструкций и персонализированный опыт, который необходимо оптимизировать. Чтобы полностью выйти на основной рынок, AI Agent должен не только улучшить свои функции, но и завоевать доверие общественности с точки зрения конфиденциальности и безопасности данных.

В краткосрочной перспективе сфера применения AI Agent по-прежнему ограничена, но эффективность и удобство, которые он обеспечивает, достаточно привлекательны. Как только технические проблемы и проблемы конфиденциальности будут решены, у агентов ИИ появится больше возможностей для продвижения интеллектуальных приложений в жизни человека.