ZHIPU AI недавно выпустил новый продукт, основанный на технологии GLM, AutoGLM, интеллектуального органа, который может имитировать человеческую работу мобильных телефонов и выполнять различные ежедневные задачи. Появление AutoGLM отмечает большой прорыв в области искусственного интеллекта в области приложений мобильных телефонов. жизнь. . Его эксплуатационная логика аналогична логике людей, без сложных процессов, а порог для использования чрезвычайно низкий.
AutoGLM может выполнять различные задачи, такие как Like, и комментировать моменты WeChat, покупать исторические продукты на Taobao, бронирование отелей на CTRIP, приобретение билетов на поезд на 12306, заказы на Meituan и т. Д. Его сценарии применения не ограничиваются этим.
В настоящее время пользователи могут испытывать AutoGLM-WEB, установив плагин «Zhipu Qingyan», который является помощником браузера, который может имитировать пользователей, посещающих веб-страницы, щелкнуть веб-страницы и автоматически завершать расширенный поиск, резюме и генерацию контента на веб-сайте. Кроме того, AutoGLM также открыл приложение для внутреннего тестирования на Android Systems и выполнил подробное сотрудничество с производителями мобильных телефонов, такими как Honor.
Технология AutoGLM основана на саморазвитом «базовом агентском интерфейсе» Zhipu и «Средстве обучения в онлайн-курсе», которая решает антагонизм способности, учебные задачи и дефицит данных в планировании задач крупного моделя и выполнении действий. Такие проблемы, как редкие сигналы обратной связи и дрейф распределения стратегии. AutoGLM может постоянно улучшать себя и постоянно постоянно улучшать свои собственные результаты, аналогично людям, постоянно получающим новые навыки во время своего роста.
С точки зрения технических проблем, AutoGLM решает проблему недостаточного «выполнения действий» и недостаточного «планирования задач». Благодаря дизайну «базового агента, развязывающего промежуточный интерфейс», он разворачивает два этапа «планирования задач» и «выполнения действий» через интерфейс промежуточного языка естественного языка, достигая значительного улучшения возможностей агента. В то же время AutoGLM принимает «Среднюю структуру обучения в Интернете, чтобы изучить и улучшить возможности агентов крупных моделей в веб-средах и телефонных средах в реальных онлайн-средах.
AutoGLM добился значительных улучшений производительности как при использовании телефона, так и в использовании веб-браузеров и превзошел производительность GPT-4O и Claude-3,5-Sonnet в показателях оценки AndroidLab. В эталонном оценке Wibarena-Lite AutoGLM достиг около 200% повышения производительности по сравнению с GPT-4O, сократив разрыв в скорости успеха между людьми и крупными модельными агентами в манипуляциях с графическим интерфейсом.
Адрес проекта: https://xiao9905.github.io/autoglm
Благодаря мощным функциям и технологическим инновациям AutoGLM продемонстрировал огромный потенциал искусственного интеллекта в области работы мобильного телефона, что приносит больше удобства для повседневной жизни людей. Его отличная производительность в тестировании производительности также доказывает свою техническую силу. В будущем, благодаря непрерывному развитию технологий, ожидается, что AutoGLM будет достигать более широких приложений и создаст большую ценность для пользователей.