Научно-исследовательский институт интеллектуальной промышленности (AIR) Университета Цинхуа 24 декабря 2024 года выпустил новейшую модель искусственного интеллекта AutoDroid-V2, призванную значительно повысить эффективность автоматического управления мобильными устройствами. Эта модель радикально использует метод сценариев, основанный на небольшой языковой модели, вместо того, чтобы полагаться на большую языковую модель в облаке. Она эффективно решает проблемы высокого потребления трафика и высоких рисков конфиденциальности и безопасности в традиционных методах, тем самым улучшая взаимодействие с пользователем при одновременном сокращении. эксплуатационные расходы на стороне сервера.
Недавно, 24 декабря 2024 года, Научно-исследовательский институт интеллектуальной промышленности (AIR) Университета Цинхуа выпустил модель искусственного интеллекта под названием AutoDroid-V2, направленную на оптимизацию возможностей автоматического управления мобильными устройствами. Эта модель значительно повышает эффективность работы пользователей с использованием естественного языка за счет применения небольших языковых моделей.
AutoDroid-V2 использует подход на основе сценариев, который отличается от традиционного подхода, основанного на больших языковых моделях (LLM) в облаке. Это нововведение позволяет устройству эффективно выполнять инструкции пользователя и снижать зависимость от облачных сервисов, тем самым значительно улучшая конфиденциальность и безопасность. В то же время это также снижает потребление трафика на стороне пользователя и эксплуатационные расходы на стороне сервера, а также способствует широкому применению мобильных устройств.
На фоне проекта в последние годы появление больших языковых моделей и моделей визуального языка позволило управлять мобильными устройствами с помощью команд на естественном языке. Эти технологии предоставляют новые способы решения сложных пользовательских задач. Однако традиционный подход «пошаговый агент с графическим интерфейсом» имеет проблемы с высоким потреблением трафика и рисками безопасности конфиденциальности, что затрудняет крупномасштабное развертывание.
Инновация AutoDroid-V2 заключается в том, что он может генерировать многоэтапные сценарии на основе инструкций пользователя для одновременного выполнения нескольких операций графического интерфейса. Этот метод значительно снижает частоту запросов, снижает потребление ресурсов и позволяет напрямую генерировать и выполнять сценарии задач на пользовательском устройстве. Эта модель создает документацию приложения в автономном режиме, закладывая основу для последующей генерации сценариев.
В тесте производительности AutoDroid-V2 провел тестовый тест из 226 задач в 23 мобильных приложениях. По сравнению с предыдущими моделями, такими как AutoDroid и SeeClick, показатель выполнения задач увеличился на 10,5% до 51,7%. Кроме того, потребление входных и выходных токенов уменьшено до 1/43,5 и 1/5,8 соответственно, а задержка вывода модели уменьшена с 5,7 до 13,4 раз по сравнению с оригиналом. Эти результаты показывают эффективность и надежность AutoDroid-V2 в практическом применении.
Основные моменты:
AutoDroid-V2 — это новая модель искусственного интеллекта, запущенная Университетом Цинхуа, которая повышает эффективность управления мобильными устройствами на естественном языке.
Эта модель снижает зависимость от облачных сервисов за счет небольших языковых моделей и повышает конфиденциальность и безопасность пользователей.
Тесты производительности показывают, что AutoDroid-V2 значительно улучшает скорость выполнения задач и потребление ресурсов, демонстрируя большой потенциал приложения.
В целом, AutoDroid-V2 представляет собой новое решение для автоматизированного управления мобильными устройствами, обладающее высокой эффективностью, безопасностью и низкой стоимостью, демонстрируя огромные перспективы его применения. Стоит с нетерпением ждать его дальнейшего развития и более широкого применения.