Компания Baichuan Intelligent и Тяньцзиньский университет запустили среду агента «Sibyl System», которая возглавила список сложных задач крупных моделей GAIA.

Автор：Eve Cole Время обновления：2024-12-06 09:00:01

Редактор Downcodes сообщил: Baichuan Intelligence объединилась с Тяньцзиньским университетом для разработки агентской среды под названием Sibyl System, которая заняла первое место в оценке GAIA Leader Board, совместно запущенной Meta, Huggingface и AutoGPT. Оценка GAIA фокусируется на оценке возможностей выполнения агента и конструкции решения для сложных задач. Она проверяет вопросы, которые ближе к сценариям реальных приложений и создают чрезвычайно серьезные проблемы для моделей ИИ. Это достижение знаменует собой крупный прорыв в китайской технологии искусственного интеллекта в области обработки сложных задач.

Компания Baichuan Intelligence в сотрудничестве с Тяньцзиньским университетом запустила систему интеллектуальных агентов Sibyl System и заняла первое место в списке лидеров GAIA. GAIA — это новая схема оценки, предложенная Meta, Huggingface и AutoGPT в ноябре 2023 года. Она в основном оценивает возможности и решения Агента при выполнении сложных задач. Этот план оценки выявляет недостатки возможностей существующих моделей и предлагает направления по улучшению разработки моделей и агентов.

Тестовые вопросы GAIA ближе к реальному миру и требуют от ИИ способности рассуждать, мультимодального понимания (текст, изображения, аудио/видео), просмотра веб-страниц и возможностей использования инструментов. Эти вопросы несложно понять людям, но чрезвычайно сложны для моделей. Например, вероятность успеха GPT-4 в тестировании составила всего 15%, тогда как экспериментаторы на людях смогли достичь 92%. Решение этих задач часто требует длинных логических связей и времени, включая множество шагов и инструментов.

Конструктивные особенности платформы Sibyl System включают в себя:

Генерация улучшений поиска замены человекоподобного интерфейса браузера.
Вопросы и ответы заменяют диалог, используя функции вопросов и ответов без сохранения состояния для упрощения архитектуры системы.
Используйте только два распространенных инструмента: веб-браузер и среду Python, чтобы уменьшить зависимость от специализированных инструментов.
От Системы 1 до Системы 2 вводится механизм «присяжных» для проведения самокритики и исправлений посредством многоагентных дебатов, а также использования информации в глобальном рабочем пространстве для повышения точности ответов.

Sibyl System — это простая, но мощная платформа агентов, основанная на больших языковых моделях, которая может решать сложные логические задачи с помощью небольшого количества инструментов. Это снижает сложность системы за счет внедрения механизмов Global Workspace и Multi-Agent, а также универсальных каналов сбора информации на основе браузера, одновременно увеличивая сложность решения проблем и реализуя трансформацию модели от «быстрого мышления» к «медленному мышлению». . Sibyl System также обладает хорошей масштабируемостью и простотой отладки. Она может легко заменить модули Агентов других моделей и улучшить возможности модели.

Технический отчет: https://arxiv.org/pdf/2407.10718.

Успех платформы Sibyl System не только демонстрирует сильные стороны Baichuan Intelligence и Тяньцзиньского университета в области искусственного интеллекта, но также предоставляет ценный опыт и рекомендации для проектирования и разработки будущих структур интеллектуальных агентов. Я считаю, что в ближайшем будущем мы увидим больше инновационных приложений на основе платформы Sibyl System, способствующих развитию технологий искусственного интеллекта на более глубоком уровне.