![](https://images.downcodes.com/uploads/20250114/img_67861855d3ed430.png)
Awesome-Papers-Автономный-Агент
Это сборник недавних статей, посвященных автономным агентам. Вот как Википедия определяет агента:
В искусственном интеллекте интеллектуальный агент — это агент, действующий разумным образом; Он воспринимает окружающую среду, самостоятельно предпринимает действия для достижения целей и может улучшить свою производительность за счет обучения или приобретения знаний. Интеллектуальный агент может быть простым или сложным: примером интеллектуального агента считается термостат, другая система управления, как и человек, а также любая система, отвечающая этому определению, например, фирма, государство или биом.
Таким образом, ключевой особенностью агента является то, что он может достигать целей , приобретать знания и постоянно совершенствоваться . Традиционные агенты в исследованиях RL не будут рассматриваться в этом сборнике. Хотя в недавних исследованиях агенты, основанные на LLM, привлекли внимание людей, агенты, основанные на RL, также занимают свою особую позицию. В частности, в этом репозитории заинтересованы два типа агентов: агент на основе RL и агент на основе LLM.
Обратите внимание, что этот список документов находится на активной поддержке . Бесплатно бесплатно открыть выпуск, если вы нашли пропущенные статьи, соответствующие теме.
История обновлений
- 31.01.2024: Добавлен специальный список для опросов по автономному агенту.
- 8 декабря 2023 г.: Добавлены документы, принятые ICML'23 и ICLR'23.
- 8.11.2023: Добавлены статьи, принятые NeurIPS'23. Добавить соответствующие ссылки (страницу проекта или github) к этим принятым документам?
- 25.10.2023: Классифицируйте все статьи по темам исследований. Проверьте ToC на предмет стандарта классификации?
- 18.10.2023: Выпуск первой версии сборника, включая документы, представленные на ICLR 2024.
Оглавление
- Опросы
- Агент на базе RL
- Инструкция следующая
- Создайте агент на основе модели мира.
- Язык как знание
- LLM как инструмент
- Обобщение по задачам
- Постоянное обучение
- Объедините RL и LLM
- Трансформаторная политика
- Путь к языку
- Предсказание траектории
- Другие
- Агент на базе LLM
- Мультимодальный
- Обучайте LLM обобщению и адаптации
- Проектирование под конкретные задачи
- Мультиагентность (например, общество, сотрудничество)
- Экспериментальный анализ
- Тест и набор данных
- Приложения
- Разработка алгоритма
- В сочетании с РЛ
- Другие
Опросы
- Обзор автономных агентов на основе большой языковой модели
- Распространение и потенциал агентов на основе больших языковых моделей: исследование
Агент на базе RL
Инструкция следующая
- [NeurIPS'23] Обучение с подкреплением, обусловленное естественным языком, с заданием «наизнанку» Разработка и перевод языка
- [NeurIPS'23] Помогите своему агенту с помощью адаптивных мультимодальных вознаграждений [проект]
- Композиционное обучение с использованием языковых моделей и обучения с подкреплением
- RT-1: робототехнический преобразователь для масштабного управления в реальном мире [блог]
- RT-2: Модели «видение-язык-действие» передают веб-знания роботизированному управлению [блог]
- Open X-Embodiment: наборы данных роботизированного обучения и модели RT-X [блог]
- [NeurIPS'23] Помогите своему агенту с помощью адаптивных мультимодальных вознаграждений [проект]
- ЛЕО: Воплощенный универсальный агент в трехмерном мире [проект]
Создайте агент на основе модели мира.
- [ICLR'23 Oral] Трансформеры — это модели мира с эффективной выборкой [код]
- Учимся моделировать мир с помощью языка
- МАМБА: эффективный подход к модели мира для обучения с метаподкреплением
Язык как знание
- Обучение с помощью языкового вывода и советы по непрерывному обучению с подкреплением
- Информирование агентов обучения с подкреплением путем привязки естественного языка к марковским процессам принятия решений
- Модуляция языкового вознаграждения для предтренировочного обучения с подкреплением
LLM как инструмент
- [NeurIPS'23] Эффективная адаптация политики с контрастным ансамблем подсказок для воплощенных агентов
- [ICLR'23] Дизайн вознаграждений с использованием языковых моделей [код]
- [ICML'23] RLang: декларативный язык для описания частичных знаний о мире агентам обучения с подкреплением [Плакат]
- [ICML'23] Мечтают ли воплощенные агенты о пиксельных овцах: воплощенное принятие решений с использованием языкового моделирования мира [Проект] [Код]
- [ICML'23] Обоснование больших языковых моделей в интерактивных средах с помощью онлайн-обучения с подкреплением
- Использование больших языковых моделей для оптимизации координации в текстовом многоагентном обучении с подкреплением
- Text2Reward: создание плотных вознаграждений с помощью языковых моделей для обучения с подкреплением
- Язык для вознаграждения за синтез навыков роботов
- Эврика: дизайн вознаграждений на уровне человека посредством написания больших языковых моделей
- STARLING: Самостоятельное обучение агента обучения с подкреплением на основе текста с помощью больших языковых моделей
Обобщение по задачам
- Универсальный агент
- AMAGO: масштабируемое обучение с подкреплением в контексте для адаптивных агентов
Постоянное обучение
- ADAPTER-RL: адаптация любого агента с использованием обучения с подкреплением
- Непрерывное онлайн-обучение для интерактивного обучения после агентов
- [NeurIPS'23] Определение непрерывного обучения с подкреплением
Объедините RL и LLM
- [NeurIPS'23] Большие языковые модели являются полупараметрическими агентами обучения с подкреплением
- RoboGPT: интеллектуальный агент, принимающий долгосрочные решения для ежедневных задач обучения.
- Могут ли языковые агенты приблизиться к эффективности RL? Эмпирическое исследование OpenAI Gym
- RLAdapter: объединение больших языковых моделей с обучением с подкреплением в открытых мирах
Трансформаторная политика
- [NeurIPS'23] Межэпизодическая учебная программа для агентов-трансформеров. [проект]
Путь к языку
- [NeurIPS'23] State2Explanation: концептуальные объяснения для улучшения обучения агентов и понимания пользователей
- [NeurIPS'23] Semantic HELM: удобочитаемая память для обучения с подкреплением
- [ICML'23] Преобразование моделей видения и языка интернет-масштаба в воплощенных агентов
- Понимание вашего агента: использование больших языковых моделей для объяснения поведения
Предсказание траектории
- Многоагентное прогнозирование траектории с помощью масштабируемого диффузионного преобразователя
Другие
- Расширение человеческого опыта в сотрудничестве человека и агента: человекоцентрированный подход к моделированию, основанный на положительной человеческой выгоде
- Победитель конкурса агент глубокого обучения с подкреплением в microRTS
- Согласование агентов как больших языковых моделей
Агент на базе LLM
Мультимодальный
- [ICML'23] PaLM-E: воплощенная мультимодальная языковая модель
- Steve-Eye: Оснащение воплощенных агентов на основе LLM визуальным восприятием в открытых мирах
- Мультимодальная веб-навигация с точно настроенными базовыми моделями с инструкциями
- Вы смотрите только на экраны: агенты мультимодальной цепочки действий
- Изучение программирования на языке воплощенного видения на основе инструкций, исследований и обратной связи с окружающей средой
- Воплощенный универсальный агент в трехмерном мире
- JARVIS-1: Многозадачные агенты в открытом мире с мультимодальными языковыми моделями с расширенной памятью
Обучайте LLM обобщению и адаптации
- FireAct: на пути к тонкой настройке языкового агента
- Адаптация агентов LLM посредством общения
- AgentTuning: включение обобщенных возможностей агента для LLM
- Retroformer: ретроспективные агенты большого языка с оптимизацией градиента политики
Проектирование под конкретные задачи
- [NeurIPS'23] Описывайте, объясняйте, планируйте и выбирайте: интерактивное планирование с помощью LLM позволяет использовать многозадачные агенты в открытом мире
- [NeurIPS'23] SwiftSage: генеративный агент с быстрым и медленным мышлением для сложных интерактивных задач [Github]
- Переосмысление парадокса проверки покупателя на информационных рынках с языковыми агентами
- Подход языкового агента к формальному доказательству теорем
- Агент инструктирует большие языковые модели быть общими рассуждениями с нулевым выстрелом
- Призрак в Minecraft: иерархические агенты для Minecraft с помощью больших языковых моделей с текстовыми знаниями и памятью
- PaperQA: генерирующий агент с расширенным поиском для научных исследований
- Языковые агенты для обнаружения неявных стереотипов в моделях преобразования текста в изображение в масштабе
- Агент по подозрению: игра в игры с несовершенной информацией с учетом теории разума GPT-4
Мультиагентность (например, общество, сотрудничество)
- CoMM: совместная работа нескольких агентов и множества путей рассуждения для решения сложных проблем
- Модульное создание кооперативных воплощенных агентов с использованием больших языковых моделей
- OKR-агент: система агентов, ориентированная на объекты и ключевые результаты, с иерархическим самосотрудничеством и самооценкой
- MetaGPT: метапрограммирование для платформы многоагентной совместной работы
- AutoAgents: платформа для автоматического создания агентов
- Динамическая сеть LLM-агентов: структура сотрудничества LLM-агентов с оптимизацией команды агентов
- AgentVerse: содействие многоагентному сотрудничеству и изучение нестандартного поведения
- Изучение механизмов сотрудничества для агентов LLM: взгляд социальной психологии
- REX: быстрое исследование и эксплуатация для агентов ИИ
- Появление социальных норм в агентских обществах, основанных на больших языковых моделях
Экспериментальный анализ
- Выявление рисков агентов LM с помощью песочницы, эмулированной LM
- Оценка возможностей многоагентной координации в больших языковых моделях
- Большие языковые модели как игровые агенты
- Сравнительный анализ больших языковых моделей в качестве агентов исследования ИИ
- Адаптивное моделирование среды для целенаправленных языковых агентов
- CLIN: постоянно изучаемый языковой агент для быстрой адаптации и обобщения задач
Тест и набор данных
- [ACL'24] AppWorld: управляемый мир приложений и людей для сравнительного анализа агентов интерактивного кодирования [веб-сайт][блог]
- [ICLR'23] Неоднозначность задач у людей и языковых моделей [код]
- SmartPlay: эталон для LLM как интеллектуальных агентов
- AgentBench: оценка LLM как агентов
- Вкладывайте деньги туда, где говорите: оценка стратегического планирования и работы агентов LLM на аукционной арене
- SOTOPIA: Интерактивная оценка социального интеллекта языковых агентов
- SocioDojo: создание пожизненных аналитических агентов с использованием реальных текстов и временных рядов
- WebArena: реалистичная веб-среда для создания автономных агентов
- LLM-обсуждение: оценка LLM с помощью интерактивной многоагентной игры для переговоров
- Оценка больших языковых моделей при оценке выполнения инструкций
- CivRealm: Одиссея обучения и рассуждений для агентов, принимающих решения
Приложения
- Агенты Lyfe: генерирующие агенты для недорогого социального взаимодействия в реальном времени.
- AutoGen: включение приложений LLM нового поколения посредством межагентного диалога
Разработка алгоритма
- [ICLR'23 Oral] ReAct: синергия рассуждений и действий в языковых моделях [код]
- [NeurIPS'23] AdaPlanner: адаптивное планирование на основе обратной связи с помощью языковых моделей [github]
- Prospector: улучшение агентов LLM с помощью самозадач и ранжирования траектории
- Формальное определение высокоуровневого поведения агентов на основе LLM
- Кумулятивные рассуждения с использованием больших языковых моделей
В сочетании с РЛ
- [NeurIPS'23] Рефлексия: языковые агенты с обучением с вербальным подкреплением [код]
- Обучение LLM обучаться более эффективным инструкциям посредством обучения с подкреплением
- Языковые агенты с подкреплением для стратегической игры в игре «Вервольф»
Другие
- [NeurIPS'24] Может ли обучение на основе графов улучшить планирование в агентах на основе LLM? [код] [китайский блог] [английский блог]
- AgentSquare: автоматический поиск агентов LLM в модульном пространстве дизайна[страница проекта][Github]
- LUMOS: К языковым агентам, которые являются унифицированными, модульными и с открытым исходным кодом
- Лемур: гармонизация естественного языка и кода для языковых агентов
- Поиск по дереву языковых агентов унифицирует рассуждения, действия и планирование в языковых моделях