Загрузка Agent4SE Paper List - Загрузка исходного кода Agent4SE Paper List

Агенты на основе моделей большого языка для разработки программного обеспечения: обзор

Недавний прогресс в области моделей большого языка (LLM) сформировал новую парадигму агентов ИИ, то есть агентов на основе LLM. По сравнению с автономными LLM, агенты на основе LLM существенно расширяют универсальность и опыт LLM, расширяя LLM возможностями восприятия и использования внешних ресурсов и инструментов. На сегодняшний день агенты на основе LLM применяются и показывают замечательную эффективность в разработке программного обеспечения (SE). Синергия между несколькими агентами и человеческим взаимодействием дает новые перспективы в решении сложных реальных проблем SE. В этой работе мы представляем комплексное и систематическое исследование агентов на основе LLM для SE. Мы собрали 106 статей и классифицировали их с двух точек зрения: с точки зрения SE и агента. Кроме того, мы обсуждаем открытые проблемы и будущие направления в этой важной области.

? Мы систематически обобщали прогресс Agent4SE с точки зрения как задач разработки программного обеспечения, так и архитектуры агента .

? Paper Link: Агенты на основе моделей большого языка для разработки программного обеспечения: опрос

изображение-20240921134539206

Пометить этот репозиторий

Эта область исследований быстро развивается; отметьте этот репозиторий, чтобы быть в курсе обновлений!

Новости

[2024/09/04] Мы выпустили первую версию нашего опроса на arXiv.

Локализация неисправности
Восстановление программы
Единая отладка
Модульное тестирование
Тестирование системы
Статическое обнаружение ошибок
Обзор кода
Требования к проектированию
Генерация кода
Проверка
Статическая проверка кода
Тестирование
Отладка
Выпускать
Комплексная разработка программного обеспечения
Комплексное обслуживание программного обеспечения

Перспективы агента

Этап планирования
Этап требований
Этап разработки
Этап оценки
Роли агента
Механизм сотрудничества
Планирование
Память
Восприятие
Действие
Агентская платформа
Мультиагентная система
Сотрудничество человека и агента

Цитирование
Мейнтейнеры
Связаться с нами
Звездная история

Перспективы SE

SE_задачи

Требования к проектированию

[2024/05] MARE: Платформа многоагентной совместной работы для разработки требований. Джин и др. arXiv. [бумага]
[2024/04] Elicitron: Агентская система моделирования LLM для выявления требований к проектированию. Атаи и др. arXiv. [бумага]
[2024/01] SpecGen: автоматизированное создание формальных спецификаций программ с помощью больших языковых моделей. Ма и др. arXiv. [бумага] [репо]
[2023/10] Продвижение разработки требований посредством генеративного искусственного интеллекта: оценка роли LLM. Арора и др. arXiv. [бумага]

Генерация кода

[2024/11] Программирование на основе планирования: рабочий процесс программирования большой языковой модели Lei et al. arXiv [бумага]
[2024/11] Цепочка программирования: расширение возможностей больших языковых моделей для генерации геопространственного кода Hou et al. arXiv [бумага]
[2024/10] Песочница с несколькими языками программирования для студентов магистратуры Dou et al. arXiv [бумага]
[2024/10] SceneGenAgent: точная генерация промышленных сцен с помощью агента кодирования Xia et al. arXiv [бумага] [репозиторий]
[2024/10] MCCoder: Оптимизация управления движением с помощью генерации кода с помощью LLM и строгой проверки Li et al. arXiv [бумага] [репозиторий]
[2024/10] Agents4PLC: автоматизация генерации и проверки кода ПЛК с обратной связью в промышленных системах управления с использованием агентов на основе LLM Liu et al. arXiv [бумага] [репозиторий]
[2024/10] Повышение производительности параллельных программ посредством генерации кода на основе DSL с помощью оптимизаторов LLM Wei et al. arXiv. [бумага]
[2024/10] AgentBank: На пути к обобщенным агентам LLM посредством тонкой настройки более чем 50 000 траекторий взаимодействия Song et al. arXiv. [бумага]
[2024/10] RLEF: ОБЗОР КОДОВ LLMS В ОБРАТНОЙ СВЯЗИ ИСПОЛНЕНИЯ С ПОДКРЕПЛЕНИЕМ ОБУЧЕНИЯ Gehring et al. arXiv. [бумага]
[2024/10] Лучше, чем ваш учитель: агенты LLM, которые учатся на основе привилегированной обратной связи с искусственным интеллектом Чоудхури и др. arXiv. [бумага]
[2024/10] AMR-Evol: Эволюция адаптивного модульного ответа обеспечивает лучшую дистилляцию знаний для больших языковых моделей при генерации кода Luo et al. arXiv. [бумага] [репо]
[2024/10] RGD: Отладчик агентов на основе нескольких LLM с руководством по уточнению и генерации Jin et al. arXiv. [бумага]
[2024/09] AutoSafeCoder: многоагентная платформа для защиты генерации кода LLM посредством статического анализа и нечеткого тестирования Nunez et al. arXiv [бумага] [репозиторий]
[2024/09] Структура парного программирования для генерации кода посредством многопланового исследования и уточнения на основе обратной связи Zhang et al. arXiv [бумага] [репозиторий]
[2024/08] Просеивая мусор: использование обратной связи при выполнении для ранжирования сгенерированного кода-кандидата Sun et al. arXiv [бумага]
[2024/08] CODEXGRAPH: Объединение больших языковых моделей и репозиториев кода с помощью баз данных кодовых графов Liu et al. arXiv. [бумага] [репо]
[2024/07] ОТКРЫТЫЕ РУКИ: ОТКРЫТАЯ ПЛАТФОРМА ДЛЯ РАЗРАБОТЧИКОВ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ИИ КАК ОБЩИХ АГЕНТОВ Wang et al. arXiv [бумага] [репозиторий]
[2024/05] Генерация кода на уровне класса на основе естественного языка с использованием итеративного, расширенного инструментами рассуждения над репозиторием. Дешпанде и др. arXiv. [бумага]
[2024/05] MapCoder: многоагентная генерация кода для конкурентного решения задач. Ислам и др. ACL. [бумага] [репо]
[2024/05] AutoCoder: улучшение модели большого языка кода с помощью AIEV-INSTRUCT. Лей и др. arXiv. [бумага] [репо]
[2024/04] 3DGen: генерация доказуемо корректных анализаторов двоичного формата с помощью искусственного интеллекта . Фахури и др. arXiv [бумага]
[2024/04] Самоорганизующиеся агенты: многоагентная структура LLM для сверхкрупномасштабной генерации и оптимизации кода. Ишибаши и др. arXiv. [бумага] [репо]
[2024/03] AutoDev: Автоматизированная разработка на основе искусственного интеллекта . Туфано и др. arXiv [бумага]
[2024/03] CoCoST: автоматическая генерация сложного кода с онлайн-поиском и проверкой правильности. Он и др. arXiv. [бумага]
[2024/03] RAT: Поиск дополненных мыслей вызывает контекстно-зависимое мышление при генерации долгосрочных планов . Ван и др. arXiv. [бумага] [репо]
[2024/02] Действия с исполняемым кодом повышают эффективность агентов LLM. Ван и др. ИКМЛ. [бумага] [репо]
[2024/02] Все, что вам нужно, — это больше агентов. Ли и др. arXiv. [бумага]
[2024/02] Разработка через тестирование для генерации кода. Мэтьюз и др. arXiv. [бумага] [репо]
[2024/02] LDB: отладчик большой языковой модели посредством пошаговой проверки выполнения во время выполнения. Чжун и др. arXiv. [бумага] [репо]
[2024/01] CodeAgent: улучшение генерации кода с помощью интегрированных с инструментами агентских систем для решения реальных задач кодирования на уровне репозитория. Чжан и др. ACL. [бумага]
[2024/01] Обучение программистов LLM использованию инструментов автодополнения при генерации кода на уровне репозитория. Ван и др. arXiv. [бумага]
[2024/01] Генерация кода с помощью AlphaCodium: от оперативного проектирования к потоковому проектированию. Ридник и др. arXiv. [бумага] [репо]
[2023/12] AgentCoder: генерация кода на основе нескольких агентов с итеративным тестированием и оптимизацией. Хуанг и др. arXiv. [бумага]
[2023/12] LLM4TDD: Лучшие практики разработки через тестирование с использованием больших языковых моделей. Пия и др. arXiv. [бумага] [репо]
[2023/11] INTERVENOR: Расширение возможностей кодирования больших языковых моделей с помощью интерактивной цепочки восстановления. Ван и др. ACL. [бумага] [репо]
[2023/10] Динамическая сеть LLM-агентов: структура сотрудничества LLM-агентов с оптимизацией команды агентов. Лю и др. arXiv. [бумага] [репо]
[2023/10] Лемур: Гармонизация естественного языка и кода для языковых агентов. Сюй и др. ICLR. [бумага] [репо]
[2023/10] ClarifyGPT: Расширение возможностей генерации кода на основе LLM с разъяснением намерений. Му и др. arXiv. [бумага] [репо]
[2023/10] CODECHAIN: К МОДУЛЬНОЙ ГЕНЕРАЦИИ КОДА ЧЕРЕЗ ЦЕПОЧКУ САМОВОДРАЖЕНИЙ С РЕПРЕЗЕНТАТИВНЫМИ СУБМОДУЛЯМИ. Ле и др. ICLR. [бумага] [репо]
[2023/10] Поиск по дереву языковых агентов унифицирует рассуждения, действия и планирование в языковых моделях. Чжоу и др. ИКМЛ. [бумага] [репо]
[2023/09] МИНТ: ОЦЕНКА LLMS ПРИ МНОГООБОРОТНОМ ВЗАИМОДЕЙСТВИИ С ИНСТРУМЕНТАМИ И ЯЗЫКОВОЙ ОБРАТНОЙ СВЯЗЬЮ. Ван и др. ICLR. [бумага] [репо]
[2023/09] Понимание программирования на основе тестовых примеров в моделях большого языка для улучшения генерации кода. Тиан и др. arXiv. [бумага]
[2023/09] CodePlan: кодирование на уровне репозитория с использованием LLM и планирования. Байри и др. ФСЕ. [бумага] [репо]
[2023/09] От неправильного использования к мастерству: улучшение генерации кода с помощью цепочек искусственного интеллекта, основанных на знаниях. Рен и др. АСЭ. [бумага]
[2023/09] Parsel?: Алгоритмическое рассуждение с использованием языковых моделей путем составления декомпозиций. Зеликман и др. НейрИПС. [бумага] [репо]
[2023/08] AutoGen: включение приложений LLM нового поколения посредством межагентного диалога. Ву и др. arXiv. [бумага] [репо]
[2023/08] Gentopia: совместная платформа для программ LLM, дополненных инструментами. Сюй и др. ЭМНЛП. [бумага] [репо]
[2023/08] Потоки: строительные блоки рассуждения и совместной работы ИИ. Йозифоски и др. arXiv. [бумага] [репо]
[2023/08] CodeCoT: Устранение синтаксических ошибок кода в обосновании CoT для генерации кода. Хуанг и др. arXiv. [бумага]
[2023/06] SELFEVOLVE: Структура эволюции кода с помощью больших языковых моделей. Цзян и др. arXiv. [бумага]
[2023/06] InterCode: Стандартизация и сравнительный анализ интерактивного кодирования с обратной связью по выполнению. Ян и др. НейрИПС. [бумага] [репо]
[2023/06] ЯВЛЯЕТСЯ ЛИ САМОВОССТАНОВЛЕНИЕ серебряной ПУЛЯ ДЛЯ ГЕНЕРАЦИИ КОДА?. Олауссон и др. ICLR. [бумага] [репо]
[2023/05] ToolCoder: научите модели генерации кода использовать инструменты поиска API. Чжан и др. arXiv. [бумага]
[2023/05] Саморедактирование: редактор кода с учетом ошибок для генерации кода . Чжан и др. ACL. [бумага]
[2023/04] Обучение самоотладке больших языковых моделей. Чен и др. ICLR. [бумага]
[2023/04] Полностью автономное программирование с использованием больших языковых моделей. Ливенцев и др. ГЕККО. [бумага]
[2023/03] CAMEL: Коммуникативные агенты для исследования «разума» общества с большой языковой моделью. Ли и др. НейрИПС. [бумага] [репо]
[2023/03] Рефлексия: языковые агенты с обучением с вербальным подкреплением. Шинн и др. НейрИПС. [бумага] [репо]
[2023/03] SELF-REFINE: итеративное уточнение с самообратной связью. Мадаан и др. НейрИПС. [бумага] [репо]

Проверка

[2024/10] Автоматизированная генерация доказательств для кода Rust посредством саморазвития Chen et al. arXiv [бумага]
[2024/09] AutoVerus: Автоматизированное создание доказательств для кода ржавчины Ян и др. arXiv [бумага]

Статическая проверка кода

Статическое обнаружение ошибок

[2024/10] Использование точно настроенных языковых моделей для эффективного и точного аудита смарт-контрактов Wei et al. arXiv [бумага] [репозиторий]
[2024/10] LLM-SmartAudit: Расширенное обнаружение уязвимостей в смарт-контрактах Wei et al. arXiv. [бумага] [репо]
[2024/05] Статический анализ с помощью LLM для обнаружения уязвимостей безопасности. Ли и др. arXiv. [бумага]
[2024/05] PropertyGPT: формальная проверка смарт-контрактов на основе LLM посредством генерации свойств с расширенным поиском. Лю и др. arXiv. [бумага] [репо]
[2024/03] Многоцелевой консенсус посредством дискуссий LLM по обнаружению уязвимостей. Мао и др. QRS. [бумага]
[2024/03] Объединение агентов тонкой настройки и LLM для интуитивно понятного аудита смарт-контрактов с обоснованиями. Ма и др. arXiv. [бумага] [репо]
[2024/02] Когда анализ потока данных соответствует большим языковым моделям. Ван и др. arXiv. [бумага]
[2024/01] LLM4Vuln: унифицированная система оценки для разделения и улучшения обоснования уязвимостей LLM. Сан и др. arXiv. [бумага] [репо]
[2023/12] E&V: Побуждение больших языковых моделей к выполнению статического анализа посредством выполнения и проверки псевдокода. Хао и др. arXiv. [бумага]
[2023/10] Обнаружение уязвимостей смарт-контрактов на основе модели большого языка: новые перспективы. Ху и др. ТПС-ИСА. [бумага] [репо]
[2023/10] Статический анализ кода в эпоху искусственного интеллекта: углубленное исследование концепции, функций и потенциала интеллектуального анализа кода. Фан и др. arXiv. [бумага]
[2023/08] Улучшение статического анализа для практического обнаружения ошибок: подход, интегрированный с LLM. Ли и др. arXiv. [бумага] [репо]
[2023/03] ART: Автоматическое многоэтапное рассуждение и использование инструментов для больших языковых моделей. Паранджапе и др. arXiv. [бумага] [репо]

Обзор кода

[2024/10] Агент как судья: оценивайте агентов вместе с агентами Чжуге и др. arXiv. [бумага] [репо]
[2024/09] Разделяй и властвуй: автоматизация изменений кода с помощью локализации и редактирования Wang et al. АКМ Транс. Программное обеспечение англ. Методол. [бумага]
[2024/04] Анализ кода с использованием искусственного интеллекта и степенью магистратуры: первые результаты. Рашид и др. arXiv. [бумага]
[2024/02] CodeAgent: агенты совместной работы для разработки программного обеспечения. Тан и др. arXiv. [бумага] [репо]
[2023/10] Статический анализ кода в эпоху искусственного интеллекта: углубленное исследование концепции, функций и потенциала интеллектуального анализа кода. Фан и др. arXiv. [бумага]
[2023/09] CORE: Решение проблем качества кода с помощью LLM. Вадхва и др. ФСЕ. [бумага] [репо]

Тестирование

Модульное тестирование

[2024/11] ReAccept: автоматизированная совместная эволюция производственного и тестового кода на основе динамической проверки и больших языковых моделей Chi et al. arXiv [бумага] [репозиторий]
[2024/09] Символическое выполнение Python с генерацией кода на основе LLM Wang et al. arXiv [бумага]
[2024/06] Мокав: Дифференциальное тестирование на основе исполнения с LLM. Этемади и др. arXiv. [бумага] [репо]
[2024/04] Улучшение генерации тестов на основе LLM для труднодоступных отраслей посредством анализа программы. Ян и др. arXiv. [бумага]
[2024/03] AutoDev: Автоматизированная разработка на основе искусственного интеллекта . Туфано и др. arXiv [бумага]
[2024/03] COVERUP: создание тестов на основе LLM с учетом покрытия. Пиццорно и др. arXiv. [бумага] [репо]
[2023/08] Эффективная генерация тестов с использованием предварительно обученных моделей большого языка и мутационного тестирования. Дахель и др. Инф. Программное обеспечение Технол. . [бумага] [репо]
[2023/05] Ручных тестов больше нет? Оценка и улучшение ChatGPT для создания модульных тестов. Юань и др. arXiv. [бумага] [репо]
[2023/05] ChatUniTest: платформа для создания тестов на основе LLM. Чен и др. ФСЕ. [бумага] [репо]
[2023/02] Эмпирическая оценка использования больших языковых моделей для автоматизированной генерации модульных тестов. Шефер и др. IEEE Транс. Программное обеспечение Eng.. [бумага] [репозиторий]

Тестирование системы

[2024/11] Система с расширенными графами знаний кода для генерации нечетких драйверов на основе LLM Xu et al. arXiv. [бумага]
[2024/07] Автоматизированное тестирование мобильного графического интерфейса на основе визуального представления с использованием мультимодальной модели большого языка. Лю и др. arXiv. [бумага] [репо]
[2024/04] Агенты LLM могут автономно использовать однодневные уязвимости. Фанг и др. arXiv. [бумага]
[2024/02] Теперь вы можете использовать REST: автоматизированный вывод спецификаций и тестирование «черного ящика» RESTful API с большими языковыми моделями. Декроп и др. arXiv. [бумага] [репо]
[2024/01] XUAT-Copilot: многоагентная система совместной работы для автоматизированного приемочного тестирования пользователей с большой языковой моделью. Ван и др. arXiv. [бумага]
[2024/01] KernelGPT: улучшенное фаззинг ядра с помощью больших языковых моделей. Ян и др. arXiv. [бумага]
[2023/11] Целенаправленное тестирование мобильного графического интерфейса пользователя с использованием автономных агентов модели большого языка . Юн и др. ИКСТ. [бумага] [репо]
[2023/10] Сделайте LLM экспертом по тестированию: привнесение человеческого взаимодействия в тестирование мобильного графического интерфейса с помощью решений, учитывающих функциональность. Лю и др. МСЭ. [бумага]
[2023/10] AXNav: воспроизведение тестов доступности с естественного языка. Таеб и др. ЧИ. [бумага]
[2023/10] Фаззз компилятора «белого ящика» на основе больших языковых моделей. Ян и др. arXiv. [бумага] [репо]
[2023/10] Тестирование ограничений: генерация необычных текстовых входных данных для обнаружения сбоев мобильных приложений с помощью большой языковой модели. Лю и др. МСЭ. [бумага] [репо]
[2023/08] PENTESTGPT: инструмент автоматического тестирования на проникновение на базе LLM. Дэн и др. arXiv. [бумага] [репо]
[2023/08] Fuzz4All: универсальный фаззинг с использованием больших языковых моделей. Ся и др. МСЭ. [бумага] [репо]
[2023/07] Изолирование ошибок компилятора путем создания эффективных программ-свидетелей с использованием больших языковых моделей. Ту и др. IEEE Транс. Программное обеспечение англ. [бумага] [репо]
[2023/06] Все, что вам нужно, — это подсказки: автоматическое воспроизведение ошибок Android с использованием больших языковых моделей. Фэн и др. МСЭ. [бумага] [репо]

Отладка

Локализация неисправности

[2024/11] FlexFL: гибкая и эффективная локализация неисправностей с помощью моделей большого языка с открытым исходным кодом Xu et al. arXiv [бумага]
[2024/09] Улучшение локализации ошибок посредством упорядоченного анализа кода с помощью агентов LLM и саморефлексии Rafi et al. arXiv [бумага]
[2024/03] AGENTFL: Масштабирование локализации разломов на основе LLM в контексте уровня проекта. Цинь и др. arXiv. [бумага]
[2023/10] RCAgent: анализ первопричин облака автономными агентами с помощью расширенных инструментальных моделей большого языка. Ван и др. arXiv. [бумага]
[2023/08] Количественная и качественная оценка объяснимой локализации разломов на основе LLM . Канг и др. ФСЕ. [бумага]

Восстановление программы

[2024/07] ОТКРЫТЫЕ РУКИ: ОТКРЫТАЯ ПЛАТФОРМА ДЛЯ РАЗРАБОТЧИКОВ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ИИ КАК ОБЩИХ АГЕНТОВ Wang et al. arXiv [бумага] [репозиторий]
[2024/10] Семантический поиск для эффективного восстановления программ с помощью больших языковых моделей Thanh et al. arXiv [бумага]
[2024/09] Нейросимволическое восстановление тестовой неустойчивости . Чен и др. ИССТА. [бумага]
[2024/04] Как далеко мы можем зайти с практическим восстановлением программ на функциональном уровне? Сян и др. arXiv. [бумага] [репо]
[2024/03] RepairAgent: автономный агент на базе LLM для восстановления программ. Бузениа и др. arXiv. [бумага]
[2024/03] ACFIX: Руководство для LLM с использованием общих практик RBAC для контекстно-зависимого устранения уязвимостей контроля доступа в смарт-контрактах. Чжан и др. arXiv. [бумага]
[2024/02] CigaR: Экономически эффективный ремонт программы с помощью LLM. Хидвеги и др. arXiv. [бумага] [репо]
[2023/04] Объяснимая автоматическая отладка с помощью научной отладки на основе модели большого языка. Канг и др. arXiv. [бумага]
[2023/04] Продолжайте общение: исправьте 162 из 337 ошибок по цене 0,42 доллара США за каждую с помощью ChatGPT. Ся и др. arXiv. [бумага]
[2023/01] Диалоговый автоматизированный ремонт программы. Ся и др. arXiv. [бумага]

Единая отладка

[2024/04] Унифицированный подход к отладке с помощью многоагентной синергии на основе LLM. Ли и др. arXiv. [бумага] [репо]
[2024/02] LDB: отладчик большой языковой модели посредством пошаговой проверки выполнения во время выполнения. Чжун и др. arXiv. [бумага] [репо]

Выпускать

[2024/08] GoNoGo: эффективная многоагентная система на основе LLM для оптимизации принятия решений о выпуске автомобильного программного обеспечения Khoee et al. arXiv [бумага]

Комплексная разработка программного обеспечения

[2024/09] Создание пары кода Java с ChatGPT Zhao et al. Теоретическая информатика [документ]
[2024/07] Расширение возможностей гибкой генеративной разработки программного обеспечения посредством совместной работы человека и искусственного интеллекта Чжан и др. ТОСЕМ [бумага] [репозиторий]
[2024/06] Эксперименты с разработкой мультиагентного программного обеспечения: на пути к единой платформе Сами и др. arXiv. [бумага]
[2024/06] Масштабирование многоагентного сотрудничества на основе моделей большого языка Qian et al. arXiv. [бумага] [репо]
[2024/06] Разработка мультиагентного программного обеспечения посредством межкомандного сотрудничества. Ду и др. arXiv. [бумага] [репо]
[2024/06] AgileCoder: динамические агенты для совместной разработки программного обеспечения на основе гибкой методологии. Нгуен и др. arXiv. [бумага] [репо]
[2024/05] Итеративное усовершенствование опыта агентов-разработчиков программного обеспечения. Цянь и др. arXiv. [бумага]
[2024/03] Когда генерация кода на основе LLM соответствует процессу разработки программного обеспечения. Лин и др. arXiv. [бумага] [репо]
[2024/03] CodeS: естественный язык для репозитория кода с помощью многоуровневого эскиза. Зан и др. arXiv. [бумага] [репо]
[2024/02] CodePori: крупномасштабная модель автономной разработки программного обеспечения с использованием мультиагентов. Рашид и др. arXiv. [бумага]
[2024/01] Экспериментируем с новой практикой программирования с помощью LLM. Чжан и др. arXiv. [бумага] [репо]
[2024/01] LLM4PLC: Использование больших языковых моделей для проверяемого программирования ПЛК в промышленных системах управления. Факих и др. МСЭ. [бумага] [репо]
[2023/12] Экспериментальное совместное обучение агентов, разрабатывающих программное обеспечение. Цянь и др. ACL. [бумага] [репо]
[2023/11] Автономные агенты в разработке программного обеспечения: концептуальный документ Rasheed et al. arXiv. [бумага]
[2023/09] AutoAgents: платформа для автоматического создания агентов. Чен и др. arXiv. [бумага] [репо]
[2023/08] AgentVerse: содействие многоагентному сотрудничеству и изучение возникающих ситуаций. Чен и др. ICLR. [бумага] [репо]
[2023/08] METAGPT: МЕТАПРОГРАММИРОВАНИЕ ДЛЯ РАМКИ МНОГОАГЕНТНОЙ СОВМЕСТНОЙ СОВМЕСТНОСТИ. Хонг и др. ICLR. [бумага] [репо]
[2023/07] Коммуникативные агенты для разработки программного обеспечения. Цянь и др. ACL. [бумага] [репо]
[2023/06] МУЛЬТИАГЕНТСКОЕ СОТРУДНИЧЕСТВО: ИСПОЛЬЗУЙТЕ СИЛУ ИНТЕЛЛЕКТУАЛЬНЫХ АГЕНТОВ LLM. Талебирад и др. arXiv. [бумага]
[2023/06] Prompt Sapper: Инфраструктура разработки программного обеспечения на базе LLM для сервисов AI-Native. Син и др. arXiv. [бумага]
[2023/04] Самостоятельная генерация кода через ChatGPT. Донг и др. arXiv. [бумага] [репо]
[2023/04] LLM с низким кодом: визуальное программирование поверх LLM. Цай и др. arXiv. [бумага] [репо]

Комплексное обслуживание программного обеспечения

[2024/11] Магистр права как непрерывное обучение: улучшение воспроизведения дефектного кода при проблемах с программным обеспечением Lin et al. arXiv [бумага]
[2024/11] Агенты по разработке программного обеспечения с участием человека Takerngsaksiri et al. arXiv [бумага]
[2024/11] Lingma SWE-GPT: открытая языковая модель, ориентированная на процесс разработки, для автоматизированного улучшения программного обеспечения Ma et al. arXiv [бумага] [репозиторий]
[2024/10] RepoGraph: Улучшение разработки программного обеспечения искусственного интеллекта с помощью графа кода на уровне репозитория Ouyang et al. arXiv [бумага] [репозиторий]
[2024/09] Агент MarsCode: автоматическое исправление ошибок с помощью искусственного интеллекта Liu et al. arXiv. [бумага]
[2024/08] CODEXGRAPH: Объединение больших языковых моделей и репозиториев кода с помощью баз данных кодовых графов Liu et al. arXiv. [бумага] [репо]
[2024/08] РАЗНООБРАЗИЕ УСИЛИВАЕТ ИНТЕЛЛЕКТ: ИНТЕГРАЦИЯ ОПЫТА РАЗРАБОТЧИКОВ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ Zhang et al. arXiv. [бумага]
[2024/08] SpecRover: Извлечение намерений кода с помощью LLM Ruan et al. arXiv. [бумага] [репо]
[2024/07] ОТКРЫТЫЕ РУКИ: ОТКРЫТАЯ ПЛАТФОРМА ДЛЯ РАЗРАБОТЧИКОВ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ИИ КАК ОБЩИХ АГЕНТОВ Wang et al. arXiv [бумага] [репозиторий]
[2024/07] Без агентов: демистификация агентов разработки программного обеспечения на основе LLM. Ся и др. arXiv. [бумага] [репо]
[2024/06] Как понять весь репозиторий программного обеспечения?. Ма и др. arXiv. [бумага] [репо]
[2024/06] КОДЕР: РЕШЕНИЕ ПРОБЛЕМ С ПОМОЩЬЮ МУЛЬТИАГЕНТНЫХ И ГРАФОВ ЗАДАЧ. Чен и др. arXiv. [бумага] [репо]
[2024/06] MASAI: Модульная архитектура для разработки программного обеспечения ИИ-агентов. Арора и др. arXiv. [бумага]
[2024/05] SWE-AGENT: ИНТЕРФЕЙСЫ АГЕНТА И КОМПЬЮТЕРА ОБЕСПЕЧИВАЮТ АВТОМАТИЗИРОВАННУЮ РАЗРАБОТКУ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ. Ян и др. arXiv. [бумага] [репо]
[2024/04] AutoCodeRover: улучшение автономной программы. Чжан и др. ИССТА. [бумага] [репо]
[2024/03] MAGIS: Многоагентная платформа на основе LLM для решения проблем GitHub. Тао и др. arXiv. [бумага]

Контрольный показатель

[2024/10] SWE-Bench+: Тест расширенного кодирования для студентов LLM Aleithan et al. arXiv. [бумага]
[2024/10] Мультимодальный SWE-bench: распространяются ли системы искусственного интеллекта на области визуального программного обеспечения? Ян и др. arXiv. [бумага] [репо]
[2024/08] SWE-bench-java: тест GitHub по устранению проблем для Java Zan et al. arXiv [бумага] [репозиторий]
[2024/07] Без агентов: демистификация агентов разработки программного обеспечения на основе LLM. Ся и др. arXiv. [бумага] [репо]
[2023/10] Swe-bench: Могут ли языковые модели решить реальные проблемы с GitHub? Хименес и др. ICLR [бумага] [репозиторий]

Перспективы агента

Агентская платформа

Планирование

Однооборотное планирование

[2024/06] AgileCoder: динамические агенты для совместной разработки программного обеспечения на основе гибкой методологии. Нгуен и др. arXiv. [бумага] [репо]
[2024/06] Разработка мультиагентного программного обеспечения посредством межкомандного сотрудничества. Ду и др. arXiv. [бумага] [репо]
[2024/05] MapCoder: многоагентная генерация кода для конкурентного решения задач. Ислам и др. ACL. [бумага] [репо]
[2024/03] MAGIS: Многоагентная платформа на основе LLM для решения проблем GitHub. Тао и др. arXiv. [бумага]
[2024/03] CodeS: естественный язык для репозитория кода с помощью многоуровневого эскиза. Зан и др. arXiv. [бумага] [репо]
[2024/03] CoCoST: автоматическая генерация сложного кода с онлайн-поиском и проверкой правильности. Он и др. arXiv. [бумага]
[2024/02] CodePori: крупномасштабная модель автономной разработки программного обеспечения с использованием мультиагентов. Рашид и др. arXiv. [бумага]
[2024/01] CodeAgent: улучшение генерации кода с помощью интегрированных с инструментами агентских систем для решения реальных задач кодирования на уровне репозитория. Чжан и др. ACL. [бумага]
[2024/01] LLM4PLC: Использование больших языковых моделей для проверяемого программирования ПЛК в промышленных системах управления. Факих и др. МСЭ. [бумага] [репо]
[2024/01] Экспериментируем с новой практикой программирования с помощью LLM. Чжан и др. arXiv. [бумага] [репо]
[2023/11] Автономные агенты в разработке программного обеспечения: концептуальный документ Rasheed et al. arXiv. [бумага]
[2023/10] Статический анализ кода в эпоху искусственного интеллекта: углубленное исследование концепции, функций и потенциала интеллектуального анализа кода. Фан и др. arXiv. [бумага]
[2023/09] Parsel?: Алгоритмическое рассуждение с использованием языковых моделей путем составления декомпозиций. Зеликман и др. НейрИПС. [бумага] [репо]
[2023/08] PENTESTGPT: инструмент автоматического тестирования на проникновение на базе LLM. Дэн и др. arXiv. [бумага] [репо]
[2023/08] Потоки: строительные блоки рассуждения и совместной работы ИИ. Йозифоски и др. arXiv. [бумага] [репо]
[2023/08] METAGPT: МЕТАПРОГРАММИРОВАНИЕ ДЛЯ РАМКИ МНОГОАГЕНТНОЙ СОВМЕСТНОЙ СОВМЕСТНОСТИ. Хонг и др. ICLR. [бумага] [репо]
[2023/07] Коммуникативные агенты для разработки программного обеспечения. Цянь и др. ACL. [бумага] [репо]
[2023/04] Самостоятельная генерация кода через ChatGPT. Донг и др. arXiv. [бумага] [репо]
[2023/04] LLM с низким кодом: визуальное программирование поверх LLM. Цай и др. arXiv. [бумага] [репо]

Многооборотное планирование

[2024/03] RAT: Поиск дополненных мыслей вызывает контекстно-зависимое мышление при генерации долгосрочных планов . Ван и др. arXiv. [бумага] [репо]

Реагировать-подобно

[2024/06] MASAI: Модульная архитектура для разработки программного обеспечения ИИ-агентов. Арора и др. arXiv. [бумага]
[2024/02] Действия с исполняемым кодом повышают эффективность агентов LLM. Ван и др. ИКМЛ. [бумага] [репо]
[2024/01] CodeAgent: улучшение генерации кода с помощью интегрированных с инструментами агентских систем для решения реальных задач кодирования на уровне репозитория. Чжан и др. ACL. [бумага]
[2024/01] XUAT-Copilot: многоагентная система совместной работы для автоматизированного приемочного тестирования пользователей с большой языковой моделью. Ван и др. arXiv. [бумага]
[2023/11] Целенаправленное тестирование мобильного графического интерфейса пользователя с использованием автономных агентов модели большого языка . Юн и др. ИКСТ. [бумага] [репо]
[2023/10] RCAgent: анализ первопричин облака автономными агентами с помощью расширенных инструментальных моделей большого языка. Ван и др. arXiv. [бумага]
[2023/10] Поиск по дереву языковых агентов унифицирует рассуждения, действия и планирование в языковых моделях. Чжоу и др. ИКМЛ. [бумага] [репо]
[2023/10] AXNav: воспроизведение тестов доступности с естественного языка. Таеб и др. ЧИ. [бумага]
[2023/09] CodePlan: кодирование на уровне репозитория с использованием LLM и планирования. Байри и др. ФСЕ. [бумага] [репо]

Многослойный

[2024/04] Самоорганизующиеся агенты: многоагентная структура LLM для сверхкрупномасштабной генерации и оптимизации кода. Ишибаши и др. arXiv. [бумага] [репо]

Память

Долговременная память

[2024/06] Масштабирование многоагентного сотрудничества на основе моделей большого языка Qian et al. arXiv. [бумага] [репо]
[2024/06] Разработка мультиагентного программного обеспечения посредством межкомандного сотрудничества. Ду и др. arXiv. [бумага] [репо]
[2024/05] Итеративное усовершенствование опыта агентов-разработчиков программного обеспечения. Цянь и др. arXiv. [бумага]
[2023/12] Экспериментальное совместное обучение агентов, разрабатывающих программное обеспечение. Цянь и др. ACL. [бумага] [репо]
[2023/11] Целенаправленное тестирование мобильного графического интерфейса пользователя с использованием автономных агентов модели большого языка . Юн и др. ИКСТ. [бумага] [репо]
[2023/09] AutoAgents: платформа для автоматического создания агентов. Чен и др. arXiv. [бумага] [репо]
[2023/08] METAGPT: МЕТАПРОГРАММИРОВАНИЕ ДЛЯ РАМКИ МНОГОАГЕНТНОЙ СОВМЕСТНОЙ СОВМЕСТНОСТИ. Хонг и др. ICLR. [бумага] [репо]
[2023/07] Коммуникативные агенты для разработки программного обеспечения. Цянь и др. ACL. [бумага] [репо]
[2023/03] Рефлексия: языковые агенты с обучением с вербальным подкреплением. Шинн и др. НейрИПС. [бумага] [репо]

Кратковременная память

[2024/07] Автоматизированное тестирование мобильного графического интерфейса на основе визуального представления с использованием мультимодальной модели большого языка. Лю и др. arXiv. [бумага] [репо]
[2024/06] Масштабирование многоагентного сотрудничества на основе моделей большого языка Qian et al. arXiv. [бумага] [репо]
[2024/06] Разработка мультиагентного программного обеспечения посредством межкомандного сотрудничества. Ду и др. arXiv. [бумага] [репо]
[2024/06] AgileCoder: динамические агенты для совместной разработки программного обеспечения на основе гибкой методологии. Нгуен и др. arXiv. [бумага] [репо]
[2024/04] Самоорганизующиеся агенты: многоагентная структура LLM для сверхкрупномасштабной генерации и оптимизации кода. Ишибаши и др. arXiv. [бумага] [репо]
[2024/03] MAGIS: Многоагентная платформа на основе LLM для решения проблем GitHub. Тао и др. arXiv. [бумага]
[2024/01] XUAT-Copilot: многоагентная система совместной работы для автоматизированного приемочного тестирования пользователей с большой языковой моделью. Ван и др. arXiv. [бумага]
[2023/12] E&V: Побуждение больших языковых моделей к выполнению статического анализа посредством выполнения и проверки псевдокода. Хао и др. arXiv. [бумага]
[2023/11] Целенаправленное тестирование мобильного графического интерфейса пользователя с использованием автономных агентов модели большого языка . Юн и др. ИКСТ. [бумага] [репо]
[2023/10] RCAgent: анализ первопричин облака автономными агентами с помощью расширенных инструментальных моделей большого языка. Ван и др. arXiv. [бумага]
[2023/10] Статический анализ кода в эпоху искусственного интеллекта: углубленное исследование концепции, функций и потенциала интеллектуального анализа кода. Фан и др. arXiv. [бумага]
[2023/10] Сделайте LLM экспертом по тестированию: привнесение человеческого взаимодействия в тестирование мобильного графического интерфейса с помощью решений, учитывающих функциональность. Лю и др. МСЭ. [бумага]
[2023/09] CodePlan: кодирование на уровне репозитория с использованием LLM и планирования. Байри и др. ФСЕ. [бумага] [репо]
[2023/09] AutoAgents: платформа для автоматического создания агентов. Чен и др. arXiv. [бумага] [репо]
[2023/08] METAGPT: МЕТАПРОГРАММИРОВАНИЕ ДЛЯ РАМКИ МНОГОАГЕНТНОЙ СОВМЕСТНОЙ СОВМЕСТНОСТИ. Хонг и др. ICLR. [бумага] [репо]
[2023/07] Коммуникативные агенты для разработки программного обеспечения. Цянь и др. ACL. [бумага] [репо]
[2023/03] Рефлексия: языковые агенты с обучением с вербальным подкреплением. Шинн и др. НейрИПС. [бумага] [репо]

Общая память: особый вид кратковременной памяти

[2024/06] AgileCoder: динамические агенты для совместной разработки программного обеспечения на основе гибкой методологии. Нгуен и др. arXiv. [бумага] [репо]
[2024/05] MARE: Платформа многоагентной совместной работы для разработки требований. Джин и др. arXiv. [бумага]
[2024/03] Когда генерация кода на основе LLM соответствует процессу разработки программного обеспечения. Лин и др. arXiv. [бумага] [репо]
[2024/03] AGENTFL: Масштабирование локализации разломов на основе LLM в контексте уровня проекта. Цинь и др. arXiv. [бумага]
[2023/08] METAGPT: МЕТАПРОГРАММИРОВАНИЕ ДЛЯ РАМКИ МНОГОАГЕНТНОЙ СОВМЕСТНОЙ СОВМЕСТНОСТИ. Хонг и др. ICLR. [бумага] [репо]
[2023/04] Самостоятельная генерация кода через ChatGPT. Донг и др. arXiv. [бумага] [репо]

Восприятие

Визуальный ввод

[2024/10] Мультимодальный SWE-bench: распространяются ли системы искусственного интеллекта на области визуального программного обеспечения? Ян и др. arXiv. [бумага] [репо]
[2024/07] Автоматизированное тестирование мобильного графического интерфейса на основе визуального представления с использованием мультимодальной модели большого языка. Лю и др. arXiv. [бумага] [репо]
[2024/06] Эксперименты с разработкой мультиагентного программного обеспечения: на пути к единой платформе Сами и др. arXiv. [бумага]
[2024/01] XUAT-Copilot: многоагентная система совместной работы для автоматизированного приемочного тестирования пользователей с большой языковой моделью. Ван и др. arXiv. [бумага]
[2023/10] AXNav: воспроизведение тестов доступности с естественного языка. Таеб и др. ЧИ. [бумага]
[2023/10] Тестирование ограничений: генерация необычных текстовых входных данных для обнаружения сбоев мобильных приложений с помощью большой языковой модели. Лю и др. МСЭ. [бумага] [репо]
[2023/08] METAGPT: МЕТАПРОГРАММИРОВАНИЕ ДЛЯ РАМКИ МНОГОАГЕНТНОЙ СОВМЕСТНОЙ СОВМЕСТНОСТИ. Хонг и др. ICLR. [бумага] [репо]

Действие

Инструменты поиска

[2024/05] Генерация кода на уровне класса на основе естественного языка с использованием итеративного, расширенного инструментами рассуждения над репозиторием. Дешпанде и др. arXiv. [бумага]
[2024/04] Агенты LLM могут автономно использовать однодневные уязвимости. Фанг и др. arXiv. [бумага]
[2024/03] AutoDev: Автоматизированная разработка на основе искусственного интеллекта . Туфано и др. arXiv [бумага]
[2024/03] RepairAgent: автономный агент на базе LLM для восстановления программ. Бузениа и др. arXiv. [бумага]
[2024/03] CoCoST: автоматическая генерация сложного кода с онлайн-поиском и проверкой правильности. Он и др. arXiv. [бумага]
[2024/03] RAT: Поиск дополненных мыслей вызывает контекстно-зависимое мышление при генерации долгосрочных планов . Ван и др. arXiv. [бумага] [репо]
[2024/02] CodePori: крупномасштабная модель автономной разработки программного обеспечения с использованием мультиагентов. Рашид и др. arXiv. [бумага]
[2024/01] LLM4Vuln: унифицированная система оценки для разделения и улучшения обоснования уязвимостей LLM. Сан и др. arXiv. [бумага] [репо]
[2024/01] CodeAgent: улучшение генерации кода с помощью интегрированных с инструментами агентских систем для решения реальных задач кодирования на уровне репозитория. Чжан и др. ACL. [бумага]
[2023/12] E&V: Побуждение больших языковых моделей к выполнению статического анализа посредством выполнения и проверки псевдокода. Хао и др. arXiv. [бумага]
[2023/12] Экспериментальное совместное обучение агентов, разрабатывающих программное обеспечение. Цянь и др. ACL. [бумага] [репо]
[2023/11] Целенаправленное тестирование мобильного графического интерфейса пользователя с использованием автономных агентов модели большого языка . Юн и др. ИКСТ. [бумага] [репо]
[2023/10] Лемур: Гармонизация естественного языка и кода для языковых агентов. Сюй и др. ICLR. [бумага] [репо]
[2023/10] RCAgent: анализ первопричин облака автономными агентами с помощью расширенных инструментальных моделей большого языка. Ван и др. arXiv. [бумага]
[2023/10] Статический анализ кода в эпоху искусственного интеллекта: углубленное исследование концепции, функций и потенциала интеллектуального анализа кода. Фан и др. arXiv. [бумага]
[2023/08] METAGPT: МЕТАПРОГРАММИРОВАНИЕ ДЛЯ РАМКИ МНОГОАГЕНТНОЙ СОВМЕСТНОЙ СОВМЕСТНОСТИ. Хонг и др. ICLR. [бумага] [репо]
[2023/08] PENTESTGPT: инструмент автоматического тестирования на проникновение на базе LLM. Дэн и др. arXiv. [бумага] [репо]
[2023/08] AgentVerse: содействие многоагентному сотрудничеству и изучение возникающих ситуаций. Чен и др. ICLR. [бумага] [репо]
[2023/08] Gentopia: совместная платформа для программ LLM, дополненных инструментами. Сюй и др. ЭМНЛП. [бумага] [репо]
[2023/08] AutoGen: включение приложений LLM нового поколения посредством межагентного диалога. Ву и др. arXiv. [бумага] [репо]
[2023/05] ToolCoder: научите модели генерации кода использовать инструменты поиска API. Чжан и др. arXiv. [бумага]
[2023/03] ART: Автоматическое многоэтапное рассуждение и использование инструментов для больших языковых моделей. Паранджапе и др. arXiv. [бумага] [репо]

Операции с файлами

[2024/08] SpecRover: Извлечение намерений кода с помощью LLM Ruan et al. arXiv. [бумага] [репо]
[2024/06] MASAI: Модульная архитектура для разработки программного обеспечения ИИ-агентов. Арора и др. arXiv. [бумага]
[2024/05] Статический анализ с помощью LLM для обнаружения уязвимостей безопасности. Ли и др. arXiv. [бумага]
[2024/05] SWE-AGENT: ИНТЕРФЕЙСЫ АГЕНТА И КОМПЬЮТЕРА ОБЕСПЕЧИВАЮТ АВТОМАТИЗИРОВАННУЮ РАЗРАБОТКУ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ. Ян и др. arXiv. [бумага] [репо]
[2024/04] Агенты LLM могут автономно использовать однодневные уязвимости. Фанг и др. arXiv. [бумага]
[2024/03] RepairAgent: автономный агент на базе LLM для восстановления программ. Бузениа и др. arXiv. [бумага]
[2024/03] AutoDev: Автоматизированная разработка на основе искусственного интеллекта . Туфано и др. arXiv [бумага]
[2023/04] Объяснимая автоматическая отладка с помощью научной отладки на основе модели большого языка. Канг и др. arXiv. [бумага]

Операции с графическим интерфейсом

[2024/07] Автоматизированное тестирование мобильного графического интерфейса на основе визуального представления с использованием мультимодальной модели большого языка. Лю и др. arXiv. [бумага] [репо]
[2024/01] XUAT-Copilot: многоагентная система совместной работы для автоматизированного приемочного тестирования пользователей с большой языковой моделью. Ван и др. arXiv. [бумага]
[2023/10] Сделайте LLM экспертом по тестированию: привнесение человеческого взаимодействия в тестирование мобильного графического интерфейса с помощью решений, учитывающих функциональность. Лю и др. МСЭ. [бумага]
[2023/10] AXNav: воспроизведение тестов доступности с естественного языка. Таеб и др. ЧИ. [бумага]
[2023/10] Тестирование ограничений: генерация необычных текстовых входных данных для обнаружения сбоев мобильных приложений с помощью большой языковой модели. Лю и др. МСЭ. [бумага] [репо]
[2023/06] Все, что вам нужно, — это подсказки: автоматическое воспроизведение ошибок Android с использованием больших языковых моделей. Фэн и др. МСЭ. [бумага] [репо]

Статический анализ программы

[2024/06] Разработка мультиагентного программного обеспечения посредством межкомандного сотрудничества. Ду и др. arXiv. [бумага] [репо]
[2024/06] AgileCoder: динамические агенты для совместной разработки программного обеспечения на основе гибкой методологии. Нгуен и др. arXiv. [бумага] [репо]
[2024/06] MASAI: Модульная архитектура для разработки программного обеспечения ИИ-агентов. Арора и др. arXiv. [бумага]
[2024/05] Генерация кода на уровне класса на основе естественного языка с использованием итеративного, расширенного инструментами рассуждения над репозиторием. Дешпанде и др. arXiv. [бумага]
[2024/05] Статический анализ с помощью LLM для обнаружения уязвимостей безопасности. Ли и др. arXiv. [бумага]
[2024/04] AutoCodeRover: улучшение автономной программы. Чжан и др. ИССТА. [бумага] [репо]
[2024/04] Улучшение генерации тестов на основе LLM для труднодоступных отраслей посредством анализа программы. Ян и др. arXiv. [бумага]
[2024/04] 3DGen: генерация доказуемо корректных анализаторов двоичного формата с помощью искусственного интеллекта . Фахури и др. arXiv [бумага]
[2024/03] AutoDev: Автоматизированная разработка на основе искусственного интеллекта . Туфано и др. arXiv [бумага]
[2024/03] RepairAgent: автономный агент на базе LLM для восстановления программ. Бузениа и др. arXiv. [бумага]
[2024/03] COVERUP: создание тестов на основе LLM с учетом покрытия. Пиццорно и др. arXiv. [бумага] [репо]
[2024/03] ACFIX: Руководство для LLM с использованием общих практик RBAC для контекстно-зависимого устранения уязвимостей контроля доступа в смарт-контрактах. Чжан и др. arXiv. [бумага]
[2024/03] AGENTFL: Масштабирование локализации разломов на основе LLM в контексте уровня проекта. Цинь и др. arXiv. [бумага]
[2024/02] Когда анализ потока данных соответствует большим языковым моделям. Ван и др. arXiv. [бумага]
[2024/02] LDB: отладчик большой языковой модели посредством пошаговой проверки выполнения во время выполнения. Чжун и др. arXiv. [бумага] [репо]
[2024/01] Обучение программистов LLM использованию инструментов автодополнения при генерации кода на уровне репозитория. Ван и др. arXiv. [бумага]
[2024/01] CodeAgent: улучшение генерации кода с помощью интегрированных с инструментами агентских систем для решения реальных задач кодирования на уровне репозитория. Чжан и др. ACL. [бумага]
[2024/01] LLM4PLC: Использование больших языковых моделей для проверяемого программирования ПЛК в промышленных системах управления. Факих и др. МСЭ. [бумага] [репо]
[2023/12] E&V: Побуждение больших языковых моделей к выполнению статического анализа посредством выполнения и проверки псевдокода. Хао и др. arXiv. [бумага]
[2023/09] CodePlan: кодирование на уровне репозитория с использованием LLM и планирования. Байри и др. ФСЕ. [бумага] [репо]
[2023/08] CodeCoT: Устранение синтаксических ошибок кода в обосновании CoT для генерации кода. Хуанг и др. arXiv. [бумага]
[2023/07] Изолирование ошибок компилятора путем создания эффективных программ-свидетелей с использованием больших языковых моделей. Ту и др. IEEE Транс. Программное обеспечение Eng.. [бумага] [репозиторий]
[2023/06] Все, что вам нужно, — это подсказки: автоматическое воспроизведение ошибок Android с использованием больших языковых моделей. Фэн и др. МСЭ. [бумага] [репо]

Динамический анализ

[2024/04] Улучшение генерации тестов на основе LLM для труднодоступных отраслей посредством анализа программы. Ян и др. arXiv. [бумага]
[2024/03] COVERUP: создание тестов на основе LLM с учетом покрытия. Пиццорно и др. arXiv. [бумага] [репо]
[2024/03] AGENTFL: Масштабирование локализации разломов на основе LLM в контексте уровня проекта. Цинь и др. arXiv. [бумага]
[2024/02] LDB: отладчик большой языковой модели посредством пошаговой проверки выполнения во время выполнения. Чжун и др. arXiv. [бумага] [репо]
[2023/07] Изолирование ошибок компилятора путем создания эффективных программ-свидетелей с использованием больших языковых моделей. Ту и др. IEEE Транс. Программное обеспечение Eng.. [бумага] [репозиторий]
[2023/04] Объяснимая автоматическая отладка с помощью научной отладки на основе модели большого языка. Канг и др. arXiv. [бумага]

Инструменты тестирования

[2024/09] Нейросимволическое восстановление тестовой неустойчивости . Чен и др. ИССТА. [бумага]
[2024/08] SpecRover: Извлечение намерений кода с помощью LLM Ruan et al. arXiv. [бумага] [репо]
[2024/06] AgileCoder: динамические агенты для совместной разработки программного обеспечения на основе гибкой методологии. Нгуен и др. arXiv. [бумага] [репо]
[2024/06] MASAI: Модульная архитектура для разработки программного обеспечения ИИ-агентов. Арора и др. arXiv. [бумага]
[2024/05] AutoCoder: улучшение модели большого языка кода с помощью AIEV-INSTRUCT. Лей и др. arXiv. [бумага] [репо]
[2024/05] MapCoder: многоагентная генерация кода для конкурентного решения задач. Ислам и др. ACL. [бумага] [репо]
[2024/04] Самоорганизующиеся агенты: многоагентная структура LLM для сверхкрупномасштабной генерации и оптимизации кода. Ишибаши и др. arXiv. [бумага] [репо]
[2024/04] Унифицированный подход к отладке с помощью многоагентной синергии на основе LLM. Ли и др. arXiv. [бумага] [репо]
[2024/04] Агенты LLM могут автономно использовать однодневные уязвимости. Фанг и др. arXiv. [бумага]
[2024/04] Улучшение генерации тестов на основе LLM для труднодоступных отраслей посредством анализа программы. Ян и др. arXiv. [бумага]
[2024/04] 3DGen: генерация доказуемо корректных анализаторов двоичного формата с помощью искусственного интеллекта . Фахури и др. arXiv [бумага]
[2024/04] AutoCodeRover: улучшение автономной программы. Чжан и др. ИССТА. [бумага] [репо]
[2024/03] AutoDev: Автоматизированная разработка на основе искусственного интеллекта . Туфано и др. arXiv [бумага]
[2024/03] Когда генерация кода на основе LLM соответствует процессу разработки программного обеспечения. Лин и др. arXiv. [бумага] [репо]
[2024/03] RepairAgent: автономный агент на базе LLM для восстановления программ. Бузениа и др. arXiv. [бумага]
[2024/03] CoCoST: автоматическая генерация сложного кода с онлайн-поиском и проверкой правильности. Он и др. arXiv. [бумага]
[2024/02] Действия с исполняемым кодом повышают эффективность агентов LLM. Ван и др. ИКМЛ. [бумага] [репо]
[2024/02] Разработка через тестирование для генерации кода. Мэтьюз и др. arXiv. [бумага] [репо]
[2024/01] Генерация кода с помощью AlphaCodium: от оперативного проектирования к потоковому проектированию. Ридник и др. arXiv. [бумага] [репо]
[2024/01] Экспериментируем с новой практикой программирования с помощью LLM. Чжан и др. arXiv. [бумага] [репо]
[2024/01] CodeAgent: улучшение генерации кода с помощью интегрированных с инструментами агентских систем для решения реальных задач кодирования на уровне репозитория. Чжан и др. ACL. [бумага]
[2023/12] AgentCoder: генерация кода на основе нескольких агентов с итеративным тестированием и оптимизацией. Хуанг и др. arXiv. [бумага]
[2023/12] LLM4TDD: Лучшие практики разработки через тестирование с использованием больших языковых моделей. Пия и др. arXiv. [бумага] [репо]
[2023/11] INTERVENOR: Расширение возможностей кодирования больших языковых моделей с помощью интерактивной цепочки восстановления. Ван и др. ACL. [бумага] [репо]
[2023/10] ClarifyGPT: Расширение возможностей генерации кода на основе LLM с разъяснением намерений. Му и др. arXiv. [бумага] [репо]
[2023/10] Лемур: Гармонизация естественного языка и кода для языковых агентов. Сюй и др. ICLR. [бумага] [репо]
[2023/10] Фаззз компилятора «белого ящика» на основе больших языковых моделей. Ян и др. arXiv. [бумага] [репо]
[2023/09] Понимание программирования на основе тестовых примеров в моделях большого языка для улучшения генерации кода. Тиан и др. arXiv. [бумага]
[2023/09] МИНТ: ОЦЕНКА LLMS ПРИ МНОГООБОРОТНОМ ВЗАИМОДЕЙСТВИИ С ИНСТРУМЕНТАМИ И ЯЗЫКОВОЙ ОБРАТНОЙ СВЯЗЬЮ. Ван и др. ICLR. [бумага] [репо]
[2023/08] METAGPT: МЕТАПРОГРАММИРОВАНИЕ ДЛЯ РАМКИ МНОГОАГЕНТНОЙ СОВМЕСТНОЙ СОВМЕСТНОСТИ. Хонг и др. ICLR. [бумага] [репо]
[2023/08] Эффективная генерация тестов с использованием предварительно обученных моделей большого языка и мутационного тестирования. Дахель и др. Инф. Программное обеспечение Технол. . [бумага] [репо]
[2023/08] AgentVerse: содействие многоагентному сотрудничеству и изучение возникающих ситуаций. Чен и др. ICLR. [бумага] [репо]
[2023/08] AutoGen: включение приложений LLM нового поколения посредством межагентного диалога. Ву и др. arXiv. [бумага] [репо]
[2023/08] Потоки: строительные блоки рассуждения и совместной работы ИИ. Йозифоски и др. arXiv. [бумага] [репо]
[2023/06] SELFEVOLVE: Структура эволюции кода с помощью больших языковых моделей. Цзян и др. arXiv. [бумага]
[2023/06] InterCode: Стандартизация и сравнительный анализ интерактивного кодирования с обратной связью по выполнению. Ян и др. НейрИПС. [бумага] [репо]
[2023/06] ЯВЛЯЕТСЯ ЛИ САМОВОССТАНОВЛЕНИЕ серебряной ПУЛЯ ДЛЯ ГЕНЕРАЦИИ КОДА?. Олауссон и др. ICLR. [бумага] [репо]
[2023/05] Ручных тестов больше нет? Оценка и улучшение ChatGPT для создания модульных тестов. Юань и др. arXiv. [бумага] [репо]
[2023/04] Полностью автономное программирование с использованием больших языковых моделей. Ливенцев и др. ГЕККО. [бумага]
[2023/04] Объяснимая автоматическая отладка с помощью научной отладки на основе модели большого языка. Канг и др. arXiv. [бумага]
[2023/03] ART: Автоматическое многоэтапное рассуждение и использование инструментов для больших языковых моделей. Паранджапе и др. arXiv. [бумага] [репо]
[2023/03] Рефлексия: языковые агенты с обучением с вербальным подкреплением. Шинн и др. НейрИПС. [бумага] [репо]
[2023/02] Эмпирическая оценка использования больших языковых моделей для автоматизированной генерации модульных тестов. Шефер и др. IEEE Транс. Программное обеспечение Eng.. [бумага] [репозиторий]
[2023/01] Диалоговый автоматизированный ремонт программы. Ся и др. arXiv. [бумага]

Инструменты локализации неисправностей

[2024/04] AutoCodeRover: улучшение автономной программы. Чжан и др. ИССТА. [бумага] [репо]
[2024/03] RepairAgent: автономный агент на базе LLM для восстановления программ. Бузениа и др. arXiv. [бумага]

Мультиагентная система

Роли агента

Роли менеджера

[2024/06] AgileCoder: динамические агенты для совместной разработки программного обеспечения на основе гибкой методологии. Нгуен и др. arXiv. [бумага] [репо]
[2024/05] Итеративное усовершенствование опыта агентов-разработчиков программного обеспечения. Цянь и др. arXiv. [бумага]
[2024/05] MapCoder: многоагентная генерация кода для конкурентного решения задач. Ислам и др. ACL. [бумага] [репо]
[2024/04] Самоорганизующиеся агенты: многоагентная структура LLM для сверхкрупномасштабной генерации и оптимизации кода. Ишибаши и др. arXiv. [бумага] [репо]
[2024/04] 3DGen: генерация доказуемо корректных анализаторов двоичного формата с помощью искусственного интеллекта . Фахури и др. arXiv [бумага]
[2024/03] MAGIS: Многоагентная платформа на основе LLM для решения проблем GitHub. Тао и др. arXiv. [бумага]
[2024/03] Когда генерация кода на основе LLM соответствует процессу разработки программного обеспечения. Лин и др. arXiv. [бумага] [репо]
[2024/02] CodeAgent: агенты совместной работы для разработки программного обеспечения. Тан и др. arXiv. [бумага] [репо]
[2024/02] CodePori: крупномасштабная модель автономной разработки программного обеспечения с использованием мультиагентов. Рашид и др. arXiv. [бумага]
[2023/12] Экспериментальное совместное обучение агентов, разрабатывающих программное обеспечение. Цянь и др. ACL. [бумага] [репо]
[2023/11] Автономные агенты в разработке программного обеспечения: концептуальный документ Rasheed et al. arXiv. [бумага]
[2023/11] Целенаправленное тестирование мобильного графического интерфейса пользователя с использованием автономных агентов модели большого языка . Юн и др. ИКСТ. [бумага] [репо]
[2023/10] AXNav: воспроизведение тестов доступности с естественного языка. Таеб и др. ЧИ. [бумага]
[2023/10] RCAgent: анализ первопричин облака автономными агентами с помощью расширенных инструментальных моделей большого языка. Ван и др. arXiv. [бумага]
[2023/09] AutoAgents: платформа для автоматического создания агентов. Чен и др. arXiv. [бумага] [репо]
[2023/08] METAGPT: МЕТАПРОГРАММИРОВАНИЕ ДЛЯ РАМКИ МНОГОАГЕНТНОЙ СОВМЕСТНОЙ СОВМЕСТНОСТИ. Хонг и др. ICLR. [бумага] [репо]
[2023/04] LLM с низким кодом: визуальное программирование поверх LLM. Цай и др. arXiv. [бумага] [репо]
[2023/03] CAMEL: Коммуникативные агенты для исследования «разума» общества с большой языковой моделью. Ли и др. НейрИПС. [бумага] [репо]

Роли анализа требований

[2024/06] Эксперименты с разработкой мультиагентного программного обеспечения: на пути к единой платформе Сами и др. arXiv. [бумага]
[2024/06] AgileCoder: динамические агенты для совместной разработки программного обеспечения на основе гибкой методологии. Нгуен и др. arXiv. [бумага] [репо]
[2024/05] MARE: Платформа многоагентной совместной работы для разработки требований. Джин и др. arXiv. [бумага]
[2024/04] Elicitron: Агентская система моделирования LLM для выявления требований к проектированию. Атаи и др. arXiv. [бумага]
[2024/03] Когда генерация кода на основе LLM соответствует процессу разработки программного обеспечения. Лин и др. arXiv. [бумага] [репо]
[2024/01] Экспериментируем с новой практикой программирования с помощью LLM. Чжан и др. arXiv. [бумага] [репо]
[2023/11] Автономные агенты в разработке программного обеспечения: концептуальный документ Rasheed et al. arXiv. [бумага]
[2023/10] Статический анализ кода в эпоху искусственного интеллекта: углубленное исследование концепции, функций и потенциала интеллектуального анализа кода. Фан и др. arXiv. [бумага]
[2023/08] METAGPT: МЕТАПРОГРАММИРОВАНИЕ ДЛЯ РАМКИ МНОГОАГЕНТНОЙ СОВМЕСТНОЙ СОВМЕСТНОСТИ. Хонг и др. ICLR. [бумага] [репо]
[2023/06] МУЛЬТИАГЕНТСКОЕ СОТРУДНИЧЕСТВО: ИСПОЛЬЗУЙТЕ СИЛУ ИНТЕЛЛЕКТУАЛЬНЫХ АГЕНТОВ LLM. Талебирад и др. arXiv. [бумага]
[2023/04] Самостоятельная генерация кода через ChatGPT. Донг и др. arXiv. [бумага] [репо]
[2023/03] CAMEL: Коммуникативные агенты для исследования «разума» общества с большой языковой моделью. Ли и др. НейрИПС. [бумага] [репо]

Роли дизайнера

[2024/06] Эксперименты с разработкой мультиагентного программного обеспечения: на пути к единой платформе Сами и др. arXiv. [бумага]
[2024/03] Когда генерация кода на основе LLM соответствует процессу разработки программного обеспечения. Лин и др. arXiv. [бумага] [репо]
[2024/01] Экспериментируем с новой практикой программирования с помощью LLM. Чжан и др. arXiv. [бумага] [репо]
[2023/11] Автономные агенты в разработке программного обеспечения: концептуальный документ Rasheed et al. arXiv. [бумага]
[2023/08] METAGPT: МЕТАПРОГРАММИРОВАНИЕ ДЛЯ РАМКИ МНОГОАГЕНТНОЙ СОВМЕСТНОЙ СОВМЕСТНОСТИ. Хонг и др. ICLR. [бумага] [репо]
[2023/08] AgentVerse: содействие многоагентному сотрудничеству и изучение возникающих ситуаций. Чен и др. ICLR. [бумага] [репо]
[2023/07] Коммуникативные агенты для разработки программного обеспечения. Цянь и др. ACL. [бумага] [репо]
[2023/06] МУЛЬТИАГЕНТСКОЕ СОТРУДНИЧЕСТВО: ИСПОЛЬЗУЙТЕ СИЛУ ИНТЕЛЛЕКТУАЛЬНЫХ АГЕНТОВ LLM. Талебирад и др. arXiv. [бумага]

Роли разработчиков

[2024/06] Эксперименты с разработкой мультиагентного программного обеспечения: на пути к единой платформе Сами и др. arXiv. [бумага]
[2024/06] AgileCoder: динамические агенты для совместной разработки программного обеспечения на основе гибкой методологии. Нгуен и др. arXiv. [бумага] [репо]
[2024/05] AutoCoder: улучшение модели большого языка кода с помощью AIEV-INSTRUCT. Лей и др. arXiv. [бумага] [репо]
[2024/05] MapCoder: многоагентная генерация кода для конкурентного решения задач. Ислам и др. ACL. [бумага] [репо]
[2024/04] Самоорганизующиеся агенты: многоагентная структура LLM для сверхкрупномасштабной генерации и оптимизации кода. Ишибаши и др. arXiv. [бумага] [репо]
[2024/04] 3DGen: генерация доказуемо корректных анализаторов двоичного формата с помощью искусственного интеллекта . Фахури и др. arXiv [бумага]
[2024/03] CodeS: естественный язык для репозитория кода с помощью многоуровневого эскиза. Зан и др. arXiv. [бумага] [репо]
[2024/03] MAGIS: Многоагентная платформа на основе LLM для решения проблем GitHub. Тао и др. arXiv. [бумага]
[2024/03] Когда генерация кода на основе LLM соответствует процессу разработки программного обеспечения. Лин и др. arXiv. [бумага] [репо]
[2024/02] Разработка через тестирование для генерации кода. Мэтьюз и др. arXiv. [бумага] [репо]
[2024/02] CodePori: крупномасштабная модель автономной разработки программного обеспечения с использованием мультиагентов. Рашид и др. arXiv. [бумага]
[2024/01] Экспериментируем с новой практикой программирования с помощью LLM. Чжан и др. arXiv. [бумага] [репо]
[2023/12] AgentCoder: генерация кода на основе нескольких агентов с итеративным тестированием и оптимизацией. Хуанг и др. arXiv. [бумага]
[2023/11] Автономные агенты в разработке программного обеспечения: концептуальный документ Rasheed et al. arXiv. [бумага]
[2023/11] INTERVENOR: Расширение возможностей кодирования больших языковых моделей с помощью интерактивной цепочки восстановления. Ван и др. ACL. [бумага] [репо]
[2023/08] AutoGen: включение приложений LLM нового поколения посредством межагентного диалога. Ву и др. arXiv. [бумага] [репо]
[2023/08] METAGPT: МЕТАПРОГРАММИРОВАНИЕ ДЛЯ РАМКИ МНОГОАГЕНТНОЙ СОВМЕСТНОЙ СОВМЕСТНОСТИ. Хонг и др. ICLR. [бумага] [репо]
[2023/08] AgentVerse: содействие многоагентному сотрудничеству и изучение возникающих ситуаций. Чен и др. ICLR. [бумага] [репо]
[2023/07] Коммуникативные агенты для разработки программного обеспечения. Цянь и др. ACL. [бумага] [репо]
[2023/06] ЯВЛЯЕТСЯ ЛИ САМОВОССТАНОВЛЕНИЕ серебряной ПУЛЯ ДЛЯ ГЕНЕРАЦИИ КОДА?. Олауссон и др. ICLR. [бумага] [репо]
[2023/06] МУЛЬТИАГЕНТСКОЕ СОТРУДНИЧЕСТВО: ИСПОЛЬЗУЙТЕ СИЛУ ИНТЕЛЛЕКТУАЛЬНЫХ АГЕНТОВ LLM. Талебирад и др. arXiv. [бумага]
[2023/05] Саморедактирование: редактор кода с учетом ошибок для генерации кода . Чжан и др. ACL. [бумага]
[2023/04] Самостоятельная генерация кода через ChatGPT. Донг и др. arXiv. [бумага] [репо]
[2023/03] CAMEL: Коммуникативные агенты для исследования «разума» общества с большой языковой моделью. Ли и др. НейрИПС. [бумага] [репо]

Роли по обеспечению качества программного обеспечения

[2024/08] SpecRover: Извлечение намерений кода с помощью LLM Ruan et al. arXiv. [бумага] [репо]
[2024/07] Автоматизированное тестирование мобильного графического интерфейса на основе визуального представления с использованием мультимодальной модели большого языка. Лю и др. arXiv. [бумага] [репо]
[2024/06] Эксперименты с разработкой мультиагентного программного обеспечения: на пути к единой платформе Сами и др. arXiv. [бумага]
[2024/06] Разработка мультиагентного программного обеспечения посредством межкомандного сотрудничества. Ду и др. arXiv. [бумага] [репо]
[2024/06] AgileCoder: динамические агенты для совместной разработки программного обеспечения на основе гибкой методологии. Нгуен и др. arXiv. [бумага] [репо]
[2024/06] MASAI: Модульная архитектура для разработки программного обеспечения ИИ-агентов. Арора и др. arXiv. [бумага]
[2024/05] AutoCoder: улучшение модели большого языка кода с помощью AIEV-INSTRUCT. Лей и др. arXiv. [бумага] [репо]
[2024/05] MapCoder: многоагентная генерация кода для конкурентного решения задач. Ислам и др. ACL. [бумага] [репо]
[2024/04] Анализ кода с использованием искусственного интеллекта и степенью магистратуры: первые результаты. Рашид и др. arXiv. [бумага]
[2024/04] 3DGen: генерация доказуемо корректных анализаторов двоичного формата с помощью искусственного интеллекта . Фахури и др. arXiv [бумага]
[2024/04] Унифицированный подход к отладке с помощью многоагентной синергии на основе LLM. Ли и др. arXiv. [бумага] [репо]
[2024/04] Как далеко мы можем зайти с практическим восстановлением программ на функциональном уровне? Сян и др. arXiv. [бумага] [репо]
[2024/03] MAGIS: Многоагентная платформа на основе LLM для решения проблем GitHub. Тао и др. arXiv. [бумага]
[2024/03] AGENTFL: Масштабирование локализации разломов на основе LLM в контексте уровня проекта. Цинь и др. arXiv. [бумага]
[2024/03] Объединение агентов тонкой настройки и LLM для интуитивно понятного аудита смарт-контрактов с обоснованиями. Ма и др. arXiv. [бумага] [репо]
[2024/03] Когда генерация кода на основе LLM соответствует процессу разработки программного обеспечения. Лин и др. arXiv. [бумага] [репо]
[2024/03] ACFIX: Руководство для LLM с использованием общих практик RBAC для контекстно-зависимого устранения уязвимостей контроля доступа в смарт-контрактах. Чжан и др. arXiv. [бумага]
[2024/02] CodeAgent: агенты совместной работы для разработки программного обеспечения. Тан и др. arXiv. [бумага] [репо]
[2024/02] Разработка через тестирование для генерации кода. Мэтьюз и др. arXiv. [бумага] [репо]
[2024/02] CodePori: крупномасштабная модель автономной разработки программного обеспечения с использованием мультиагентов. Рашид и др. arXiv. [бумага]
[2024/01] XUAT-Copilot: многоагентная система совместной работы для автоматизированного приемочного тестирования пользователей с большой языковой моделью. Ван и др. arXiv. [бумага]
[2023/12] AgentCoder: генерация кода на основе нескольких агентов с итеративным тестированием и оптимизацией. Хуанг и др. arXiv. [бумага]
[2023/11] Автономные агенты в разработке программного обеспечения: концептуальный документ Rasheed et al. arXiv. [бумага]
[2023/11] Целенаправленное тестирование мобильного графического интерфейса пользователя с использованием автономных агентов модели большого языка . Юн и др. ИКСТ. [бумага] [репо]
[2023/10] Обнаружение уязвимостей смарт-контрактов на основе модели большого языка: новые перспективы. Ху и др. ТПС-ИСА. [бумага] [репо]
[2023/10] Статический анализ кода в эпоху искусственного интеллекта: углубленное исследование концепции, функций и потенциала интеллектуального анализа кода. Фан и др. arXiv. [бумага]
[2023/10] Фаззз компилятора «белого ящика» на основе больших языковых моделей. Ян и др. arXiv. [бумага] [репо]
[2023/10] AXNav: воспроизведение тестов доступности с естественного языка. Таеб и др. ЧИ. [бумага]
[2023/08] AutoGen: включение приложений LLM нового поколения посредством межагентного диалога. Ву и др. arXiv. [бумага] [репо]
[2023/08] METAGPT: МЕТАПРОГРАММИРОВАНИЕ ДЛЯ РАМКИ МНОГОАГЕНТНОЙ СОВМЕСТНОЙ СОВМЕСТНОСТИ. Хонг и др. ICLR. [бумага] [репо]
[2023/07] Коммуникативные агенты для разработки программного обеспечения. Цянь и др. ACL. [бумага] [репо]
[2023/06] ЯВЛЯЕТСЯ ЛИ САМОВОССТАНОВЛЕНИЕ серебряной ПУЛЯ ДЛЯ ГЕНЕРАЦИИ КОДА?. Олауссон и др. ICLR. [бумага] [репо]
[2023/06] МУЛЬТИАГЕНТСКОЕ СОТРУДНИЧЕСТВО: ИСПОЛЬЗУЙТЕ СИЛУ ИНТЕЛЛЕКТУАЛЬНЫХ АГЕНТОВ LLM. Талебирад и др. arXiv. [бумага]
[2023/05] Саморедактирование: редактор кода с учетом ошибок для генерации кода . Чжан и др. ACL. [бумага]
[2023/03] CAMEL: Коммуникативные агенты для исследования «разума» общества с большой языковой моделью. Ли и др. НейрИПС. [бумага] [репо]

Роли помощников

[2024/08] РАЗНООБРАЗИЕ УСИЛИВАЕТ ИНТЕЛЛЕКТ: ИНТЕГРАЦИЯ ОПЫТА РАЗРАБОТЧИКОВ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ Zhang et al. arXiv. [бумага]
[2024/08] SpecRover: Извлечение намерений кода с помощью LLM Ruan et al. arXiv. [бумага] [репо]
[2024/06] MASAI: Модульная архитектура для разработки программного обеспечения ИИ-агентов. Арора и др. arXiv. [бумага]
[2024/05] MapCoder: многоагентная генерация кода для конкурентного решения задач. Ислам и др. ACL. [бумага] [репо]
[2024/03] MAGIS: Многоагентная платформа на основе LLM для решения проблем GitHub. Тао и др. arXiv. [бумага]
[2024/03] CodeS: естественный язык для репозитория кода с помощью многоуровневого эскиза. Зан и др. arXiv. [бумага] [репо]
[2024/03] Объединение агентов тонкой настройки и LLM для интуитивно понятного аудита смарт-контрактов с обоснованиями. Ма и др. arXiv. [бумага] [репо]
[2023/10] Статический анализ кода в эпоху искусственного интеллекта: углубленное исследование концепции, функций и потенциала интеллектуального анализа кода. Фан и др. arXiv. [бумага]

Механизм сотрудничества

Сотрудничество

Многоуровневая структура

[2024/08] РАЗНООБРАЗИЕ УСИЛИВАЕТ ИНТЕЛЛЕКТ: ИНТЕГРАЦИЯ ОПЫТА РАЗРАБОТЧИКОВ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ Zhang et al. arXiv. [бумага]
[2024/08] SpecRover: Извлечение намерений кода с помощью LLM Ruan et al. arXiv. [бумага] [репо]
[2024/06] Эксперименты с разработкой мультиагентного программного обеспечения: на пути к единой платформе Сами и др. arXiv. [бумага]
[2024/06] Масштабирование многоагентного сотрудничества на основе моделей большого языка Qian et al. arXiv. [бумага] [репо]
[2024/06] Разработка мультиагентного программного обеспечения посредством межкомандного сотрудничества. Ду и др. arXiv. [бумага] [репо]
[2024/06] AgileCoder: динамические агенты для совместной разработки программного обеспечения на основе гибкой методологии. Нгуен и др. arXiv. [бумага] [репо]
[2024/05] MapCoder: многоагентная генерация кода для конкурентного решения задач. Ислам и др. ACL. [бумага] [репо]
[2024/05] MARE: Платформа многоагентной совместной работы для разработки требований. Джин и др. arXiv. [бумага]
[2024/04] AutoCodeRover: улучшение автономной программы. Чжан и др. ИССТА. [бумага] [репо]
[2024/04] Как далеко мы можем зайти с практическим восстановлением программ на функциональном уровне? Сян и др. arXiv. [бумага] [репо]
[2024/03] CodeS: естественный язык для репозитория кода с помощью многоуровневого эскиза. Зан и др. arXiv. [бумага] [репо]
[2024/03] Когда генерация кода на основе LLM соответствует процессу разработки программного обеспечения. Лин и др. arXiv. [бумага] [репо]
[2024/03] AGENTFL: Масштабирование локализации разломов на основе LLM в контексте уровня проекта. Цинь и др. arXiv. [бумага]
[2024/02] Когда анализ потока данных соответствует большим языковым моделям. Ван и др. arXiv. [бумага]
[2024/02] CodeAgent: агенты совместной работы для разработки программного обеспечения. Тан и др. arXiv. [бумага] [репо]
[2024/02] Все, что вам нужно, — это больше агентов. Ли и др. arXiv. [бумага]
[2024/01] Экспериментируем с новой практикой программирования с помощью LLM. Чжан и др. arXiv. [бумага] [репо]
[2023/11] Автономные агенты в разработке программного обеспечения: концептуальный документ Rasheed et al. arXiv. [бумага]
[2023/10] Статический анализ кода в эпоху искусственного интеллекта: углубленное исследование концепции, функций и потенциала интеллектуального анализа кода. Фан и др. arXiv. [бумага]
[2023/10] Обнаружение уязвимостей смарт-контрактов на основе модели большого языка: новые перспективы. Ху и др. ТПС-ИСА. [бумага] [репо]
[2023/10] Фаззз компилятора «белого ящика» на основе больших языковых моделей. Ян и др. arXiv. [бумага] [репо]
[2023/10] Динамическая сеть LLM-агентов: структура сотрудничества LLM-агентов с оптимизацией команды агентов. Лю и др. arXiv. [бумага] [репо]
[2023/08] METAGPT: МЕТАПРОГРАММИРОВАНИЕ ДЛЯ РАМКИ МНОГОАГЕНТНОЙ СОВМЕСТНОЙ СОВМЕСТНОСТИ. Хонг и др. ICLR. [бумага] [репо]
[2023/08] Потоки: строительные блоки рассуждения и совместной работы ИИ. Йозифоски и др. arXiv. [бумага] [репо]
[2023/07] Коммуникативные агенты для разработки программного обеспечения. Цянь и др. ACL. [бумага] [репо]
[2023/05] Саморедактирование: редактор кода с учетом ошибок для генерации кода . Чжан и др. ACL. бумага
[2023/04] LLM с низким кодом: визуальное программирование поверх LLM. Цай и др. arXiv. [бумага] [репо]

Круговая структура

[2024/05] AutoCoder: улучшение модели большого языка кода с помощью AIEV-INSTRUCT. Лей и др. arXiv. [бумага] [репо]
[2024/04] Унифицированный подход к отладке с помощью многоагентной синергии на основе LLM. Ли и др. arXiv. [бумага] [репо]
[2024/03] ACFIX: Руководство для LLM с использованием общих практик RBAC для контекстно-зависимого устранения уязвимостей контроля доступа в смарт-контрактах. Чжан и др. arXiv. [бумага]
[2024/03] Многоцелевой консенсус посредством дискуссий LLM по обнаружению уязвимостей. Мао и др. QRS. [бумага]
[2024/03] Объединение агентов тонкой настройки и LLM для интуитивно понятного аудита смарт-контрактов с обоснованиями. Ма и др. arXiv. [бумага] [репо]
[2024/02] Разработка через тестирование для генерации кода. Мэтьюз и др. arXiv. [бумага] [репо]
[2024/02] CodePori: крупномасштабная модель автономной разработки программного обеспечения с использованием мультиагентов. Рашид и др. arXiv. [бумага]
[2023/12] Экспериментальное совместное обучение агентов, разрабатывающих программное обеспечение. Цянь и др. ACL. [бумага] [репо]
[2023/12] AgentCoder: генерация кода на основе нескольких агентов с итеративным тестированием и оптимизацией. Хуанг и др. arXiv. [бумага]
[2023/11] INTERVENOR: Расширение возможностей кодирования больших языковых моделей с помощью интерактивной цепочки восстановления. Ван и др. ACL. [бумага] [репо]
[2023/11] Целенаправленное тестирование мобильного графического интерфейса пользователя с использованием автономных агентов модели большого языка . Юн и др. ИКСТ. [бумага] [репо]
[2023/10] AXNav: воспроизведение тестов доступности с естественного языка. Таеб и др. ЧИ. [бумага]
[2023/06] ЯВЛЯЕТСЯ ЛИ САМОВОССТАНОВЛЕНИЕ серебряной ПУЛЯ ДЛЯ ГЕНЕРАЦИИ КОДА?. Олауссон и др. ICLR. [бумага] [репо]
[2023/03] CAMEL: Коммуникативные агенты для исследования «разума» общества с большой языковой моделью. Ли и др. НейрИПС. [бумага] [репо]
[2023/03] Рефлексия: языковые агенты с обучением с вербальным подкреплением. Шинн и др. НейрИПС. [бумага] [репо]

Древовидная структура

[2024/06] Масштабирование многоагентного сотрудничества на основе моделей большого языка Qian et al. arXiv. [бумага] [репо]
[2024/06] MASAI: Модульная архитектура для разработки программного обеспечения ИИ-агентов. Арора и др. arXiv. [бумага]
[2024/04] Самоорганизующиеся агенты: многоагентная структура LLM для сверхкрупномасштабной генерации и оптимизации кода. Ишибаши и др. arXiv. [бумага] [репо]

Звездообразная структура

[2024/06] Масштабирование многоагентного сотрудничества на основе моделей большого языка Qian et al. arXiv. [бумага] [репо]
[2024/03] AutoDev: Автоматизированная разработка на основе искусственного интеллекта . Туфано и др. arXiv [бумага]
[2024/01] XUAT-Copilot: многоагентная система совместной работы для автоматизированного приемочного тестирования пользователей с большой языковой моделью. Ван и др. arXiv. [бумага]
[2023/10] RCAgent: анализ первопричин облака автономными агентами с помощью расширенных инструментальных моделей большого языка. Ван и др. arXiv. [бумага]
[2023/08] AutoGen: включение приложений LLM нового поколения посредством межагентного диалога. Ву и др. arXiv. [бумага] [репо]

Сетчатая структура

[2024/06] Масштабирование многоагентного сотрудничества на основе моделей большого языка Qian et al. arXiv. [бумага] [репо]
[2024/04] 3DGen: генерация доказуемо корректных анализаторов двоичного формата с помощью искусственного интеллекта . Фахури и др. arXiv [бумага]

Сотрудничество человека и агента

Человек-Агент

Этап планирования

[2024/01] Экспериментируем с новой практикой программирования с помощью LLM. Чжан и др. arXiv. [бумага] [репо]
[2024/01] LLM4PLC: Использование больших языковых моделей для проверяемого программирования ПЛК в промышленных системах управления. Факих и др. МСЭ. [бумага] [репо]
[2023/10] Статический анализ кода в эпоху искусственного интеллекта: углубленное исследование концепции, функций и потенциала интеллектуального анализа кода. Фан и др. arXiv. [бумага]
[2023/04] LLM с низким кодом: визуальное программирование поверх LLM. Цай и др. arXiv. [бумага] [репо]

Этап требований

[2024/05] MARE: Платформа многоагентной совместной работы для разработки требований. Джин и др. arXiv. [бумага]
[2024/02] Действия с исполняемым кодом повышают эффективность агентов LLM. Ван и др. ИКМЛ. [бумага] [репо]
[2024/01] Экспериментируем с новой практикой программирования с помощью LLM. Чжан и др. arXiv. [бумага] [репо]
[2023/10] ClarifyGPT: Расширение возможностей генерации кода на основе LLM с разъяснением намерений. Му и др. arXiv. [бумага] [репо]
[2023/06] Prompt Sapper: Инфраструктура разработки программного обеспечения на базе LLM для сервисов AI-Native. Син и др. arXiv. [бумага]

Этап разработки

[2024/03] CodeS: естественный язык для репозитория кода с помощью многоуровневого эскиза. Зан и др. arXiv. [бумага] [репо]
[2024/01] LLM4PLC: Использование больших языковых моделей для проверяемого программирования ПЛК в промышленных системах управления. Факих и др. МСЭ. [бумага] [репо]
[2023/09] МИНТ: ОЦЕНКА LLMS ПРИ МНОГООБОРОТНОМ ВЗАИМОДЕЙСТВИИ С ИНСТРУМЕНТАМИ И ЯЗЫКОВОЙ ОБРАТНОЙ СВЯЗЬЮ. Ван и др. ICLR. [бумага] [репо]
[2023/08] Потоки: строительные блоки рассуждения и совместной работы ИИ. Йозифоски и др. arXiv. [бумага] [репо]
[2023/08] AutoGen: включение приложений LLM нового поколения посредством межагентного диалога. Ву и др. arXiv. [бумага] [репо]

Этап оценки

[2024/01] Экспериментируем с новой практикой программирования с помощью LLM. Чжан и др. arXiv. [бумага] [репо]
[2023/08] Gentopia: совместная платформа для программ LLM, дополненных инструментами. Сюй и др. ЭМНЛП. [бумага] [репо]
[2023/06] Prompt Sapper: Инфраструктура разработки программного обеспечения на базе LLM для сервисов AI-Native. Син и др. arXiv. [бумага]
[2023/03] ART: Автоматическое многоэтапное рассуждение и использование инструментов для больших языковых моделей. Паранджапе и др. arXiv. [бумага] [репо]

Цитирование

 @misc{Agent4SE, title={Агенты на основе моделей большого языка для разработки программного обеспечения: опрос},
       автор={Цзюньвэй Лю и Кайсинь Ван и Исюань Чен и Синь Пэн и Чжэньпэн Чен и Линмин Чжан и Илин Лу}, год={2024}, eprint={2409.02977}, archivePrefix={arXiv}, PrimaryClass={cs.SE} , URL = {https://arxiv.org/abs/2409.02977},
 }