Agent4SE Paper List下载 - Agent4SE Paper List源码下载

基于大型语言模型的软件工程代理：调查

大型语言模型（LLM）的最新进展塑造了人工智能代理的新范式，即基于 LLM 的代理。与独立的法学硕士相比，基于法学硕士的代理通过增强法学硕士感知和利用外部资源和工具的能力，大大扩展了法学硕士的多功能性和专业知识。迄今为止，基于LLM的代理已在软件工程（SE）领域得到应用并显示出显着的效果。多个智能体和人类交互之间的协同作用为解决复杂的现实世界 SE 问题带来了进一步的希望。在这项工作中，我们对基于 LLM 的 SE 代理进行了全面、系统的调查。我们收集了 106 篇论文，并从 SE 和 Agent 两个角度对它们进行分类。此外，我们还讨论了这一关键领域的开放挑战和未来方向。

？我们从软件工程任务和Agent架构两个角度系统地总结了Agent4SE的进展。

？论文链接：基于大型语言模型的软件工程代理：调查

图片-20240921134539206

给这个仓库加星标

这个研究领域正在迅速发展；给这个存储库加注星标以跟上更新！

消息

[2024/09/04]我们在 arXiv 上发布了第一版调查。

SE观点

SE_任务

需求工程

[2024/05] MARE：需求工程多代理协作框架。金等人。 arXiv. [纸]
[2024/04] Elicitron：用于设计需求获取的基于 LLM 代理的仿真框架。阿泰伊等人。 arXiv. [纸]
[2024/01] SpecGen：通过大型语言模型自动生成正式程序规范。马等人。 arXiv. [论文] [回购协议]
[2023/10]通过生成人工智能推进需求工程：评估法学硕士的作用。阿罗拉等人。 arXiv. [纸]

代码生成

[2024/11]规划驱动的编程：大型语言模型编程工作流程Lei 等人。 arXiv [论文]
[2024/11]编程链：为地理空间代码生成赋能大型语言模型Hou 等人。 arXiv [论文]
[2024/10] 法学硕士Dou 等人的多编程语言沙盒。 arXiv [论文]
[2024/10] SceneGenAgent：使用 Coding Agent Xia 等人精确生成工业场景arXiv [论文] [存储库]
[2024/10] MCCoder：利用法学硕士辅助代码生成和严格验证简化运动控制Li 等人。 arXiv [论文] [存储库]
[2024/10] Agents4PLC：使用基于 LLM 的 Agents Liu 等人在工业控制系统中自动生成闭环 PLC 代码并进行验证。 arXiv [论文] [存储库]
[2024/10]使用 LLM 优化器通过 DSL 驱动的代码生成提高并行程序性能Wei 等人。 arXiv. [纸]
[2024/10] AgentBank：通过对 50000 多个交互轨迹进行微调来实现广义 LLM 代理Song 等人。 arXiv. [纸]
[2024/10] RLEF：使用强化学习在执行反馈中接地代码 LLMS Gehring 等人。 arXiv. [纸]
[2024/10]比你的老师更好：从特权 AI 反馈Choudhury 等人那里学习的 LLM 代理。 arXiv. [纸]
[2024/10] AMR-Evol：自适应模块化响应进化为代码生成中的大型语言模型带来更好的知识蒸馏Luo 等人。 arXiv. [论文] [回购协议]
[2024/10] RGD：通过细化和生成指导的基于多 LLM 的代理调试器Jin 等人。 arXiv. [纸]
[2024/09] AutoSafeCoder：通过静态分析和模糊测试保护 LLM 代码生成的多代理框架Nunez 等人。 arXiv [论文] [存储库]
[2024/09]通过多计划探索和反馈驱动细化生成代码的结对编程框架张等人。 arXiv [论文] [存储库]
[2024/08]筛选干扰：利用执行反馈对生成的候选代码进行排名Sun 等人。 arXiv [论文]
[2024/08] CODEXGRAPH：通过代码图数据库桥接大型语言模型和代码存储库Liu 等人。 arXiv. [论文] [回购协议]
[2024/07] OPENHANDS：为人工智能软件开发者提供通用代理的开放平台Wang 等人。 arXiv [论文] [存储库]
[2024/05]使用存储库上的迭代、工具增强推理从自然语言生成类级代码。德什潘德等人。 arXiv. [纸]
[2024/05] MapCoder：用于解决竞争性问题的多代理代码生成。伊斯兰等人。前交叉韧带。 [论文] [回购协议]
[2024/05] AutoCoder：使用 AIEV-INSTRUCT 增强代码大型语言模型。雷等人。 arXiv. [论文] [回购协议]
[2024/04] 3DGen：人工智能辅助生成可证明正确的二进制格式解析器。法库里等人。 arXiv [论文]
[2024/04]自组织代理：面向超大规模代码生成和优化的 LLM 多代理框架。石桥等人。 arXiv. [论文] [回购协议]
[2024/03] AutoDev：自动化人工智能驱动开发。图法诺等人。 arXiv [论文]
[2024/03] CoCoST：通过在线搜索和正确性测试自动生成复杂代码。他等人。 arXiv. [纸]
[2024/03] RAT：检索增强思维在长视野生成中引发上下文感知推理。王等人。 arXiv. [论文] [回购协议]
[2024/02]可执行代码操作引出更好的 LLM 代理。王等人。 ICML。 [论文] [回购协议]
[2024/02]您需要更多代理。李等人。 arXiv. [纸]
[2024/02]代码生成的测试驱动开发。马修斯等人。 arXiv. [论文] [回购协议]
[2024/02] LDB：通过逐步验证运行时执行的大型语言模型调试器。钟等人。 arXiv. [论文] [回购协议]
[2024/01] CodeAgent：利用工具集成的代理系统增强代码生成，应对现实世界的回购级编码挑战。张等人。前交叉韧带。 [纸]
[2024/01]教授代码法学硕士在存储库级代码生成中使用自动完成工具。王等人。 arXiv. [纸]
[2024/01]使用 AlphaCodium 生成代码：从即时工程到流程工程。里德尼克等人。 arXiv. [论文] [回购协议]
[2023/12] AgentCoder：基于多代理的代码生成与迭代测试和优化。黄等人。 arXiv. [纸]
[2023/12] LLM4TDD：使用大型语言模型进行测试驱动开发的最佳实践。皮亚等人。 arXiv. [论文] [回购协议]
[2023/11] INTERVENOR：通过交互式修复链提升大型语言模型的编码能力。王等人。前交叉韧带。 [论文] [回购协议]
[2023/10]动态 LLM-代理网络：具有代理团队优化功能的 LLM-代理协作框架。刘等人。 arXiv. [论文] [回购协议]
[2023/10]狐猴：协调自然语言和语言代理代码。徐等人。 ICLR。 [论文] [回购协议]
[2023/10] ClarifyGPT：通过意图澄清增强基于 LLM 的代码生成。穆等人。 arXiv. [论文] [回购协议]
[2023/10]代码链：通过具有代表性子模块的自我修订链实现模块化代码生成。乐等人。 ICLR。 [论文] [回购协议]
[2023/10]语言代理树搜索统一了语言模型中的推理、执行和规划。周等人。 ICML。 [论文] [回购协议]
[2023/09] MINT：评估 LLMS 与工具和语言反馈的多轮交互。王等人。 ICLR。 [论文] [回购协议]
[2023/09]大型语言模型中测试用例驱动的编程理解，以实现更好的代码生成。田等人。 arXiv. [纸]
[2023/09] CodePlan：使用法学硕士和规划进行存储库级编码。拜里等人。 FSE。 [论文] [回购协议]
[2023/09]从误用到精通：通过知识驱动的人工智能链增强代码生成。任等人。日月光。 [纸]
[2023/09] Parsel？：通过组合分解进行语言模型的算法推理。泽利克曼等人。神经信息处理系统。 [论文] [回购协议]
[2023/08] AutoGen：通过多代理对话启用下一代 LLM 应用程序。吴等人。 arXiv. [论文] [回购协议]
[2023/08] Gentopia：工具增强法学硕士协作平台。徐等人。 EMNLP。 [论文] [回购协议]
[2023/08]流程：推理和协作人工智能的构建模块。约西福斯基等人。 arXiv. [论文] [回购协议]
[2023/08] CodeCoT：解决代码生成 CoT 推理中的代码语法错误。黄等人。 arXiv. [纸]
[2023/06] SELFEVOLVE：通过大型语言模型的代码演化框架。江等人。 arXiv. [纸]
[2023/06] InterCode：通过执行反馈对交互式编码进行标准化和基准测试。杨等人。神经信息处理系统。 [论文] [回购协议]
[2023/06]自我修复是代码生成的银弹吗？奥劳森等人。 ICLR。 [论文] [回购协议]
[2023/05] ToolCoder：教代码生成模型使用 API 搜索工具。张等人。 arXiv. [纸]
[2023/05]自我编辑：用于代码生成的故障感知代码编辑器。张等人。前交叉韧带。 [纸]
[2023/04]教授大型语言模型进行自调试。陈等人。 ICLR。 [纸]
[2023/04]使用大型语言模型进行完全自主编程。利文采夫等人。杰科。 [纸]
[2023/03] CAMEL：大语言模型社会“心灵”探索的交流代理。李等人。神经信息处理系统。 [论文] [回购协议]
[2023/03]反思：具有言语强化学习的语言代理。辛恩等人。神经信息处理系统。 [论文] [回购协议]
[2023/03]自我细化：自我反馈的迭代细化。马达安等人。神经信息处理系统。 [论文] [回购协议]

确认

[2024/10]通过自我进化自动生成 Rust 代码证明Chen 等人。 arXiv [论文]
[2024/09] AutoVerus：Rust 代码的自动证明生成Yang 等人。 arXiv [论文]

静态代码检查

静态错误检测

[2024/10]利用微调语言模型进行高效、准确的智能合约审计Wei 等人。 arXiv [论文] [存储库]
[2024/10] LLM-SmartAudit：高级智能合约漏洞检测Wei 等人arXiv. [论文] [回购协议]
[2024/05]用于检测安全漏洞的法学硕士辅助静态分析。李等人。 arXiv. [纸]
[2024/05] PropertyGPT：通过检索增强财产生成对智能合约进行法学硕士驱动的形式验证。刘等人。 arXiv. [论文] [回购协议]
[2024/03]通过法学硕士讨论达成多角色共识以进行漏洞检测。毛等人。 QRS波。 [纸]
[2024/03]将微调和基于 LLM 的代理相结合，进行直观的智能合约审计和论证。马等人。 arXiv. [论文] [回购协议]
[2024/02]当数据流分析遇到大型语言模型。王等人。 arXiv. [纸]
[2024/01] LLM4Vuln：解耦和增强法学硕士漏洞推理的统一评估框架。孙等人。 arXiv. [论文] [回购协议]
[2023/12] E&V：通过伪代码执行和验证提示大型语言模型进行静态分析。郝等人。 arXiv. [纸]
[2023/10]大语言模型驱动的智能合约漏洞检测：新视角。胡等人。 TPS-ISA。 [论文] [回购协议]
[2023/10] AI时代的静态代码分析：深入探讨智能代码分析的概念、功能和潜力。范等人。 arXiv. [纸]
[2023/08]增强实际错误检测的静态分析：法学硕士集成方法。李等人。 arXiv. [论文] [回购协议]
[2023/03] ART：大型语言模型的自动多步推理和工具使用。帕兰贾普等人。 arXiv. [论文] [回购协议]

代码审查

[2024/10]代理人作为法官：与诸葛等人一起评估代理人。 arXiv. [论文] [回购协议]
[2024/09]分而治之：通过本地化和修订自动进行代码修订Wang 等人。 ACM 翻译。软件。工程师。方法。 [纸]
[2024/04]法学硕士人工智能驱动的代码审查：早期结果。拉希德等人。 arXiv. [纸]
[2024/02] CodeAgent：软件工程协作代理。唐等人。 arXiv. [论文] [回购协议]
[2023/10] AI时代的静态代码分析：深入探讨智能代码分析的概念、功能和潜力。范等人。 arXiv. [纸]
[2023/09]核心：使用法学硕士解决代码质量问题。瓦德瓦等人。 FSE。 [论文] [回购协议]

测试

单元测试

[2024/11] ReAccept：基于动态验证和大型语言模型的生产和测试代码自动协同演化Chi 等人。 arXiv [论文] [存储库]
[2024/09]使用 LLM 支持的代码生成进行 Python 符号执行Wang 等人。 arXiv [论文]
[2024/06] Mokav：使用法学硕士进行执行驱动的差异测试。埃特马迪等人。 arXiv. [论文] [回购协议]
[2024/04]通过程序分析增强难以覆盖分支的基于 LLM 的测试生成。杨等人。 arXiv. [纸]
[2024/03] AutoDev：自动化人工智能驱动开发。图法诺等人。 arXiv [论文]
[2024/03] COVERUP：覆盖率引导的基于 LLM 的测试生成。皮佐诺等人。 arXiv. [论文] [回购协议]
[2023/08]使用预先训练的大型语言模型和突变测试生成有效的测试。达赫尔等人。信息。软件。技术。。 [论文] [回购协议]
[2023/05]不再需要手动测试？评估和改进 ChatGPT 以生成单元测试。袁等人。 arXiv. [论文] [回购协议]
[2023/05] ChatUniTest：基于 LLM 的测试生成框架。陈等人。 FSE。 [论文] [回购协议]
[2023/02]使用大型语言模型自动生成单元测试的实证评估。谢弗等人。 IEEE 传输。软件工程.. [论文] [repo]

系统测试

[2024/11]基于 LLM 的模糊驱动生成的代码知识图增强系统Xu 等人。 arXiv. [纸]
[2024/07]通过多模态大语言模型进行视觉驱动的自动化移动 GUI 测试。刘等人。 arXiv. [论文] [回购协议]
[2024/04] LLM 代理可以自主利用一日漏洞。方等人。 arXiv. [纸]
[2024/02]您现在就可以 REST：使用大型语言模型对 RESTful API 进行自动规范推理和黑盒测试。德克罗普等人。 arXiv. [论文] [回购协议]
[2024/01] XUAT-Copilot：使用大型语言模型进行自动用户验收测试的多代理协作系统。王等人。 arXiv. [纸]
[2024/01] KernelGPT：通过大型语言模型增强内核模糊测试。杨等人。 arXiv. [纸]
[2023/11]使用自主大型语言模型代理进行意图驱动的移动 GUI 测试。尹等人。国际科学技术委员会。 [论文] [回购协议]
[2023/10]让法学硕士成为测试专家：通过功能感知决策将类人交互引入移动 GUI 测试。刘等人。国际科学教育协会。 [纸]
[2023/10] AXNav：重播自然语言的辅助功能测试。泰布等人。气。 [纸]
[2023/10]大型语言模型支持的白盒编译器模糊测试。杨等人。 arXiv. [论文] [回购协议]
[2023/10]测试极限：使用大型语言模型生成用于移动应用程序崩溃检测的异常文本输入。刘等人。国际科学教育协会。 [论文] [回购协议]
[2023/08] PENTESTGPT：LLM授权的自动渗透测试工具。邓等人。 arXiv. [论文] [回购协议]
[2023/08] Fuzz4All：使用大型语言模型进行通用模糊测试。夏等人。国际科学教育协会。 [论文] [回购协议]
[2023/07]通过使用大型语言模型生成有效的见证程序来隔离编译器错误。图等人。 IEEE 传输。软件工程。 [论文] [回购协议]
[2023/06]提示就是您所需要的：使用大型语言模型自动重放 Android Bug。冯等人。国际科学教育协会。 [论文] [回购协议]

调试

故障定位

[2024/11] FlexFL：利用开源大型语言模型进行灵活有效的故障定位Xu 等人。 arXiv [论文]
[2024/09]通过使用 LLM 代理和自我反思的有序代码分析来增强故障定位Rafi 等人。 arXiv [论文]
[2024/03] AGENTFL：将基于 LLM 的故障定位扩展到项目级上下文。秦等人。 arXiv. [纸]
[2023/10] RCAgent：使用工具增强大型语言模型的自治代理进行云根本原因分析。王等人。 arXiv. [纸]
[2023/08]基于法学硕士的可解释故障定位的定量和定性评估。康等人。 FSE。 [纸]

程序修复

[2024/07] OPENHANDS：为人工智能软件开发者提供通用代理的开放平台Wang 等人。 arXiv [论文] [存储库]
[2024/10]使用大型语言模型进行高效程序修复的语义引导搜索Thanh 等人。 arXiv [论文]
[2024/09]测试不稳定的神经符号修复。陈等人。 ISSTA。 [纸]
[2024/04]实用的功能级程序修复能走多远？翔等人。 arXiv. [论文] [回购协议]
[2024/03] RepairAgent：基于 LLM 的程序修复自主代理。布泽尼亚等人。 arXiv. [纸]
[2024/03] ACFIX：指导法学硕士利用挖掘的通用 RBAC 实践对智能合约中的访问控制漏洞进行上下文感知修复。张等人。 arXiv. [纸]
[2024/02] CigaR：利用法学硕士进行具有成本效益的程序修复。希德维吉等人。 arXiv. [论文] [回购协议]
[2023/04]通过大型语言模型驱动的科学调试进行可解释的自动调试。康等人。 arXiv. [纸]
[2023/04]保持对话继续：使用 ChatGPT 修复 337 个错误中的 162 个错误，每个错误 0.42 美元。夏等人。 arXiv. [纸]
[2023/01]对话式自动化程序修复。夏等人。 arXiv. [纸]

统一调试

[2024/04]通过基于 LLM 的多代理协同的统一调试方法。李等人。 arXiv. [论文] [回购协议]
[2024/02] LDB：通过逐步验证运行时执行的大型语言模型调试器。钟等人。 arXiv. [论文] [回购协议]

发布

[2024/08] GoNoGo：一种基于 LLM 的高效多代理系统，用于简化汽车软件发布决策Khoee 等人。 arXiv [论文]

端到端软件开发

[2024/09] 与 ChatGPT Zhu 等人生成 Java 代码配对。理论计算机科学[论文]
[2024/07]通过人机-人工智能团队合作赋能基于敏捷的生成式软件开发张等人。 TOSEM [论文] [repo]
[2024/06]多代理软件开发实验：迈向统一平台Sami 等人。 arXiv. [纸]
[2024/06]扩展基于大语言模型的多智能体协作Qian等人。 arXiv. [论文] [回购协议]
[2024/06]通过跨团队协作进行多代理软件开发。杜等人。 arXiv. [论文] [回购协议]
[2024/06] AgileCoder：基于敏捷方法论的软件开发动态协作代理。阮等人。 arXiv. [论文] [回购协议]
[2024/05]软件开发代理的迭代体验细化。钱等人。 arXiv. [纸]
[2024/03]当基于LLM的代码生成满足软件开发流程。林等人。 arXiv. [论文] [回购协议]
[2024/03] CodeS：通过多层 Sketch 将自然语言转换为代码存储库。赞等人。 arXiv. [论文] [回购协议]
[2024/02] CodePori：使用多代理进行自主软件开发的大规模模型。拉希德等人。 arXiv. [纸]
[2024/01]用法学硕士实验新的编程实践。张等人。 arXiv. [论文] [回购协议]
[2024/01] LLM4PLC：利用大型语言模型对工业控制系统中的 PLC 进行可验证编程。法基赫等人。国际科学教育协会。 [论文] [回购协议]
[2023/12]软件开发代理的体验式共同学习。钱等人。前交叉韧带。 [论文] [回购协议]
[2023/11]软件开发中的自主代理：愿景论文Rasheed 等人。 arXiv. [纸]
[2023/09] AutoAgents：自动代理生成框架。陈等人。 arXiv. [论文] [回购协议]
[2023/08] AgentVerse：促进多智能体协作并探索紧急行为。陈等人。 ICLR。 [论文] [回购协议]
[2023/08] METAGPT：多代理协作框架的元编程。洪等人。 ICLR。 [论文] [回购协议]
[2023/07]软件开发的通信代理。钱等人。前交叉韧带。 [论文] [回购协议]
[2023/06]多代理协作：利用智能 LLM 代理的力量。塔勒比拉德等人。 arXiv. [纸]
[2023/06] Prompt Sapper：法学硕士授权的 AI 原生服务软件工程基础设施。邢等人。 arXiv. [纸]
[2023/04]通过 ChatGPT 进行自协作代码生成。董等人。 arXiv. [论文] [回购协议]
[2023/04]低代码法学硕士：法学硕士可视化编程。蔡等人。 arXiv. [论文] [回购协议]

端到端软件维护

[2024/11]法学硕士作为持续学习者：改进软件问题中缺陷代码的再现Lin 等人。 arXiv [论文]
[2024/11]人机交互软件开发代理Takerngsaksiri 等人。 arXiv [论文]
[2024/11] Lingma SWE-GPT：一种用于自动化软件改进的以开放开发过程为中心的语言模型Ma 等人。 arXiv [论文] [存储库]
[2024/10] RepoGraph：利用存储库级代码图增强人工智能软件工程Ouyang et al. arXiv [论文] [存储库]
[2024/09] MarsCode Agent：AI 原生自动错误修复Liu 等人arXiv. [纸]
[2024/08] CODEXGRAPH：通过代码图数据库桥接大型语言模型和代码存储库Liu 等人。 arXiv. [论文] [回购协议]
[2024/08]多样性赋予智慧：整合软件工程代理的专业知识张等人。 arXiv. [纸]
[2024/08] SpecRover：通过法学硕士Ruan 等人进行代码意图提取。 arXiv. [论文] [回购协议]
[2024/07] OPENHANDS：为人工智能软件开发者提供通用代理的开放平台Wang 等人。 arXiv [论文] [存储库]
[2024/07]无代理：揭秘基于 LLM 的软件工程代理。夏等人。 arXiv. [论文] [回购协议]
[2024/06]如何理解整个软件存储库？马等人。 arXiv. [论文] [回购协议]
[2024/06]编码器：使用多代理和任务图解决问题。陈等人。 arXiv. [论文] [回购协议]
[2024/06] MASAI：软件工程人工智能代理的模块化架构。阿罗拉等人。 arXiv. [纸]
[2024/05] SWE-AGENT：代理计算机接口支持自动化软件工程。杨等人。 arXiv. [论文] [回购协议]
[2024/04] AutoCodeRover：自主程序改进。张等人。 ISSTA。 [论文] [回购协议]
[2024/03] MAGIS：基于 LLM 的多代理框架，用于 GitHub 问题解决方案。陶等人。 arXiv. [纸]

基准

[2024/10] SWE-Bench+：法学硕士Aleithan 等人的增强编码基准。 arXiv. [纸]
[2024/10] SWE-bench 多模式：人工智能系统是否可以推广到可视化软件领域？杨等人。 arXiv. [论文] [回购协议]
[2024/08] SWE-bench-java：Java Zan 等人的 GitHub 问题解决基准。 arXiv [论文] [存储库]
[2024/07]无代理：揭秘基于 LLM 的软件工程代理。夏等人。 arXiv. [论文] [回购协议]
[2023/10] Swe-bench：语言模型能否解决现实世界的 github 问题？希门尼斯等人。 ICLR [论文] [存储库]

代理商观点

代理框架

规划

单轮规划

[2024/06] AgileCoder：基于敏捷方法论的软件开发动态协作代理。阮等人。 arXiv. [论文] [回购协议]
[2024/06]通过跨团队协作进行多代理软件开发。杜等人。 arXiv. [论文] [回购协议]
[2024/05] MapCoder：用于解决竞争性问题的多代理代码生成。伊斯兰等人。前交叉韧带。 [论文] [回购协议]
[2024/03] MAGIS：基于 LLM 的多代理框架，用于 GitHub 问题解决方案。陶等人。 arXiv. [纸]
[2024/03] CodeS：通过多层 Sketch 将自然语言转换为代码存储库。赞等人。 arXiv. [论文] [回购协议]
[2024/03] CoCoST：通过在线搜索和正确性测试自动生成复杂代码。他等人。 arXiv. [纸]
[2024/02] CodePori：使用多代理进行自主软件开发的大规模模型。拉希德等人。 arXiv. [纸]
[2024/01] CodeAgent：利用工具集成的代理系统增强代码生成，应对现实世界的回购级编码挑战。张等人。前交叉韧带。 [纸]
[2024/01] LLM4PLC：利用大型语言模型对工业控制系统中的 PLC 进行可验证编程。法基赫等人。国际科学教育协会。 [论文] [回购协议]
[2024/01]用法学硕士实验新的编程实践。张等人。 arXiv. [论文] [回购协议]
[2023/11]软件开发中的自主代理：愿景论文Rasheed 等人。 arXiv. [纸]
[2023/10] AI时代的静态代码分析：深入探讨智能代码分析的概念、功能和潜力。范等人。 arXiv. [纸]
[2023/09] Parsel？：通过组合分解进行语言模型的算法推理。泽利克曼等人。神经信息处理系统。 [论文] [回购协议]
[2023/08] PENTESTGPT：LLM授权的自动渗透测试工具。邓等人。 arXiv. [论文] [回购协议]
[2023/08]流程：推理和协作人工智能的构建模块。约西福斯基等人。 arXiv. [论文] [回购协议]
[2023/08] METAGPT：多代理协作框架的元编程。洪等人。 ICLR。 [论文] [回购协议]
[2023/07]软件开发的通信代理。钱等人。前交叉韧带。 [论文] [回购协议]
[2023/04]通过 ChatGPT 进行自协作代码生成。董等人。 arXiv. [论文] [回购协议]
[2023/04]低代码法学硕士：法学硕士可视化编程。蔡等人。 arXiv. [论文] [回购协议]

多轮规划

[2024/03] RAT：检索增强思维在长视野生成中引发上下文感知推理。王等人。 arXiv. [论文] [回购协议]

类似反应

[2024/06] MASAI：软件工程人工智能代理的模块化架构。阿罗拉等人。 arXiv. [纸]
[2024/02]可执行代码操作引出更好的 LLM 代理。王等人。 ICML。 [论文] [回购协议]
[2024/01] CodeAgent：利用工具集成的代理系统增强代码生成，应对现实世界的回购级编码挑战。张等人。前交叉韧带。 [纸]
[2024/01] XUAT-Copilot：使用大型语言模型进行自动用户验收测试的多代理协作系统。王等人。 arXiv. [纸]
[2023/11]使用自主大型语言模型代理进行意图驱动的移动 GUI 测试。尹等人。国际科学技术委员会。 [论文] [回购协议]
[2023/10] RCAgent：使用工具增强大型语言模型的自治代理进行云根本原因分析。王等人。 arXiv. [纸]
[2023/10]语言代理树搜索统一了语言模型中的推理、执行和规划。周等人。 ICML。 [论文] [回购协议]
[2023/10] AXNav：重播自然语言的辅助功能测试。泰布等人。气。 [纸]
[2023/09] CodePlan：使用法学硕士和规划进行存储库级编码。拜里等人。 FSE。 [论文] [回购协议]

分层

[2024/04]自组织代理：面向超大规模代码生成和优化的 LLM 多代理框架。石桥等人。 arXiv. [论文] [回购协议]

记忆

长期记忆

[2024/06]扩展基于大语言模型的多智能体协作Qian等人。 arXiv. [论文] [回购协议]
[2024/06]通过跨团队协作进行多代理软件开发。杜等人。 arXiv. [论文] [回购协议]
[2024/05]软件开发代理的迭代体验细化。钱等人。 arXiv. [纸]
[2023/12]软件开发代理的体验式共同学习。钱等人。前交叉韧带。 [论文] [回购协议]
[2023/11]使用自主大型语言模型代理进行意图驱动的移动 GUI 测试。尹等人。国际科学技术委员会。 [论文] [回购协议]
[2023/09] AutoAgents：自动代理生成框架。陈等人。 arXiv. [论文] [回购协议]
[2023/08] METAGPT：多代理协作框架的元编程。洪等人。 ICLR。 [论文] [回购协议]
[2023/07]软件开发的通信代理。钱等人。前交叉韧带。 [论文] [回购协议]
[2023/03]反思：具有言语强化学习的语言代理。辛恩等人。神经信息处理系统。 [论文] [回购协议]

短期记忆

[2024/07]通过多模态大语言模型进行视觉驱动的自动化移动 GUI 测试。刘等人。 arXiv. [论文] [回购协议]
[2024/06]扩展基于大语言模型的多智能体协作Qian等人。 arXiv. [论文] [回购协议]
[2024/06]通过跨团队协作进行多代理软件开发。杜等人。 arXiv. [论文] [回购协议]
[2024/06] AgileCoder：基于敏捷方法论的软件开发动态协作代理。阮等人。 arXiv. [论文] [回购协议]
[2024/04]自组织代理：面向超大规模代码生成和优化的 LLM 多代理框架。石桥等人。 arXiv. [论文] [回购协议]
[2024/03] MAGIS：基于 LLM 的多代理框架，用于 GitHub 问题解决方案。陶等人。 arXiv. [纸]
[2024/01] XUAT-Copilot：使用大型语言模型进行自动用户验收测试的多代理协作系统。王等人。 arXiv. [纸]
[2023/12] E&V：通过伪代码执行和验证提示大型语言模型进行静态分析。郝等人。 arXiv. [纸]
[2023/11]使用自主大型语言模型代理进行意图驱动的移动 GUI 测试。尹等人。国际科学技术委员会。 [论文] [回购协议]
[2023/10] RCAgent：使用工具增强大型语言模型的自治代理进行云根本原因分析。王等人。 arXiv. [纸]
[2023/10] AI时代的静态代码分析：深入探讨智能代码分析的概念、功能和潜力。范等人。 arXiv. [纸]
[2023/10]让法学硕士成为测试专家：通过功能感知决策将类人交互引入移动 GUI 测试。刘等人。国际科学教育协会。 [纸]
[2023/09] CodePlan：使用法学硕士和规划进行存储库级编码。拜里等人。 FSE。 [论文] [回购协议]
[2023/09] AutoAgents：自动代理生成框架。陈等人。 arXiv. [论文] [回购协议]
[2023/08] METAGPT：多代理协作框架的元编程。洪等人。 ICLR。 [论文] [回购协议]
[2023/07]软件开发的通信代理。钱等人。前交叉韧带。 [论文] [回购协议]
[2023/03]反思：具有言语强化学习的语言代理。辛恩等人。神经信息处理系统。 [论文] [回购协议]

共享记忆：一种特殊的短期记忆

[2024/06] AgileCoder：基于敏捷方法论的软件开发动态协作代理。阮等人。 arXiv. [论文] [回购协议]
[2024/05] MARE：需求工程多代理协作框架。金等人。 arXiv. [纸]
[2024/03]当基于LLM的代码生成满足软件开发流程。林等人。 arXiv. [论文] [回购协议]
[2024/03] AGENTFL：将基于 LLM 的故障定位扩展到项目级上下文。秦等人。 arXiv. [纸]
[2023/08] METAGPT：多代理协作框架的元编程。洪等人。 ICLR。 [论文] [回购协议]
[2023/04]通过 ChatGPT 进行自协作代码生成。董等人。 arXiv. [论文] [回购协议]

洞察力

视觉输入

[2024/10] SWE-bench 多模式：人工智能系统是否可以推广到可视化软件领域？杨等人。 arXiv. [论文] [回购协议]
[2024/07]通过多模态大语言模型进行视觉驱动的自动化移动 GUI 测试。刘等人。 arXiv. [论文] [回购协议]
[2024/06]多代理软件开发实验：迈向统一平台Sami 等人。 arXiv. [纸]
[2024/01] XUAT-Copilot：使用大型语言模型进行自动用户验收测试的多代理协作系统。王等人。 arXiv. [纸]
[2023/10] AXNav：重播自然语言的辅助功能测试。泰布等人。气。 [纸]
[2023/10]测试极限：使用大型语言模型生成用于移动应用程序崩溃检测的异常文本输入。刘等人。国际科学教育协会。 [论文] [回购协议]
[2023/08] METAGPT：多代理协作框架的元编程。洪等人。 ICLR。 [论文] [回购协议]

行动

搜索工具

[2024/05]使用存储库上的迭代、工具增强推理从自然语言生成类级代码。德什潘德等人。 arXiv. [纸]
[2024/04] LLM 代理可以自主利用一日漏洞。方等人。 arXiv. [纸]
[2024/03] AutoDev：自动化人工智能驱动开发。图法诺等人。 arXiv [论文]
[2024/03] RepairAgent：基于 LLM 的程序修复自主代理。布泽尼亚等人。 arXiv. [纸]
[2024/03] CoCoST：通过在线搜索和正确性测试自动生成复杂代码。他等人。 arXiv. [纸]
[2024/03] RAT：检索增强思维在长视野生成中引发上下文感知推理。王等人。 arXiv. [论文] [回购协议]
[2024/02] CodePori：使用多代理进行自主软件开发的大规模模型。拉希德等人。 arXiv. [纸]
[2024/01] LLM4Vuln：解耦和增强法学硕士漏洞推理的统一评估框架。孙等人。 arXiv. [论文] [回购协议]
[2024/01] CodeAgent：利用工具集成的代理系统增强代码生成，应对现实世界的回购级编码挑战。张等人。前交叉韧带。 [纸]
[2023/12] E&V：通过伪代码执行和验证提示大型语言模型进行静态分析。郝等人。 arXiv. [纸]
[2023/12]软件开发代理的体验式共同学习。钱等人。前交叉韧带。 [论文] [回购协议]
[2023/11]使用自主大型语言模型代理进行意图驱动的移动 GUI 测试。尹等人。国际科学技术委员会。 [论文] [回购协议]
[2023/10]狐猴：协调自然语言和语言代理代码。徐等人。 ICLR。 [论文] [回购协议]
[2023/10] RCAgent：使用工具增强大型语言模型的自治代理进行云根本原因分析。王等人。 arXiv. [纸]
[2023/10] AI时代的静态代码分析：深入探讨智能代码分析的概念、功能和潜力。范等人。 arXiv. [纸]
[2023/08] METAGPT：多代理协作框架的元编程。洪等人。 ICLR。 [论文] [回购协议]
[2023/08] PENTESTGPT：LLM授权的自动渗透测试工具。邓等人。 arXiv. [论文] [回购协议]
[2023/08] AgentVerse：促进多智能体协作并探索紧急行为。陈等人。 ICLR。 [论文] [回购协议]
[2023/08] Gentopia：工具增强法学硕士协作平台。徐等人。 EMNLP。 [论文] [回购协议]
[2023/08] AutoGen：通过多代理对话启用下一代 LLM 应用程序。吴等人。 arXiv. [论文] [回购协议]
[2023/05] ToolCoder：教代码生成模型使用 API 搜索工具。张等人。 arXiv. [纸]
[2023/03] ART：大型语言模型的自动多步推理和工具使用。帕兰贾普等人。 arXiv. [论文] [回购协议]

文件操作

[2024/08] SpecRover：通过法学硕士Ruan 等人进行代码意图提取。 arXiv. [论文] [回购协议]
[2024/06] MASAI：软件工程人工智能代理的模块化架构。阿罗拉等人。 arXiv. [纸]
[2024/05]用于检测安全漏洞的法学硕士辅助静态分析。李等人。 arXiv. [纸]
[2024/05] SWE-AGENT：代理计算机接口支持自动化软件工程。杨等人。 arXiv. [论文] [回购协议]
[2024/04] LLM 代理可以自主利用一日漏洞。方等人。 arXiv. [纸]
[2024/03] RepairAgent：基于 LLM 的程序修复自主代理。布泽尼亚等人。 arXiv. [纸]
[2024/03] AutoDev：自动化人工智能驱动开发。图法诺等人。 arXiv [论文]
[2023/04]通过大型语言模型驱动的科学调试进行可解释的自动调试。康等人。 arXiv. [纸]

图形化操作

[2024/07]通过多模态大语言模型进行视觉驱动的自动化移动 GUI 测试。刘等人。 arXiv. [论文] [回购协议]
[2024/01] XUAT-Copilot：使用大型语言模型进行自动用户验收测试的多代理协作系统。王等人。 arXiv. [纸]
[2023/10]让法学硕士成为测试专家：通过功能感知决策将类人交互引入移动 GUI 测试。刘等人。国际科学教育协会。 [纸]
[2023/10] AXNav：重播自然语言的辅助功能测试。泰布等人。气。 [纸]
[2023/10]测试极限：使用大型语言模型生成用于移动应用程序崩溃检测的异常文本输入。刘等人。国际科学教育协会。 [论文] [回购协议]
[2023/06]提示就是您所需要的：使用大型语言模型自动重放 Android Bug。冯等人。国际科学教育协会。 [论文] [回购协议]

静态程序分析

[2024/06]通过跨团队协作进行多代理软件开发。杜等人。 arXiv. [论文] [回购协议]
[2024/06] AgileCoder：基于敏捷方法论的软件开发动态协作代理。阮等人。 arXiv. [论文] [回购协议]
[2024/06] MASAI：软件工程人工智能代理的模块化架构。阿罗拉等人。 arXiv. [纸]
[2024/05]使用存储库上的迭代、工具增强推理从自然语言生成类级代码。德什潘德等人。 arXiv. [纸]
[2024/05]用于检测安全漏洞的法学硕士辅助静态分析。李等人。 arXiv. [纸]
[2024/04] AutoCodeRover：自主程序改进。张等人。 ISSTA。 [论文] [回购协议]
[2024/04]通过程序分析增强难以覆盖分支的基于 LLM 的测试生成。杨等人。 arXiv. [纸]
[2024/04] 3DGen：人工智能辅助生成可证明正确的二进制格式解析器。法库里等人。 arXiv [论文]
[2024/03] AutoDev：自动化人工智能驱动开发。图法诺等人。 arXiv [论文]
[2024/03] RepairAgent：基于 LLM 的程序修复自主代理。布泽尼亚等人。 arXiv. [纸]
[2024/03] COVERUP：覆盖率引导的基于 LLM 的测试生成。皮佐诺等人。 arXiv. [论文] [回购协议]
[2024/03] ACFIX：指导法学硕士利用挖掘的通用 RBAC 实践对智能合约中的访问控制漏洞进行上下文感知修复。张等人。 arXiv. [纸]
[2024/03] AGENTFL：将基于 LLM 的故障定位扩展到项目级上下文。秦等人。 arXiv. [纸]
[2024/02]当数据流分析遇到大型语言模型。王等人。 arXiv. [纸]
[2024/02] LDB：通过逐步验证运行时执行的大型语言模型调试器。钟等人。 arXiv. [论文] [回购协议]
[2024/01]教授代码法学硕士在存储库级代码生成中使用自动完成工具。王等人。 arXiv. [纸]
[2024/01] CodeAgent：利用工具集成的代理系统增强代码生成，应对现实世界的回购级编码挑战。张等人。前交叉韧带。 [纸]
[2024/01] LLM4PLC：利用大型语言模型对工业控制系统中的 PLC 进行可验证编程。法基赫等人。国际科学教育协会。 [论文] [回购协议]
[2023/12] E&V：通过伪代码执行和验证提示大型语言模型进行静态分析。郝等人。 arXiv. [纸]
[2023/09] CodePlan：使用法学硕士和规划进行存储库级编码。拜里等人。 FSE。 [论文] [回购协议]
[2023/08] CodeCoT：解决代码生成 CoT 推理中的代码语法错误。黄等人。 arXiv. [纸]
[2023/07]通过使用大型语言模型生成有效的见证程序来隔离编译器错误。图等人。 IEEE 传输。软件工程.. [论文] [repo]
[2023/06]提示就是您所需要的：使用大型语言模型自动重放 Android Bug。冯等人。国际科学教育协会。 [论文] [回购协议]

动态分析

[2024/04]通过程序分析增强难以覆盖分支的基于 LLM 的测试生成。杨等人。 arXiv. [纸]
[2024/03] COVERUP：覆盖率引导的基于 LLM 的测试生成。皮佐诺等人。 arXiv. [论文] [回购协议]
[2024/03] AGENTFL：将基于 LLM 的故障定位扩展到项目级上下文。秦等人。 arXiv. [纸]
[2024/02] LDB：通过逐步验证运行时执行的大型语言模型调试器。钟等人。 arXiv. [论文] [回购协议]
[2023/07]通过使用大型语言模型生成有效的见证程序来隔离编译器错误。图等人。 IEEE 传输。软件工程.. [论文] [repo]
[2023/04]通过大型语言模型驱动的科学调试进行可解释的自动调试。康等人。 arXiv. [纸]

测试工具

[2024/09]测试不稳定的神经符号修复。陈等人。 ISSTA。 [纸]
[2024/08] SpecRover：通过法学硕士Ruan 等人进行代码意图提取。 arXiv. [论文] [回购协议]
[2024/06] AgileCoder：基于敏捷方法论的软件开发动态协作代理。阮等人。 arXiv. [论文] [回购协议]
[2024/06] MASAI：软件工程人工智能代理的模块化架构。阿罗拉等人。 arXiv. [纸]
[2024/05] AutoCoder：使用 AIEV-INSTRUCT 增强代码大型语言模型。雷等人。 arXiv. [论文] [回购协议]
[2024/05] MapCoder：用于解决竞争性问题的多代理代码生成。伊斯兰等人。前交叉韧带。 [论文] [回购协议]
[2024/04]自组织代理：面向超大规模代码生成和优化的 LLM 多代理框架。石桥等人。 arXiv. [论文] [回购协议]
[2024/04]通过基于 LLM 的多代理协同的统一调试方法。李等人。 arXiv. [论文] [回购协议]
[2024/04] LLM 代理可以自主利用一日漏洞。方等人。 arXiv. [纸]
[2024/04]通过程序分析增强难以覆盖分支的基于 LLM 的测试生成。杨等人。 arXiv. [纸]
[2024/04] 3DGen：人工智能辅助生成可证明正确的二进制格式解析器。法库里等人。 arXiv [论文]
[2024/04] AutoCodeRover：自主程序改进。张等人。 ISSTA。 [论文] [回购协议]
[2024/03] AutoDev：自动化人工智能驱动开发。图法诺等人。 arXiv [论文]
[2024/03]当基于LLM的代码生成满足软件开发流程。林等人。 arXiv. [论文] [回购协议]
[2024/03] RepairAgent：基于 LLM 的程序修复自主代理。布泽尼亚等人。 arXiv. [纸]
[2024/03] CoCoST：通过在线搜索和正确性测试自动生成复杂代码。他等人。 arXiv. [纸]
[2024/02]可执行代码操作引出更好的 LLM 代理。王等人。 ICML。 [论文] [回购协议]
[2024/02]代码生成的测试驱动开发。马修斯等人。 arXiv. [论文] [回购协议]
[2024/01]使用 AlphaCodium 生成代码：从即时工程到流程工程。里德尼克等人。 arXiv. [论文] [回购协议]
[2024/01]用法学硕士实验新的编程实践。张等人。 arXiv. [论文] [回购协议]
[2024/01] CodeAgent：利用工具集成的代理系统增强代码生成，应对现实世界的回购级编码挑战。张等人。前交叉韧带。 [纸]
[2023/12] AgentCoder：基于多代理的代码生成与迭代测试和优化。黄等人。 arXiv. [纸]
[2023/12] LLM4TDD：使用大型语言模型进行测试驱动开发的最佳实践。皮亚等人。 arXiv. [论文] [回购协议]
[2023/11] INTERVENOR：通过交互式修复链提升大型语言模型的编码能力。王等人。前交叉韧带。 [论文] [回购协议]
[2023/10] ClarifyGPT：通过意图澄清增强基于 LLM 的代码生成。穆等人。 arXiv. [论文] [回购协议]
[2023/10]狐猴：协调自然语言和语言代理代码。徐等人。 ICLR。 [论文] [回购协议]
[2023/10]大型语言模型支持的白盒编译器模糊测试。杨等人。 arXiv. [论文] [回购协议]
[2023/09]大型语言模型中测试用例驱动的编程理解，以实现更好的代码生成。田等人。 arXiv. [纸]
[2023/09] MINT：评估 LLMS 与工具和语言反馈的多轮交互。王等人。 ICLR。 [论文] [回购协议]
[2023/08] METAGPT：多代理协作框架的元编程。洪等人。 ICLR。 [论文] [回购协议]
[2023/08]使用预先训练的大型语言模型和突变测试生成有效的测试。达赫尔等人。信息。软件。技术。。 [论文] [回购协议]
[2023/08] AgentVerse：促进多智能体协作并探索紧急行为。陈等人。 ICLR。 [论文] [回购协议]
[2023/08] AutoGen：通过多代理对话启用下一代 LLM 应用程序。吴等人。 arXiv. [论文] [回购协议]
[2023/08]流程：推理和协作人工智能的构建模块。约西福斯基等人。 arXiv. [论文] [回购协议]
[2023/06] SELFEVOLVE：通过大型语言模型的代码演化框架。江等人。 arXiv. [纸]
[2023/06] InterCode：通过执行反馈对交互式编码进行标准化和基准测试。杨等人。神经信息处理系统。 [论文] [回购协议]
[2023/06]自我修复是代码生成的银弹吗？奥劳森等人。 ICLR。 [论文] [回购协议]
[2023/05]不再需要手动测试？评估和改进 ChatGPT 以生成单元测试。袁等人。 arXiv. [论文] [回购协议]
[2023/04]使用大型语言模型进行完全自主编程。利文采夫等人。杰科。 [纸]
[2023/04]通过大型语言模型驱动的科学调试进行可解释的自动调试。康等人。 arXiv. [纸]
[2023/03] ART：大型语言模型的自动多步推理和工具使用。帕兰贾普等人。 arXiv. [论文] [回购协议]
[2023/03]反思：具有言语强化学习的语言代理。辛恩等人。神经信息处理系统。 [论文] [回购协议]
[2023/02]使用大型语言模型自动生成单元测试的实证评估。谢弗等人。 IEEE 传输。软件工程.. [论文] [repo]
[2023/01]对话式自动化程序修复。夏等人。 arXiv. [纸]

故障定位工具

[2024/04] AutoCodeRover：自主程序改进。张等人。 ISSTA。 [论文] [回购协议]
[2024/03] RepairAgent：基于 LLM 的程序修复自主代理。布泽尼亚等人。 arXiv. [纸]

多代理系统

代理角色

经理角色

[2024/06] AgileCoder：基于敏捷方法论的软件开发动态协作代理。阮等人。 arXiv. [论文] [回购协议]
[2024/05]软件开发代理的迭代体验细化。钱等人。 arXiv. [纸]
[2024/05] MapCoder：用于解决竞争性问题的多代理代码生成。伊斯兰等人。前交叉韧带。 [论文] [回购协议]
[2024/04]自组织代理：面向超大规模代码生成和优化的 LLM 多代理框架。石桥等人。 arXiv. [论文] [回购协议]
[2024/04] 3DGen：人工智能辅助生成可证明正确的二进制格式解析器。法库里等人。 arXiv [论文]
[2024/03] MAGIS：基于 LLM 的多代理框架，用于 GitHub 问题解决方案。陶等人。 arXiv. [纸]
[2024/03]当基于LLM的代码生成满足软件开发流程。林等人。 arXiv. [论文] [回购协议]
[2024/02] CodeAgent：软件工程协作代理。唐等人。 arXiv. [论文] [回购协议]
[2024/02] CodePori：使用多代理进行自主软件开发的大规模模型。拉希德等人。 arXiv. [纸]
[2023/12]软件开发代理的体验式共同学习。钱等人。前交叉韧带。 [论文] [回购协议]
[2023/11]软件开发中的自主代理：愿景论文Rasheed 等人。 arXiv. [纸]
[2023/11]使用自主大型语言模型代理进行意图驱动的移动 GUI 测试。尹等人。国际科学技术委员会。 [论文] [回购协议]
[2023/10] AXNav：重播自然语言的辅助功能测试。泰布等人。气。 [纸]
[2023/10] RCAgent：使用工具增强大型语言模型的自治代理进行云根本原因分析。王等人。 arXiv. [纸]
[2023/09] AutoAgents：自动代理生成框架。陈等人。 arXiv. [论文] [回购协议]
[2023/08] METAGPT：多代理协作框架的元编程。洪等人。 ICLR。 [论文] [回购协议]
[2023/04]低代码法学硕士：法学硕士可视化编程。蔡等人。 arXiv. [论文] [回购协议]
[2023/03] CAMEL：大语言模型社会“心灵”探索的交流代理。李等人。神经信息处理系统。 [论文] [回购协议]

需求分析角色

[2024/06]多代理软件开发实验：迈向统一平台Sami 等人。 arXiv. [纸]
[2024/06] AgileCoder：基于敏捷方法论的软件开发动态协作代理。阮等人。 arXiv. [论文] [回购协议]
[2024/05] MARE：需求工程多代理协作框架。金等人。 arXiv. [纸]
[2024/04] Elicitron：用于设计需求获取的基于 LLM 代理的仿真框架。阿泰伊等人。 arXiv. [纸]
[2024/03]当基于LLM的代码生成满足软件开发流程。林等人。 arXiv. [论文] [回购协议]
[2024/01]用法学硕士实验新的编程实践。张等人。 arXiv. [论文] [回购协议]
[2023/11]软件开发中的自主代理：愿景论文Rasheed 等人。 arXiv. [纸]
[2023/10] AI时代的静态代码分析：深入探讨智能代码分析的概念、功能和潜力。范等人。 arXiv. [纸]
[2023/08] METAGPT：多代理协作框架的元编程。洪等人。 ICLR。 [论文] [回购协议]
[2023/06]多代理协作：利用智能 LLM 代理的力量。塔勒比拉德等人。 arXiv. [纸]
[2023/04]通过 ChatGPT 进行自协作代码生成。董等人。 arXiv. [论文] [回购协议]
[2023/03] CAMEL：大语言模型社会“心灵”探索的交流代理。李等人。神经信息处理系统。 [论文] [回购协议]

设计师角色

[2024/06]多代理软件开发实验：迈向统一平台Sami 等人。 arXiv. [纸]
[2024/03]当基于LLM的代码生成满足软件开发流程。林等人。 arXiv. [论文] [回购协议]
[2024/01]用法学硕士实验新的编程实践。张等人。 arXiv. [论文] [回购协议]
[2023/11]软件开发中的自主代理：愿景论文Rasheed 等人。 arXiv. [纸]
[2023/08] METAGPT：多代理协作框架的元编程。洪等人。 ICLR。 [论文] [回购协议]
[2023/08] AgentVerse：促进多智能体协作并探索紧急行为。陈等人。 ICLR。 [论文] [回购协议]
[2023/07]软件开发的通信代理。钱等人。前交叉韧带。 [论文] [回购协议]
[2023/06]多代理协作：利用智能 LLM 代理的力量。塔勒比拉德等人。 arXiv. [纸]

开发者角色

[2024/06]多代理软件开发实验：迈向统一平台Sami 等人。 arXiv. [纸]
[2024/06] AgileCoder：基于敏捷方法论的软件开发动态协作代理。阮等人。 arXiv. [论文] [回购协议]
[2024/05] AutoCoder：使用 AIEV-INSTRUCT 增强代码大型语言模型。雷等人。 arXiv. [论文] [回购协议]
[2024/05] MapCoder：用于解决竞争性问题的多代理代码生成。伊斯兰等人。前交叉韧带。 [论文] [回购协议]
[2024/04]自组织代理：面向超大规模代码生成和优化的 LLM 多代理框架。石桥等人。 arXiv. [论文] [回购协议]
[2024/04] 3DGen：人工智能辅助生成可证明正确的二进制格式解析器。法库里等人。 arXiv [论文]
[2024/03] CodeS：通过多层 Sketch 将自然语言转换为代码存储库。赞等人。 arXiv. [论文] [回购协议]
[2024/03] MAGIS：基于 LLM 的多代理框架，用于 GitHub 问题解决方案。陶等人。 arXiv. [纸]
[2024/03]当基于LLM的代码生成满足软件开发流程。林等人。 arXiv. [论文] [回购协议]
[2024/02]代码生成的测试驱动开发。马修斯等人。 arXiv. [论文] [回购协议]
[2024/02] CodePori：使用多代理进行自主软件开发的大规模模型。拉希德等人。 arXiv. [纸]
[2024/01]用法学硕士实验新的编程实践。张等人。 arXiv. [论文] [回购协议]
[2023/12] AgentCoder：基于多代理的代码生成与迭代测试和优化。黄等人。 arXiv. [纸]
[2023/11]软件开发中的自主代理：愿景论文Rasheed 等人。 arXiv. [纸]
[2023/11] INTERVENOR：通过交互式修复链提升大型语言模型的编码能力。王等人。前交叉韧带。 [论文] [回购协议]
[2023/08] AutoGen：通过多代理对话启用下一代 LLM 应用程序。吴等人。 arXiv. [论文] [回购协议]
[2023/08] METAGPT：多代理协作框架的元编程。洪等人。 ICLR。 [论文] [回购协议]
[2023/08] AgentVerse：促进多智能体协作并探索紧急行为。陈等人。 ICLR。 [论文] [回购协议]
[2023/07]软件开发的通信代理。钱等人。前交叉韧带。 [论文] [回购协议]
[2023/06]自我修复是代码生成的银弹吗？奥劳森等人。 ICLR。 [论文] [回购协议]
[2023/06]多代理协作：利用智能 LLM 代理的力量。塔勒比拉德等人。 arXiv. [纸]
[2023/05]自我编辑：用于代码生成的故障感知代码编辑器。张等人。前交叉韧带。 [纸]
[2023/04]通过 ChatGPT 进行自协作代码生成。董等人。 arXiv. [论文] [回购协议]
[2023/03] CAMEL：大语言模型社会“心灵”探索的交流代理。李等人。神经信息处理系统。 [论文] [回购协议]

软件质量保证角色

[2024/08] SpecRover：通过法学硕士Ruan 等人进行代码意图提取。 arXiv. [论文] [回购协议]
[2024/07]通过多模态大语言模型进行视觉驱动的自动化移动 GUI 测试。刘等人。 arXiv. [论文] [回购协议]
[2024/06]多代理软件开发实验：迈向统一平台Sami 等人。 arXiv. [纸]
[2024/06]通过跨团队协作进行多代理软件开发。杜等人。 arXiv. [论文] [回购协议]
[2024/06] AgileCoder：基于敏捷方法论的软件开发动态协作代理。阮等人。 arXiv. [论文] [回购协议]
[2024/06] MASAI：软件工程人工智能代理的模块化架构。阿罗拉等人。 arXiv. [纸]
[2024/05] AutoCoder：使用 AIEV-INSTRUCT 增强代码大型语言模型。雷等人。 arXiv. [论文] [回购协议]
[2024/05] MapCoder：用于解决竞争性问题的多代理代码生成。伊斯兰等人。前交叉韧带。 [论文] [回购协议]
[2024/04]法学硕士人工智能驱动的代码审查：早期结果。拉希德等人。 arXiv. [纸]
[2024/04] 3DGen：人工智能辅助生成可证明正确的二进制格式解析器。法库里等人。 arXiv [论文]
[2024/04]通过基于 LLM 的多代理协同的统一调试方法。李等人。 arXiv. [论文] [回购协议]
[2024/04]实用的功能级程序修复能走多远？翔等人。 arXiv. [论文] [回购协议]
[2024/03] MAGIS：基于 LLM 的多代理框架，用于 GitHub 问题解决方案。陶等人。 arXiv. [纸]
[2024/03] AGENTFL：将基于 LLM 的故障定位扩展到项目级上下文。秦等人。 arXiv. [纸]
[2024/03]将微调和基于 LLM 的代理相结合，进行直观的智能合约审计和论证。马等人。 arXiv. [论文] [回购协议]
[2024/03]当基于LLM的代码生成满足软件开发流程。林等人。 arXiv. [论文] [回购协议]
[2024/03] ACFIX：指导法学硕士利用挖掘的通用 RBAC 实践对智能合约中的访问控制漏洞进行上下文感知修复。张等人。 arXiv. [纸]
[2024/02] CodeAgent：软件工程协作代理。唐等人。 arXiv. [论文] [回购协议]
[2024/02]代码生成的测试驱动开发。马修斯等人。 arXiv. [论文] [回购协议]
[2024/02] CodePori：使用多代理进行自主软件开发的大规模模型。拉希德等人。 arXiv. [纸]
[2024/01] XUAT-Copilot：使用大型语言模型进行自动用户验收测试的多代理协作系统。王等人。 arXiv. [纸]
[2023/12] AgentCoder：基于多代理的代码生成与迭代测试和优化。黄等人。 arXiv. [纸]
[2023/11]软件开发中的自主代理：愿景论文Rasheed 等人。 arXiv. [纸]
[2023/11]使用自主大型语言模型代理进行意图驱动的移动 GUI 测试。尹等人。国际科学技术委员会。 [论文] [回购协议]
[2023/10]大语言模型驱动的智能合约漏洞检测：新视角。胡等人。 TPS-ISA。 [论文] [回购协议]
[2023/10] AI时代的静态代码分析：深入探讨智能代码分析的概念、功能和潜力。范等人。 arXiv. [纸]
[2023/10]大型语言模型支持的白盒编译器模糊测试。杨等人。 arXiv. [论文] [回购协议]
[2023/10] AXNav：重播自然语言的辅助功能测试。泰布等人。气。 [纸]
[2023/08] AutoGen：通过多代理对话启用下一代 LLM 应用程序。吴等人。 arXiv. [论文] [回购协议]
[2023/08] METAGPT：多代理协作框架的元编程。洪等人。 ICLR。 [论文] [回购协议]
[2023/07]软件开发的通信代理。钱等人。前交叉韧带。 [论文] [回购协议]
[2023/06]自我修复是代码生成的银弹吗？奥劳森等人。 ICLR。 [论文] [回购协议]
[2023/06]多代理协作：利用智能 LLM 代理的力量。塔勒比拉德等人。 arXiv. [纸]
[2023/05]自我编辑：用于代码生成的故障感知代码编辑器。张等人。前交叉韧带。 [纸]
[2023/03] CAMEL：大语言模型社会“心灵”探索的交流代理。李等人。神经信息处理系统。 [论文] [回购协议]

助理角色

[2024/08]多样性赋予智慧：整合软件工程代理的专业知识张等人。 arXiv. [纸]
[2024/08] SpecRover：通过法学硕士Ruan 等人进行代码意图提取。 arXiv. [论文] [回购协议]
[2024/06] MASAI：软件工程人工智能代理的模块化架构。阿罗拉等人。 arXiv. [纸]
[2024/05] MapCoder：用于解决竞争性问题的多代理代码生成。伊斯兰等人。前交叉韧带。 [论文] [回购协议]
[2024/03] MAGIS：基于 LLM 的多代理框架，用于 GitHub 问题解决方案。陶等人。 arXiv. [纸]
[2024/03] CodeS：通过多层 Sketch 将自然语言转换为代码存储库。赞等人。 arXiv. [论文] [回购协议]
[2024/03]将微调和基于 LLM 的代理相结合，进行直观的智能合约审计和论证。马等人。 arXiv. [论文] [回购协议]
[2023/10] AI时代的静态代码分析：深入探讨智能代码分析的概念、功能和潜力。范等人。 arXiv. [纸]

协作机制

分层结构

[2024/08]多样性赋予智慧：整合软件工程代理的专业知识张等人。 arXiv. [纸]
[2024/08] SpecRover：通过法学硕士Ruan 等人进行代码意图提取。 arXiv. [论文] [回购协议]
[2024/06]多代理软件开发实验：迈向统一平台Sami 等人。 arXiv. [纸]
[2024/06]扩展基于大语言模型的多智能体协作Qian等人。 arXiv. [论文] [回购协议]
[2024/06]通过跨团队协作进行多代理软件开发。杜等人。 arXiv. [论文] [回购协议]
[2024/06] AgileCoder：基于敏捷方法论的软件开发动态协作代理。阮等人。 arXiv. [论文] [回购协议]
[2024/05] MapCoder：用于解决竞争性问题的多代理代码生成。伊斯兰等人。前交叉韧带。 [论文] [回购协议]
[2024/05] MARE：需求工程多代理协作框架。金等人。 arXiv. [纸]
[2024/04] AutoCodeRover：自主程序改进。张等人。 ISSTA。 [论文] [回购协议]
[2024/04]实用的功能级程序修复能走多远？翔等人。 arXiv. [论文] [回购协议]
[2024/03] CodeS：通过多层 Sketch 将自然语言转换为代码存储库。赞等人。 arXiv. [论文] [回购协议]
[2024/03]当基于LLM的代码生成满足软件开发流程。林等人。 arXiv. [论文] [回购协议]
[2024/03] AGENTFL：将基于 LLM 的故障定位扩展到项目级上下文。秦等人。 arXiv. [纸]
[2024/02]当数据流分析遇到大型语言模型。王等人。 arXiv. [纸]
[2024/02] CodeAgent：软件工程协作代理。唐等人。 arXiv. [论文] [回购协议]
[2024/02]您需要更多代理。李等人。 arXiv. [纸]
[2024/01]用法学硕士实验新的编程实践。张等人。 arXiv. [论文] [回购协议]
[2023/11]软件开发中的自主代理：愿景论文Rasheed 等人。 arXiv. [纸]
[2023/10] AI时代的静态代码分析：深入探讨智能代码分析的概念、功能和潜力。范等人。 arXiv. [纸]
[2023/10]大语言模型驱动的智能合约漏洞检测：新视角。胡等人。 TPS-ISA。 [论文] [回购协议]
[2023/10]大型语言模型支持的白盒编译器模糊测试。杨等人。 arXiv. [论文] [回购协议]
[2023/10]动态 LLM-代理网络：具有代理团队优化功能的 LLM-代理协作框架。刘等人。 arXiv. [论文] [回购协议]
[2023/08] METAGPT：多代理协作框架的元编程。洪等人。 ICLR。 [论文] [回购协议]
[2023/08]流程：推理和协作人工智能的构建模块。约西福斯基等人。 arXiv. [论文] [回购协议]
[2023/07]软件开发的通信代理。钱等人。前交叉韧带。 [论文] [回购协议]
[2023/05]自我编辑：用于代码生成的故障感知代码编辑器。张等人。前交叉韧带。纸
[2023/04]低代码法学硕士：法学硕士可视化编程。蔡等人。 arXiv. [论文] [回购协议]

圆形结构

[2024/05] AutoCoder：使用 AIEV-INSTRUCT 增强代码大型语言模型。雷等人。 arXiv. [论文] [回购协议]
[2024/04]通过基于 LLM 的多代理协同的统一调试方法。李等人。 arXiv. [论文] [回购协议]
[2024/03] ACFIX：指导法学硕士利用挖掘的通用 RBAC 实践对智能合约中的访问控制漏洞进行上下文感知修复。张等人。 arXiv. [纸]
[2024/03]通过法学硕士讨论达成多角色共识以进行漏洞检测。毛等人。 QRS波。 [纸]
[2024/03]将微调和基于 LLM 的代理相结合，进行直观的智能合约审计和论证。马等人。 arXiv. [论文] [回购协议]
[2024/02]代码生成的测试驱动开发。马修斯等人。 arXiv. [论文] [回购协议]
[2024/02] CodePori：使用多代理进行自主软件开发的大规模模型。拉希德等人。 arXiv. [纸]
[2023/12]软件开发代理的体验式共同学习。钱等人。前交叉韧带。 [论文] [回购协议]
[2023/12] AgentCoder：基于多代理的代码生成与迭代测试和优化。黄等人。 arXiv. [纸]
[2023/11] INTERVENOR：通过交互式修复链提升大型语言模型的编码能力。王等人。前交叉韧带。 [论文] [回购协议]
[2023/11]使用自主大型语言模型代理进行意图驱动的移动 GUI 测试。尹等人。国际科学技术委员会。 [论文] [回购协议]
[2023/10] AXNav：重播自然语言的辅助功能测试。泰布等人。气。 [纸]
[2023/06]自我修复是代码生成的银弹吗？奥劳森等人。 ICLR。 [论文] [回购协议]
[2023/03] CAMEL：大语言模型社会“心灵”探索的交流代理。李等人。神经信息处理系统。 [论文] [回购协议]
[2023/03]反思：具有言语强化学习的语言代理。辛恩等人。神经信息处理系统。 [论文] [回购协议]

树状结构

[2024/06]扩展基于大语言模型的多智能体协作Qian等人。 arXiv. [论文] [回购协议]
[2024/06] MASAI：软件工程人工智能代理的模块化架构。阿罗拉等人。 arXiv. [纸]
[2024/04]自组织代理：面向超大规模代码生成和优化的 LLM 多代理框架。石桥等人。 arXiv. [论文] [回购协议]

星状结构

[2024/06]扩展基于大语言模型的多智能体协作Qian等人。 arXiv. [论文] [回购协议]
[2024/03] AutoDev：自动化人工智能驱动开发。图法诺等人。 arXiv [论文]
[2024/01] XUAT-Copilot：使用大型语言模型进行自动用户验收测试的多代理协作系统。王等人。 arXiv. [纸]
[2023/10] RCAgent：使用工具增强大型语言模型的自治代理进行云根本原因分析。王等人。 arXiv. [纸]
[2023/08] AutoGen：通过多代理对话启用下一代 LLM 应用程序。吴等人。 arXiv. [论文] [回购协议]

网状结构

[2024/06]扩展基于大语言模型的多智能体协作Qian等人。 arXiv. [论文] [回购协议]
[2024/04] 3DGen：人工智能辅助生成可证明正确的二进制格式解析器。法库里等人。 arXiv [论文]

人机协作

人类代理

规划阶段

[2024/01]用法学硕士实验新的编程实践。张等人。 arXiv. [论文] [回购协议]
[2024/01] LLM4PLC：利用大型语言模型对工业控制系统中的 PLC 进行可验证编程。法基赫等人。国际科学教育协会。 [论文] [回购协议]
[2023/10] AI时代的静态代码分析：深入探讨智能代码分析的概念、功能和潜力。范等人。 arXiv. [纸]
[2023/04]低代码法学硕士：法学硕士可视化编程。蔡等人。 arXiv. [论文] [回购协议]

需求阶段

[2024/05] MARE：需求工程多代理协作框架。金等人。 arXiv. [纸]
[2024/02]可执行代码操作引出更好的 LLM 代理。王等人。 ICML。 [论文] [回购协议]
[2024/01]用法学硕士实验新的编程实践。张等人。 arXiv. [论文] [回购协议]
[2023/10] ClarifyGPT：通过意图澄清增强基于 LLM 的代码生成。穆等人。 arXiv. [论文] [回购协议]
[2023/06] Prompt Sapper：法学硕士授权的 AI 原生服务软件工程基础设施。邢等人。 arXiv. [纸]

开发阶段

[2024/03] CodeS：通过多层 Sketch 将自然语言转换为代码存储库。赞等人。 arXiv. [论文] [回购协议]
[2024/01] LLM4PLC：利用大型语言模型对工业控制系统中的 PLC 进行可验证编程。法基赫等人。国际科学教育协会。 [论文] [回购协议]
[2023/09] MINT：评估 LLMS 与工具和语言反馈的多轮交互。王等人。 ICLR。 [论文] [回购协议]
[2023/08]流程：推理和协作人工智能的构建模块。约西福斯基等人。 arXiv. [论文] [回购协议]
[2023/08] AutoGen：通过多代理对话启用下一代 LLM 应用程序。吴等人。 arXiv. [论文] [回购协议]

评估阶段

[2024/01]用法学硕士实验新的编程实践。张等人。 arXiv. [论文] [回购协议]
[2023/08] Gentopia：工具增强法学硕士协作平台。徐等人。 EMNLP。 [论文] [回购协议]
[2023/06] Prompt Sapper：法学硕士授权的 AI 原生服务软件工程基础设施。邢等人。 arXiv. [纸]
[2023/03] ART：大型语言模型的自动多步推理和工具使用。帕兰贾普等人。 arXiv. [论文] [回购协议]

引文

@misc{Agent4SE, title={基于大型语言模型的软件工程代理：调查}，
       作者={刘俊伟、王凯欣、陈逸轩、彭鑫、陈振鹏、张令明、楼一凌}，年份={2024}，eprint={2409.02977}，archivePrefix={arXiv}，primaryClass={cs.SE} ，url = {https://arxiv.org/abs/2409.02977}，
 }