Agent4SE Paper List下載 - Agent4SE Paper List原始碼下載

基於大型語言模型的軟體工程代理：調查

大型語言模型（LLM）的最新進展塑造了人工智慧代理的新範式，即基於 LLM 的代理。與獨立的法學碩士相比，基於法學碩士的代理透過增強法學碩士感知和利用外部資源和工具的能力，大大擴展了法學碩士的多功能性和專業知識。迄今為止，基於LLM的代理程式已在軟體工程（SE）領域中得到應用並顯示出顯著的效果。多個智能體和人類互動之間的協同作用為解決複雜的現實世界 SE 問題帶來了進一步的希望。在這項工作中，我們對基於 LLM 的 SE 代理進行了全面、系統化的調查。我們收集了 106 篇論文，並從 SE 和 Agent 兩個角度對它們進行分類。此外，我們也討論了這一關鍵領域的開放挑戰和未來方向。

？我們從軟體工程任務和Agent架構兩個角度系統地總結了Agent4SE的進展。

？論文連結：基於大型語言模型的軟體工程代理：調查

圖-20240921134539206

給這個倉庫加星標

這個研究領域正在迅速發展；給這個存儲庫加註星標以跟上更新！

訊息

[2024/09/04]我們在 arXiv 上發布了第一版調查。

SE觀點

SE_任務

需求工程

[2024/05] MARE：需求工程多代理協作框架。金等人。 arXiv. [紙]
[2024/04] Elicitron：用於設計需求獲取的基於 LLM 代理的模擬框架。阿泰伊等人。 arXiv. [紙]
[2024/01] SpecGen：透過大型語言模型自動產生正式程式規格。馬等人。 arXiv. [論文] [回購協議]
[2023/10]透過產生人工智慧推進需求工程：評估法學碩士的角色。阿羅拉等人。 arXiv. [紙]

程式碼生成

[2024/11]規劃驅動的程式設計：大型語言模型程式設計工作流程Lei 等人。 arXiv [論文]
[2024/11]程式設計鏈：為地理空間程式碼產生賦能大型語言模型Hou 等人。 arXiv [論文]
[2024/10] 法學碩士Dou 等人的多程式語言沙盒。 arXiv [論文]
[2024/10] SceneGenAgent：使用 Coding Agent Xia 等人精確產生工業場景arXiv [論文] [儲存庫]
[2024/10] MCCoder：利用法學碩士輔助代碼產生和嚴格驗證簡化運動控制Li 等人。 arXiv [論文] [儲存庫]
[2024/10] Agents4PLC：使用基於 LLM 的 Agents Liu 等人在工業控制系統中自動產生閉環 PLC 代碼並進行驗證。 arXiv [論文] [儲存庫]
[2024/10]使用 LLM 優化器透過 DSL 驅動的程式碼產生來提高平行程式效能Wei 等人。 arXiv. [紙]
[2024/10] AgentBank：透過對 50000 多個交互軌跡進行微調來實現廣義 LLM 代理Song 等人。 arXiv. [紙]
[2024/10] RLEF：使用強化學習在執行回饋中接地程式碼 LLMS Gehring 等人。 arXiv. [紙]
[2024/10]比你的老師更好：從特權 AI 回饋Choudhury 等人學習的 LLM 代理程式。 arXiv. [紙]
[2024/10] AMR-Evol：自適應模組化響應進化為程式碼生成中的大型語言模型帶來更好的知識蒸餾Luo 等人。 arXiv. [論文] [回購協議]
[2024/10] RGD：透過細化和產生指導的基於多 LLM 的代理調試器Jin 等人。 arXiv. [紙]
[2024/09] AutoSafeCoder：透過靜態分析和模糊測試保護 LLM 程式碼產生的多代理框架Nunez 等人。 arXiv [論文] [儲存庫]
[2024/09]透過多計畫探索和回饋驅動細化產生程式碼的結對程式框架張等人。 arXiv [論文] [儲存庫]
[2024/08]篩選幹擾：利用執行回饋對產生的候選程式碼進行排名Sun 等人。 arXiv [論文]
[2024/08] CODEXGRAPH：透過程式碼圖資料庫橋接大型語言模型和程式碼儲存庫Liu 等人。 arXiv. [論文] [回購協議]
[2024/07] OPENHANDS：為人工智慧軟體開發者提供通用代理的開放平台Wang 等人。 arXiv [論文] [儲存庫]
[2024/05]使用儲存庫上的迭代、工具增強推理從自然語言產生類別級程式碼。德什潘德等。 arXiv. [紙]
[2024/05] MapCoder：用於解決競爭性問題的多代理程式碼產生。伊斯蘭等人。前十字韌帶。 [論文] [回購協議]
[2024/05] AutoCoder：使用 AIEV-INSTRUCT 增強程式碼大型語言模型。雷等人。 arXiv. [論文] [回購協議]
[2024/04] 3DGen：人工智慧輔助產生可證明正確的二進位格式解析器。法庫裡等人。 arXiv [論文]
[2024/04]自組織代理程式：針對超大規模程式碼產生和最佳化的 LLM 多代理框架。石橋等人。 arXiv. [論文] [回購協議]
[2024/03] AutoDev：自動化人工智慧驅動開發。圖法諾等。 arXiv [論文]
[2024/03] CoCoST：透過線上搜尋和正確性測試自動產生複雜程式碼。他等人。 arXiv. [紙]
[2024/03] RAT：檢索增強思考在長視野生成中引發情境感知推理。王等人。 arXiv. [論文] [回購協議]
[2024/02]可執行程式碼操作引出更好的 LLM 代理程式。王等人。 ICML。 [論文] [回購協議]
[2024/02]您需要更多代理程式。李等人。 arXiv. [紙]
[2024/02]程式碼產生的測試驅動開發。馬修斯等人。 arXiv. [論文] [回購協議]
[2024/02] LDB：透過逐步驗證執行階段執行的大型語言模型偵錯器。鐘等人。 arXiv. [論文] [回購協議]
[2024/01] CodeAgent：利用工具整合的代理系統增強程式碼生成，應對現實世界的回購級編碼挑戰。張等人。前十字韌帶。 [紙]
[2024/01]教授程式碼法學碩士在儲存庫層級程式碼產生中使用自動完成工具。王等人。 arXiv. [紙]
[2024/01]使用 AlphaCodium 產生程式碼：從即時工程到流程工程。里德尼克等人。 arXiv. [論文] [回購協議]
[2023/12] AgentCoder：基於多代理程式的程式碼產生與迭代測試和最佳化。黃等人。 arXiv. [紙]
[2023/12] LLM4TDD：使用大型語言模型進行測試驅動開發的最佳實踐。皮亞等人。 arXiv. [論文] [回購協議]
[2023/11] INTERVENOR：透過互動式修復鏈提升大型語言模式的編碼能力。王等人。前十字韌帶。 [論文] [回購協議]
[2023/10]動態 LLM-代理網絡：具有代理團隊優化功能的 LLM-代理協作框架。劉等人。 arXiv. [論文] [回購協議]
[2023/10]狐猴：協調自然語言和語言代理程式碼。徐等人。 ICLR。 [論文] [回購協議]
[2023/10] ClarifyGPT：透過意圖澄清增強基於 LLM 的程式碼產生。穆等人。 arXiv. [論文] [回購協議]
[2023/10]代碼鏈：透過具有代表性子模組的自我修訂鏈實現模組化程式碼產生。樂等人。 ICLR。 [論文] [回購協議]
[2023/10]語言代理樹搜尋統一了語言模型中的推理、執行和規劃。周等人。 ICML。 [論文] [回購協議]
[2023/09] MINT：評估 LLMS 與工具和語言回饋的多輪交互作用。王等人。 ICLR。 [論文] [回購協議]
[2023/09]大型語言模型中測試用例驅動的程式理解，以實現更好的程式碼生成。田等人。 arXiv. [紙]
[2023/09] CodePlan：使用法學碩士和規劃進行儲存庫層級編碼。拜裡等人。 FSE。 [論文] [回購協議]
[2023/09]從誤用到精通：透過知識驅動的人工智慧鏈增強程式碼產生。任等人。日月光。 [紙]
[2023/09] Parsel？：透過組合分解進行語言模型的演算法推理。澤利克曼等。神經資訊處理系統。 [論文] [回購協議]
[2023/08] AutoGen：透過多代理對話啟用下一代 LLM 應用程式。吳等。 arXiv. [論文] [回購協議]
[2023/08] Gentopia：工具增強法學碩士協作平台。徐等人。 EMNLP。 [論文] [回購協議]
[2023/08]流程：推理和協作人工智慧的建構模組。約西福斯基等人。 arXiv. [論文] [回購協議]
[2023/08] CodeCoT：解決程式碼產生 CoT 推理中的程式碼語法錯誤。黃等人。 arXiv. [紙]
[2023/06] SELFEVOLVE：透過大型語言模型的程式碼演化框架。江等人。 arXiv. [紙]
[2023/06] InterCode：透過執行回饋對互動式編碼進行標準化和基準測試。楊等人。神經資訊處理系統。 [論文] [回購協議]
[2023/06]自我修復是代碼產生的銀彈嗎？奧勞森等人。 ICLR。 [論文] [回購協議]
[2023/05] ToolCoder：教程式碼產生模型使用 API 搜尋工具。張等人。 arXiv. [紙]
[2023/05]自我編輯：用於程式碼產生的故障感知代碼編輯器。張等人。前十字韌帶。 [紙]
[2023/04]教授大型語言模型進行自我調試。陳等人。 ICLR。 [紙]
[2023/04]使用大型語言模型進行完全自主程式設計。利文采夫等。傑科。 [紙]
[2023/03] CAMEL：大語言模型社會「心靈」探索的溝通代理人。李等人。神經資訊處理系統。 [論文] [回購協議]
[2023/03]反思：具有語言強化學習的語言代理人。辛恩等人。神經資訊處理系統。 [論文] [回購協議]
[2023/03]自我精進：自我回饋的迭代細緻化。馬達安等人。神經資訊處理系統。 [論文] [回購協議]

確認

[2024/10]透過自我進化自動產生 Rust 代碼證明Chen 等人。 arXiv [論文]
[2024/09] AutoVerus：Rust 程式碼的自動證明會產生Yang 等人。 arXiv [論文]

靜態程式碼檢查

靜態錯誤偵測

[2024/10]利用微調語言模型進行高效、準確的智能合約審計Wei 等人。 arXiv [論文] [儲存庫]
[2024/10] LLM-SmartAudit：進階智慧合約漏洞偵測Wei 等人arXiv. [論文] [回購協議]
[2024/05]用於偵測安全漏洞的法學碩士輔助靜態分析。李等人。 arXiv. [紙]
[2024/05] PropertyGPT：透過檢索增強財產生成對智慧合約進行法學碩士驅動的形式驗證。劉等人。 arXiv. [論文] [回購協議]
[2024/03]透過法學碩士討論達成多角色共識以進行漏洞檢測。毛等人。 QRS波。 [紙]
[2024/03]將微調和基於 LLM 的代理程式結合，進行直覺的智慧合約審計和論證。馬等人。 arXiv. [論文] [回購協議]
[2024/02]當資料流分析遇到大型語言模型。王等人。 arXiv. [紙]
[2024/01] LLM4Vuln：解耦和增強法學碩士漏洞推理的統一評估框架。孫等人。 arXiv. [論文] [回購協議]
[2023/12] E&V：透過偽代碼執行和驗證提示大型語言模型進行靜態分析。郝等人。 arXiv. [紙]
[2023/10]大語言模型驅動的智慧合約漏洞偵測：新視野。胡等人。 TPS-ISA。 [論文] [回購協議]
[2023/10] AI時代的靜態程式碼分析：深入探討智慧程式碼分析的概念、功能和潛力。範等。 arXiv. [紙]
[2023/08]增強實際錯誤偵測的靜態分析：法學碩士整合方法。李等人。 arXiv. [論文] [回購協議]
[2023/03] ART：大型語言模型的自動多步驟推理與工具使用。帕蘭賈普等人。 arXiv. [論文] [回購協議]

程式碼審查

[2024/10]代理人作為法官：與諸葛等人一起評估代理人。 arXiv. [論文] [回購協議]
[2024/09]分而治之：透過本地化和修訂自動進行代碼修訂Wang 等人。 ACM 翻譯。軟體.工程師。方法。 [紙]
[2024/04]法學碩士人工智慧驅動的程式碼審查：早期結果。拉希德等。 arXiv. [紙]
[2024/02] CodeAgent：軟體工程協作代理。唐等人。 arXiv. [論文] [回購協議]
[2023/10] AI時代的靜態程式碼分析：深入探討智慧程式碼分析的概念、功能和潛力。範等。 arXiv. [紙]
[2023/09]核心：使用法學碩士解決程式碼品質問題。瓦德瓦等。 FSE。 [論文] [回購協議]

測試

單元測試

[2024/11] ReAccept：基於動態驗證和大型語言模型的生產和測試程式碼自動協同演化Chi 等人。 arXiv [論文] [儲存庫]
[2024/09]使用 LLM 支援的程式碼產生進行 Python 符號執行Wang 等人。 arXiv [論文]
[2024/06] Mokav：使用法學碩士進行執行驅動的差異測試。埃特馬迪等人。 arXiv. [論文] [回購協議]
[2024/04]透過程式分析增強難以覆蓋分支的基於 LLM 的測試生成。楊等人。 arXiv. [紙]
[2024/03] AutoDev：自動化人工智慧驅動開發。圖法諾等。 arXiv [論文]
[2024/03] COVERUP：覆蓋率引導的基於 LLM 的測試產生。皮佐諾等。 arXiv. [論文] [回購協議]
[2023/08]使用預先訓練的大型語言模型和突變測試產生有效的測試。達赫爾等人。資訊.軟體.技術。。 [論文] [回購協議]
[2023/05]不再需要手動測試？評估和改進 ChatGPT 以產生單元測試。袁等人。 arXiv. [論文] [回購協議]
[2023/05] ChatUniTest：基於 LLM 的測試生成框架。陳等人。 FSE。 [論文] [回購協議]
[2023/02]使用大型語言模型自動產生單元測試的實證評估。謝弗等。 IEEE 傳輸。軟體工程.. [論文] [repo]

系統測試

[2024/11]基於 LLM 的模糊驅動產生的程式碼知識圖增強系統Xu 等人。 arXiv. [紙]
[2024/07]透過多模態大語言模型進行視覺驅動的自動化移動 GUI 測試。劉等人。 arXiv. [論文] [回購協議]
[2024/04] LLM 代理程式可以自主利用一日漏洞。方等人。 arXiv. [紙]
[2024/02]您現在就可以 REST：使用大型語言模型對 RESTful API 進行自動規範推理和黑盒測試。德克羅普等人。 arXiv. [論文] [回購協議]
[2024/01] XUAT-Copilot：使用大型語言模型進行自動使用者驗收測試的多代理協作系統。王等人。 arXiv. [紙]
[2024/01] KernelGPT：透過大型語言模型增強內核模糊測試。楊等人。 arXiv. [紙]
[2023/11]使用自主大型語言模型代理進行意圖驅動的行動 GUI 測試。尹等人。國際科學技術委員會。 [論文] [回購協議]
[2023/10]讓法學碩士成為測試專家：透過功能感知決策將類人互動引入行動 GUI 測試。劉等人。國際科學教育協會。 [紙]
[2023/10] AXNav：重播自然語言的輔助功能測試。泰布等。氣。 [紙]
[2023/10]大型語言模型支援的白盒編譯器模糊測試。楊等人。 arXiv. [論文] [回購協議]
[2023/10]測試極限：使用大型語言模型產生用於行動應用程式崩潰偵測的異常文字輸入。劉等人。國際科學教育協會。 [論文] [回購協議]
[2023/08] PENTESTGPT：LLM授權的自動滲透測試工具。鄧等人。 arXiv. [論文] [回購協議]
[2023/08] Fuzz4All：使用大型語言模型進行通用模糊測試。夏等人。國際科學教育協會。 [論文] [回購協議]
[2023/07]透過使用大型語言模型產生有效的見證程式來隔離編譯器錯誤。圖等人。 IEEE 傳輸。軟體工程。 [論文] [回購協議]
[2023/06]提示就是您所需要的：使用大型語言模型自動重播 Android Bug。馮等人。國際科學教育協會。 [論文] [回購協議]

偵錯

故障定位

[2024/11] FlexFL：利用開源大型語言模型進行靈活有效的故障定位Xu 等人。 arXiv [論文]
[2024/09]透過使用 LLM 代理和自我反思的有序代碼分析來增強故障定位Rafi 等人。 arXiv [論文]
[2024/03] AGENTFL：將基於 LLM 的故障定位擴展到專案級情境。秦等人。 arXiv. [紙]
[2023/10] RCAgent：使用工具增強大型語言模型的自治代理進行雲根本原因分析。王等人。 arXiv. [紙]
[2023/08]基於法學碩士的可解釋故障定位的定量和定性評估。康等人。 FSE。 [紙]

程式修復

[2024/07] OPENHANDS：為人工智慧軟體開發者提供通用代理的開放平台Wang 等人。 arXiv [論文] [儲存庫]
[2024/10]使用大型語言模型進行高效程式修復的語義引導搜尋Thanh 等人。 arXiv [論文]
[2024/09]測試不穩定的神經符號修復。陳等人。 ISSTA。 [紙]
[2024/04]實用的功能級程式修復能走多遠？翔等人。 arXiv. [論文] [回購協議]
[2024/03] RepairAgent：基於 LLM 的程式修復自主代理程式。布澤尼亞等人。 arXiv. [紙]
[2024/03] ACFIX：指導法學碩士利用挖掘的通用 RBAC 實踐對智慧合約中的存取控制漏洞進行情境感知修復。張等人。 arXiv. [紙]
[2024/02] CigaR：利用法學碩士進行具有成本效益的程序修復。希德維吉等人。 arXiv. [論文] [回購協議]
[2023/04]透過大型語言模型驅動的科學調試進行可解釋的自動調試。康等人。 arXiv. [紙]
[2023/04]保持對話繼續：使用 ChatGPT 修復 337 個錯誤中的 162 個錯誤，每個錯誤 0.42 美元。夏等人。 arXiv. [紙]
[2023/01]對話式自動化程式修復。夏等人。 arXiv. [紙]

統一偵錯

[2024/04]透過基於 LLM 的多代理協同的統一調試方法。李等人。 arXiv. [論文] [回購協議]
[2024/02] LDB：透過逐步驗證執行階段執行的大型語言模型偵錯器。鐘等人。 arXiv. [論文] [回購協議]

發布

[2024/08] GoNoGo：一種基於 LLM 的高效多代理系統，用於簡化汽車軟體發布決策Khoee 等人。 arXiv [論文]

端對端軟體開發

[2024/09] 與 ChatGPT Zhu 等人產生 Java 程式碼配對。理論計算機科學[論文]
[2024/07]透過人機-人工智慧團隊合作賦能基於敏捷的生成式軟體開發張等人。 TOSEM [論文] [repo]
[2024/06]多代理軟體開發實驗：邁向統一平台Sami 等人。 arXiv. [紙]
[2024/06]擴展以大語言模式為基礎的多智能體協作Qian等人。 arXiv. [論文] [回購協議]
[2024/06]透過跨團隊協作進行多代理軟體開發。杜等人。 arXiv. [論文] [回購協議]
[2024/06] AgileCoder：基於敏捷方法論的軟體開發動態協作代理。阮等人。 arXiv. [論文] [回購協議]
[2024/05]軟體開發代理的迭代體驗精進。錢等人。 arXiv. [紙]
[2024/03]當基於LLM的程式碼產生滿足軟體開發流程。林等人。 arXiv. [論文] [回購協議]
[2024/03] CodeS：透過多層 Sketch 將自然語言轉換為程式碼儲存庫。讚等人。 arXiv. [論文] [回購協議]
[2024/02] CodePori：使用多代理進行自主軟體開發的大規模模型。拉希德等。 arXiv. [紙]
[2024/01]用法學碩士實驗新的程式設計實踐。張等人。 arXiv. [論文] [回購協議]
[2024/01] LLM4PLC：利用大型語言模型對工業控制系統中的 PLC 進行可驗證程式設計。法基赫等人。國際科學教育協會。 [論文] [回購協議]
[2023/12]軟體開發代理人的體驗式共同學習。錢等人。前十字韌帶。 [論文] [回購協議]
[2023/11]軟體開發中的自主代理：願景論文Rasheed 等人。 arXiv. [紙]
[2023/09] AutoAgents：自動代理程式產生框架。陳等人。 arXiv. [論文] [回購協議]
[2023/08] AgentVerse：促進多智能體協作並探索緊急行為。陳等人。 ICLR。 [論文] [回購協議]
[2023/08] METAGPT：多代理協作框架的元程式設計。洪等人。 ICLR。 [論文] [回購協議]
[2023/07]軟體開發的通訊代理。錢等人。前十字韌帶。 [論文] [回購協議]
[2023/06]多代理協作：利用智慧 LLM 代理的力量。塔勒比拉德等人。 arXiv. [紙]
[2023/06] Prompt Sapper：法學碩士授權的 AI 原生服務軟體工程基礎設施。邢等人。 arXiv. [紙]
[2023/04]透過 ChatGPT 進行自協作程式碼產生。董等人。 arXiv. [論文] [回購協議]
[2023/04]低代碼法學碩士：法學碩士視覺化程式設計。蔡等人。 arXiv. [論文] [回購協議]

端對端軟體維護

[2024/11]法學碩士作為持續學習者：改進軟體問題中缺陷代碼的再現Lin 等人。 arXiv [論文]
[2024/11]人機互動軟體開發代理Takerngsaksiri 等人。 arXiv [論文]
[2024/11] Lingma SWE-GPT：一種用於自動化軟體改進的以開放開發流程為中心的語言模型Ma 等人。 arXiv [論文] [儲存庫]
[2024/10] RepoGraph：利用儲存庫級程式碼圖增強人工智慧軟體工程Ouyang et al. arXiv [論文] [儲存庫]
[2024/09] MarsCode Agent：AI 原生自動錯誤修復Liu 等人arXiv. [紙]
[2024/08] CODEXGRAPH：透過程式碼圖資料庫橋接大型語言模型和程式碼儲存庫Liu 等人。 arXiv. [論文] [回購協議]
[2024/08]多樣性賦予智慧：整合軟體工程代理的專業知識張等人。 arXiv. [紙]
[2024/08] SpecRover：透過法學碩士Ruan 等人進行程式碼意圖擷取。 arXiv. [論文] [回購協議]
[2024/07] OPENHANDS：為人工智慧軟體開發者提供通用代理的開放平台Wang 等人。 arXiv [論文] [儲存庫]
[2024/07]無代理：揭秘基於 LLM 的軟體工程代理。夏等人。 arXiv. [論文] [回購協議]
[2024/06]如何理解整個軟體儲存庫？馬等人。 arXiv. [論文] [回購協議]
[2024/06]編碼器：使用多代理和任務圖解決問題。陳等人。 arXiv. [論文] [回購協議]
[2024/06] MASAI：軟體工程人工智慧代理的模組化架構。阿羅拉等人。 arXiv. [紙]
[2024/05] SWE-AGENT：代理電腦介面支援自動化軟體工程。楊等人。 arXiv. [論文] [回購協議]
[2024/04] AutoCodeRover：自主程序改進。張等人。 ISSTA。 [論文] [回購協議]
[2024/03] MAGIS：基於 LLM 的多代理框架，用於 GitHub 問題解決方案。陶等人。 arXiv. [紙]

基準

[2024/10] SWE-Bench+：法學碩士Aleithan 等人的增強編碼基準。 arXiv. [紙]
[2024/10] SWE-bench 多模式：人工智慧系統是否可以推廣到視覺化軟體領域？楊等人。 arXiv. [論文] [回購協議]
[2024/08] SWE-bench-java：Java Zan 等人的 GitHub 問題解決基準。 arXiv [論文] [儲存庫]
[2024/07]無代理：揭秘基於 LLM 的軟體工程代理。夏等人。 arXiv. [論文] [回購協議]
[2023/10] Swe-bench：語言模型能否解決現實世界的 github 問題？希門尼斯等人。 ICLR [論文] [儲存庫]

代理商觀點

代理框架

規劃

單輪規劃

[2024/06] AgileCoder：基於敏捷方法論的軟體開發動態協作代理。阮等人。 arXiv. [論文] [回購協議]
[2024/06]透過跨團隊協作進行多代理軟體開發。杜等人。 arXiv. [論文] [回購協議]
[2024/05] MapCoder：用於解決競爭性問題的多代理程式碼產生。伊斯蘭等人。前十字韌帶。 [論文] [回購協議]
[2024/03] MAGIS：基於 LLM 的多代理框架，用於 GitHub 問題解決方案。陶等人。 arXiv. [紙]
[2024/03] CodeS：透過多層 Sketch 將自然語言轉換為程式碼儲存庫。讚等人。 arXiv. [論文] [回購協議]
[2024/03] CoCoST：透過線上搜尋和正確性測試自動產生複雜程式碼。他等人。 arXiv. [紙]
[2024/02] CodePori：使用多代理進行自主軟體開發的大規模模型。拉希德等。 arXiv. [紙]
[2024/01] CodeAgent：利用工具整合的代理系統增強程式碼生成，應對現實世界的回購級編碼挑戰。張等人。前十字韌帶。 [紙]
[2024/01] LLM4PLC：利用大型語言模型對工業控制系統中的 PLC 進行可驗證程式設計。法基赫等人。國際科學教育協會。 [論文] [回購協議]
[2024/01]用法學碩士實驗新的程式設計實踐。張等人。 arXiv. [論文] [回購協議]
[2023/11]軟體開發中的自主代理：願景論文Rasheed 等人。 arXiv. [紙]
[2023/10] AI時代的靜態程式碼分析：深入探討智慧程式碼分析的概念、功能和潛力。範等。 arXiv. [紙]
[2023/09] Parsel？：透過組合分解進行語言模型的演算法推理。澤利克曼等。神經資訊處理系統。 [論文] [回購協議]
[2023/08] PENTESTGPT：LLM授權的自動滲透測試工具。鄧等人。 arXiv. [論文] [回購協議]
[2023/08]流程：推理和協作人工智慧的建構模組。約西福斯基等人。 arXiv. [論文] [回購協議]
[2023/08] METAGPT：多代理協作框架的元程式設計。洪等人。 ICLR。 [論文] [回購協議]
[2023/07]軟體開發的通訊代理。錢等人。前十字韌帶。 [論文] [回購協議]
[2023/04]透過 ChatGPT 進行自協作程式碼產生。董等人。 arXiv. [論文] [回購協議]
[2023/04]低代碼法學碩士：法學碩士視覺化程式設計。蔡等人。 arXiv. [論文] [回購協議]

多輪規劃

[2024/03] RAT：檢索增強思考在長視野生成中引發情境感知推理。王等人。 arXiv. [論文] [回購協議]

類似反應

[2024/06] MASAI：軟體工程人工智慧代理的模組化架構。阿羅拉等人。 arXiv. [紙]
[2024/02]可執行程式碼操作引出更好的 LLM 代理程式。王等人。 ICML。 [論文] [回購協議]
[2024/01] CodeAgent：利用工具整合的代理系統增強程式碼生成，應對現實世界的回購級編碼挑戰。張等人。前十字韌帶。 [紙]
[2024/01] XUAT-Copilot：使用大型語言模型進行自動使用者驗收測試的多代理協作系統。王等人。 arXiv. [紙]
[2023/11]使用自主大型語言模型代理進行意圖驅動的行動 GUI 測試。尹等人。國際科學技術委員會。 [論文] [回購協議]
[2023/10] RCAgent：使用工具增強大型語言模型的自治代理進行雲根本原因分析。王等人。 arXiv. [紙]
[2023/10]語言代理樹搜尋統一了語言模型中的推理、執行和規劃。周等人。 ICML。 [論文] [回購協議]
[2023/10] AXNav：重播自然語言的輔助功能測試。泰布等。氣。 [紙]
[2023/09] CodePlan：使用法學碩士和規劃進行儲存庫層級編碼。拜裡等人。 FSE。 [論文] [回購協議]

分層

[2024/04]自組織代理程式：針對超大規模程式碼產生和最佳化的 LLM 多代理框架。石橋等人。 arXiv. [論文] [回購協議]

記憶

長期記憶

[2024/06]擴展以大語言模式為基礎的多智能體協作Qian等人。 arXiv. [論文] [回購協議]
[2024/06]透過跨團隊協作進行多代理軟體開發。杜等人。 arXiv. [論文] [回購協議]
[2024/05]軟體開發代理的迭代體驗精進。錢等人。 arXiv. [紙]
[2023/12]軟體開發代理人的體驗式共同學習。錢等人。前十字韌帶。 [論文] [回購協議]
[2023/11]使用自主大型語言模型代理進行意圖驅動的行動 GUI 測試。尹等人。國際科學技術委員會。 [論文] [回購協議]
[2023/09] AutoAgents：自動代理程式產生框架。陳等人。 arXiv. [論文] [回購協議]
[2023/08] METAGPT：多代理協作框架的元程式設計。洪等人。 ICLR。 [論文] [回購協議]
[2023/07]軟體開發的通訊代理。錢等人。前十字韌帶。 [論文] [回購協議]
[2023/03]反思：具有語言強化學習的語言代理人。辛恩等人。神經資訊處理系統。 [論文] [回購協議]

短期記憶

[2024/07]透過多模態大語言模型進行視覺驅動的自動化移動 GUI 測試。劉等人。 arXiv. [論文] [回購協議]
[2024/06]擴展以大語言模式為基礎的多智能體協作Qian等人。 arXiv. [論文] [回購協議]
[2024/06]透過跨團隊協作進行多代理軟體開發。杜等人。 arXiv. [論文] [回購協議]
[2024/06] AgileCoder：基於敏捷方法論的軟體開發動態協作代理。阮等人。 arXiv. [論文] [回購協議]
[2024/04]自組織代理程式：針對超大規模程式碼產生和最佳化的 LLM 多代理框架。石橋等人。 arXiv. [論文] [回購協議]
[2024/03] MAGIS：基於 LLM 的多代理框架，用於 GitHub 問題解決方案。陶等人。 arXiv. [紙]
[2024/01] XUAT-Copilot：使用大型語言模型進行自動使用者驗收測試的多代理協作系統。王等人。 arXiv. [紙]
[2023/12] E&V：透過偽代碼執行和驗證提示大型語言模型進行靜態分析。郝等人。 arXiv. [紙]
[2023/11]使用自主大型語言模型代理進行意圖驅動的行動 GUI 測試。尹等人。國際科學技術委員會。 [論文] [回購協議]
[2023/10] RCAgent：使用工具增強大型語言模型的自治代理進行雲根本原因分析。王等人。 arXiv. [紙]
[2023/10] AI時代的靜態程式碼分析：深入探討智慧程式碼分析的概念、功能和潛力。範等。 arXiv. [紙]
[2023/10]讓法學碩士成為測試專家：透過功能感知決策將類人互動引入行動 GUI 測試。劉等人。國際科學教育協會。 [紙]
[2023/09] CodePlan：使用法學碩士和規劃進行儲存庫層級編碼。拜裡等人。 FSE。 [論文] [回購協議]
[2023/09] AutoAgents：自動代理程式產生框架。陳等人。 arXiv. [論文] [回購協議]
[2023/08] METAGPT：多代理協作框架的元程式設計。洪等人。 ICLR。 [論文] [回購協議]
[2023/07]軟體開發的通訊代理。錢等人。前十字韌帶。 [論文] [回購協議]
[2023/03]反思：具有語言強化學習的語言代理人。辛恩等人。神經資訊處理系統。 [論文] [回購協議]

共享記憶：一種特殊的短期記憶

[2024/06] AgileCoder：基於敏捷方法論的軟體開發動態協作代理。阮等人。 arXiv. [論文] [回購協議]
[2024/05] MARE：需求工程多代理協作框架。金等人。 arXiv. [紙]
[2024/03]當基於LLM的程式碼產生滿足軟體開發流程。林等人。 arXiv. [論文] [回購協議]
[2024/03] AGENTFL：將基於 LLM 的故障定位擴展到專案級情境。秦等人。 arXiv. [紙]
[2023/08] METAGPT：多代理協作框架的元程式設計。洪等人。 ICLR。 [論文] [回購協議]
[2023/04]透過 ChatGPT 進行自協作程式碼產生。董等人。 arXiv. [論文] [回購協議]

洞察力

視覺輸入

[2024/10] SWE-bench 多模式：人工智慧系統是否可以推廣到視覺化軟體領域？楊等人。 arXiv. [論文] [回購協議]
[2024/07]透過多模態大語言模型進行視覺驅動的自動化移動 GUI 測試。劉等人。 arXiv. [論文] [回購協議]
[2024/06]多代理軟體開發實驗：邁向統一平台Sami 等人。 arXiv. [紙]
[2024/01] XUAT-Copilot：使用大型語言模型進行自動使用者驗收測試的多代理協作系統。王等人。 arXiv. [紙]
[2023/10] AXNav：重播自然語言的輔助功能測試。泰布等。氣。 [紙]
[2023/10]測試極限：使用大型語言模型產生用於行動應用程式崩潰偵測的異常文字輸入。劉等人。國際科學教育協會。 [論文] [回購協議]
[2023/08] METAGPT：多代理協作框架的元程式設計。洪等人。 ICLR。 [論文] [回購協議]

行動

搜尋工具

[2024/05]使用儲存庫上的迭代、工具增強推理從自然語言產生類別級程式碼。德什潘德等。 arXiv. [紙]
[2024/04] LLM 代理程式可以自主利用一日漏洞。方等人。 arXiv. [紙]
[2024/03] AutoDev：自動化人工智慧驅動開發。圖法諾等。 arXiv [論文]
[2024/03] RepairAgent：基於 LLM 的程式修復自主代理程式。布澤尼亞等人。 arXiv. [紙]
[2024/03] CoCoST：透過線上搜尋和正確性測試自動產生複雜程式碼。他等人。 arXiv. [紙]
[2024/03] RAT：檢索增強思考在長視野生成中引發情境感知推理。王等人。 arXiv. [論文] [回購協議]
[2024/02] CodePori：使用多代理進行自主軟體開發的大規模模型。拉希德等。 arXiv. [紙]
[2024/01] LLM4Vuln：解耦和增強法學碩士漏洞推理的統一評估框架。孫等人。 arXiv. [論文] [回購協議]
[2024/01] CodeAgent：利用工具整合的代理系統增強程式碼生成，應對現實世界的回購級編碼挑戰。張等人。前十字韌帶。 [紙]
[2023/12] E&V：透過偽代碼執行和驗證提示大型語言模型進行靜態分析。郝等人。 arXiv. [紙]
[2023/12]軟體開發代理人的體驗式共同學習。錢等人。前十字韌帶。 [論文] [回購協議]
[2023/11]使用自主大型語言模型代理進行意圖驅動的行動 GUI 測試。尹等人。國際科學技術委員會。 [論文] [回購協議]
[2023/10]狐猴：協調自然語言和語言代理程式碼。徐等人。 ICLR。 [論文] [回購協議]
[2023/10] RCAgent：使用工具增強大型語言模型的自治代理進行雲根本原因分析。王等人。 arXiv. [紙]
[2023/10] AI時代的靜態程式碼分析：深入探討智慧程式碼分析的概念、功能和潛力。範等。 arXiv. [紙]
[2023/08] METAGPT：多代理協作框架的元程式設計。洪等人。 ICLR。 [論文] [回購協議]
[2023/08] PENTESTGPT：LLM授權的自動滲透測試工具。鄧等人。 arXiv. [論文] [回購協議]
[2023/08] AgentVerse：促進多智能體協作並探索緊急行為。陳等人。 ICLR。 [論文] [回購協議]
[2023/08] Gentopia：工具增強法學碩士協作平台。徐等人。 EMNLP。 [論文] [回購協議]
[2023/08] AutoGen：透過多代理對話啟用下一代 LLM 應用程式。吳等。 arXiv. [論文] [回購協議]
[2023/05] ToolCoder：教程式碼產生模型使用 API 搜尋工具。張等人。 arXiv. [紙]
[2023/03] ART：大型語言模型的自動多步驟推理與工具使用。帕蘭賈普等人。 arXiv. [論文] [回購協議]

文件操作

[2024/08] SpecRover：透過法學碩士Ruan 等人進行程式碼意圖擷取。 arXiv. [論文] [回購協議]
[2024/06] MASAI：軟體工程人工智慧代理的模組化架構。阿羅拉等人。 arXiv. [紙]
[2024/05]用於偵測安全漏洞的法學碩士輔助靜態分析。李等人。 arXiv. [紙]
[2024/05] SWE-AGENT：代理電腦介面支援自動化軟體工程。楊等人。 arXiv. [論文] [回購協議]
[2024/04] LLM 代理程式可以自主利用一日漏洞。方等人。 arXiv. [紙]
[2024/03] RepairAgent：基於 LLM 的程式修復自主代理程式。布澤尼亞等人。 arXiv. [紙]
[2024/03] AutoDev：自動化人工智慧驅動開發。圖法諾等。 arXiv [論文]
[2023/04]透過大型語言模型驅動的科學調試進行可解釋的自動調試。康等人。 arXiv. [紙]

圖形化操作

[2024/07]透過多模態大語言模型進行視覺驅動的自動化移動 GUI 測試。劉等人。 arXiv. [論文] [回購協議]
[2024/01] XUAT-Copilot：使用大型語言模型進行自動使用者驗收測試的多代理協作系統。王等人。 arXiv. [紙]
[2023/10]讓法學碩士成為測試專家：透過功能感知決策將類人互動引入行動 GUI 測試。劉等人。國際科學教育協會。 [紙]
[2023/10] AXNav：重播自然語言的輔助功能測試。泰布等。氣。 [紙]
[2023/10]測試極限：使用大型語言模型產生用於行動應用程式崩潰偵測的異常文字輸入。劉等人。國際科學教育協會。 [論文] [回購協議]
[2023/06]提示就是您所需要的：使用大型語言模型自動重播 Android Bug。馮等人。國際科學教育協會。 [論文] [回購協議]

靜態程序分析

[2024/06]透過跨團隊協作進行多代理軟體開發。杜等人。 arXiv. [論文] [回購協議]
[2024/06] AgileCoder：基於敏捷方法論的軟體開發動態協作代理。阮等人。 arXiv. [論文] [回購協議]
[2024/06] MASAI：軟體工程人工智慧代理的模組化架構。阿羅拉等人。 arXiv. [紙]
[2024/05]使用儲存庫上的迭代、工具增強推理從自然語言產生類別級程式碼。德什潘德等。 arXiv. [紙]
[2024/05]用於偵測安全漏洞的法學碩士輔助靜態分析。李等人。 arXiv. [紙]
[2024/04] AutoCodeRover：自主程序改進。張等人。 ISSTA。 [論文] [回購協議]
[2024/04]透過程式分析增強難以覆蓋分支的基於 LLM 的測試生成。楊等人。 arXiv. [紙]
[2024/04] 3DGen：人工智慧輔助產生可證明正確的二進位格式解析器。法庫裡等人。 arXiv [論文]
[2024/03] AutoDev：自動化人工智慧驅動開發。圖法諾等。 arXiv [論文]
[2024/03] RepairAgent：基於 LLM 的程式修復自主代理程式。布澤尼亞等人。 arXiv. [紙]
[2024/03] COVERUP：覆蓋率引導的基於 LLM 的測試產生。皮佐諾等。 arXiv. [論文] [回購協議]
[2024/03] ACFIX：指導法學碩士利用挖掘的通用 RBAC 實踐對智慧合約中的存取控制漏洞進行情境感知修復。張等人。 arXiv. [紙]
[2024/03] AGENTFL：將基於 LLM 的故障定位擴展到專案級情境。秦等人。 arXiv. [紙]
[2024/02]當資料流分析遇到大型語言模型。王等人。 arXiv. [紙]
[2024/02] LDB：透過逐步驗證執行階段執行的大型語言模型偵錯器。鐘等人。 arXiv. [論文] [回購協議]
[2024/01]教授程式碼法學碩士在儲存庫層級程式碼產生中使用自動完成工具。王等人。 arXiv. [紙]
[2024/01] CodeAgent：利用工具整合的代理系統增強程式碼生成，應對現實世界的回購級編碼挑戰。張等人。前十字韌帶。 [紙]
[2024/01] LLM4PLC：利用大型語言模型對工業控制系統中的 PLC 進行可驗證程式設計。法基赫等人。國際科學教育協會。 [論文] [回購協議]
[2023/12] E&V：透過偽代碼執行和驗證提示大型語言模型進行靜態分析。郝等人。 arXiv. [紙]
[2023/09] CodePlan：使用法學碩士和規劃進行儲存庫層級編碼。拜裡等人。 FSE。 [論文] [回購協議]
[2023/08] CodeCoT：解決程式碼產生 CoT 推理中的程式碼語法錯誤。黃等人。 arXiv. [紙]
[2023/07]透過使用大型語言模型產生有效的見證程式來隔離編譯器錯誤。圖等人。 IEEE 傳輸。軟體工程.. [論文] [repo]
[2023/06]提示就是您所需要的：使用大型語言模型自動重播 Android Bug。馮等人。國際科學教育協會。 [論文] [回購協議]

動態分析

[2024/04]透過程式分析增強難以覆蓋分支的基於 LLM 的測試生成。楊等人。 arXiv. [紙]
[2024/03] COVERUP：覆蓋率引導的基於 LLM 的測試產生。皮佐諾等。 arXiv. [論文] [回購協議]
[2024/03] AGENTFL：將基於 LLM 的故障定位擴展到專案級情境。秦等人。 arXiv. [紙]
[2024/02] LDB：透過逐步驗證執行階段執行的大型語言模型偵錯器。鐘等人。 arXiv. [論文] [回購協議]
[2023/07]透過使用大型語言模型產生有效的見證程式來隔離編譯器錯誤。圖等人。 IEEE 傳輸。軟體工程.. [論文] [repo]
[2023/04]透過大型語言模型驅動的科學調試進行可解釋的自動調試。康等人。 arXiv. [紙]

測試工具

[2024/09]測試不穩定的神經符號修復。陳等人。 ISSTA。 [紙]
[2024/08] SpecRover：透過法學碩士Ruan 等人進行程式碼意圖擷取。 arXiv. [論文] [回購協議]
[2024/06] AgileCoder：基於敏捷方法論的軟體開發動態協作代理。阮等人。 arXiv. [論文] [回購協議]
[2024/06] MASAI：軟體工程人工智慧代理的模組化架構。阿羅拉等人。 arXiv. [紙]
[2024/05] AutoCoder：使用 AIEV-INSTRUCT 增強程式碼大型語言模型。雷等人。 arXiv. [論文] [回購協議]
[2024/05] MapCoder：用於解決競爭性問題的多代理程式碼產生。伊斯蘭等人。前十字韌帶。 [論文] [回購協議]
[2024/04]自組織代理程式：針對超大規模程式碼產生和最佳化的 LLM 多代理框架。石橋等人。 arXiv. [論文] [回購協議]
[2024/04]透過基於 LLM 的多代理協同的統一調試方法。李等人。 arXiv. [論文] [回購協議]
[2024/04] LLM 代理程式可以自主利用一日漏洞。方等人。 arXiv. [紙]
[2024/04]透過程式分析增強難以覆蓋分支的基於 LLM 的測試生成。楊等人。 arXiv. [紙]
[2024/04] 3DGen：人工智慧輔助產生可證明正確的二進位格式解析器。法庫裡等人。 arXiv [論文]
[2024/04] AutoCodeRover：自主程序改進。張等人。 ISSTA。 [論文] [回購協議]
[2024/03] AutoDev：自動化人工智慧驅動開發。圖法諾等。 arXiv [論文]
[2024/03]當基於LLM的程式碼產生滿足軟體開發流程。林等人。 arXiv. [論文] [回購協議]
[2024/03] RepairAgent：基於 LLM 的程式修復自主代理程式。布澤尼亞等人。 arXiv. [紙]
[2024/03] CoCoST：透過線上搜尋和正確性測試自動產生複雜程式碼。他等人。 arXiv. [紙]
[2024/02]可執行程式碼操作引出更好的 LLM 代理程式。王等人。 ICML。 [論文] [回購協議]
[2024/02]程式碼產生的測試驅動開發。馬修斯等人。 arXiv. [論文] [回購協議]
[2024/01]使用 AlphaCodium 產生程式碼：從即時工程到流程工程。里德尼克等人。 arXiv. [論文] [回購協議]
[2024/01]用法學碩士實驗新的程式設計實踐。張等人。 arXiv. [論文] [回購協議]
[2024/01] CodeAgent：利用工具整合的代理系統增強程式碼生成，應對現實世界的回購級編碼挑戰。張等人。前十字韌帶。 [紙]
[2023/12] AgentCoder：基於多代理程式的程式碼產生與迭代測試和最佳化。黃等人。 arXiv. [紙]
[2023/12] LLM4TDD：使用大型語言模型進行測試驅動開發的最佳實踐。皮亞等人。 arXiv. [論文] [回購協議]
[2023/11] INTERVENOR：透過互動式修復鏈提升大型語言模式的編碼能力。王等人。前十字韌帶。 [論文] [回購協議]
[2023/10] ClarifyGPT：透過意圖澄清增強基於 LLM 的程式碼產生。穆等人。 arXiv. [論文] [回購協議]
[2023/10]狐猴：協調自然語言和語言代理程式碼。徐等人。 ICLR。 [論文] [回購協議]
[2023/10]大型語言模型支援的白盒編譯器模糊測試。楊等人。 arXiv. [論文] [回購協議]
[2023/09]大型語言模型中測試用例驅動的程式理解，以實現更好的程式碼生成。田等人。 arXiv. [紙]
[2023/09] MINT：評估 LLMS 與工具和語言回饋的多輪交互作用。王等人。 ICLR。 [論文] [回購協議]
[2023/08] METAGPT：多代理協作框架的元程式設計。洪等人。 ICLR。 [論文] [回購協議]
[2023/08]使用預先訓練的大型語言模型和突變測試產生有效的測試。達赫爾等人。資訊.軟體.技術。。 [論文] [回購協議]
[2023/08] AgentVerse：促進多智能體協作並探索緊急行為。陳等人。 ICLR。 [論文] [回購協議]
[2023/08] AutoGen：透過多代理對話啟用下一代 LLM 應用程式。吳等。 arXiv. [論文] [回購協議]
[2023/08]流程：推理和協作人工智慧的建構模組。約西福斯基等人。 arXiv. [論文] [回購協議]
[2023/06] SELFEVOLVE：透過大型語言模型的程式碼演化框架。江等人。 arXiv. [紙]
[2023/06] InterCode：透過執行回饋對互動式編碼進行標準化和基準測試。楊等人。神經資訊處理系統。 [論文] [回購協議]
[2023/06]自我修復是代碼產生的銀彈嗎？奧勞森等人。 ICLR。 [論文] [回購協議]
[2023/05]不再需要手動測試？評估和改進 ChatGPT 以產生單元測試。袁等人。 arXiv. [論文] [回購協議]
[2023/04]使用大型語言模型進行完全自主程式設計。利文采夫等。傑科。 [紙]
[2023/04]透過大型語言模型驅動的科學調試進行可解釋的自動調試。康等人。 arXiv. [紙]
[2023/03] ART：大型語言模型的自動多步驟推理與工具使用。帕蘭賈普等人。 arXiv. [論文] [回購協議]
[2023/03]反思：具有語言強化學習的語言代理人。辛恩等人。神經資訊處理系統。 [論文] [回購協議]
[2023/02]使用大型語言模型自動產生單元測試的實證評估。謝弗等。 IEEE 傳輸。軟體工程.. [論文] [repo]
[2023/01]對話式自動化程式修復。夏等人。 arXiv. [紙]

故障定位工具

[2024/04] AutoCodeRover：自主程序改進。張等人。 ISSTA。 [論文] [回購協議]
[2024/03] RepairAgent：基於 LLM 的程式修復自主代理程式。布澤尼亞等人。 arXiv. [紙]

多代理系統

代理角色

經理角色

[2024/06] AgileCoder：基於敏捷方法論的軟體開發動態協作代理。阮等人。 arXiv. [論文] [回購協議]
[2024/05]軟體開發代理的迭代體驗精進。錢等人。 arXiv. [紙]
[2024/05] MapCoder：用於解決競爭性問題的多代理程式碼產生。伊斯蘭等人。前十字韌帶。 [論文] [回購協議]
[2024/04]自組織代理程式：針對超大規模程式碼產生和最佳化的 LLM 多代理框架。石橋等人。 arXiv. [論文] [回購協議]
[2024/04] 3DGen：人工智慧輔助產生可證明正確的二進位格式解析器。法庫裡等人。 arXiv [論文]
[2024/03] MAGIS：基於 LLM 的多代理框架，用於 GitHub 問題解決方案。陶等人。 arXiv. [紙]
[2024/03]當基於LLM的程式碼產生滿足軟體開發流程。林等人。 arXiv. [論文] [回購協議]
[2024/02] CodeAgent：軟體工程協作代理。唐等人。 arXiv. [論文] [回購協議]
[2024/02] CodePori：使用多代理進行自主軟體開發的大規模模型。拉希德等。 arXiv. [紙]
[2023/12]軟體開發代理人的體驗式共同學習。錢等人。前十字韌帶。 [論文] [回購協議]
[2023/11]軟體開發中的自主代理：願景論文Rasheed 等人。 arXiv. [紙]
[2023/11]使用自主大型語言模型代理進行意圖驅動的行動 GUI 測試。尹等人。國際科學技術委員會。 [論文] [回購協議]
[2023/10] AXNav：重播自然語言的輔助功能測試。泰布等。氣。 [紙]
[2023/10] RCAgent：使用工具增強大型語言模型的自治代理進行雲根本原因分析。王等人。 arXiv. [紙]
[2023/09] AutoAgents：自動代理程式產生框架。陳等人。 arXiv. [論文] [回購協議]
[2023/08] METAGPT：多代理協作框架的元程式設計。洪等人。 ICLR。 [論文] [回購協議]
[2023/04]低代碼法學碩士：法學碩士視覺化程式設計。蔡等人。 arXiv. [論文] [回購協議]
[2023/03] CAMEL：大語言模型社會「心靈」探索的溝通代理人。李等人。神經資訊處理系統。 [論文] [回購協議]

需求分析角色

[2024/06]多代理軟體開發實驗：邁向統一平台Sami 等人。 arXiv. [紙]
[2024/06] AgileCoder：基於敏捷方法論的軟體開發動態協作代理。阮等人。 arXiv. [論文] [回購協議]
[2024/05] MARE：需求工程多代理協作框架。金等人。 arXiv. [紙]
[2024/04] Elicitron：用於設計需求獲取的基於 LLM 代理的模擬框架。阿泰伊等人。 arXiv. [紙]
[2024/03]當基於LLM的程式碼產生滿足軟體開發流程。林等人。 arXiv. [論文] [回購協議]
[2024/01]用法學碩士實驗新的程式設計實踐。張等人。 arXiv. [論文] [回購協議]
[2023/11]軟體開發中的自主代理：願景論文Rasheed 等人。 arXiv. [紙]
[2023/10] AI時代的靜態程式碼分析：深入探討智慧程式碼分析的概念、功能和潛力。範等。 arXiv. [紙]
[2023/08] METAGPT：多代理協作框架的元程式設計。洪等人。 ICLR。 [論文] [回購協議]
[2023/06]多代理協作：利用智慧 LLM 代理的力量。塔勒比拉德等人。 arXiv. [紙]
[2023/04]透過 ChatGPT 進行自協作程式碼產生。董等人。 arXiv. [論文] [回購協議]
[2023/03] CAMEL：大語言模型社會「心靈」探索的溝通代理人。李等人。神經資訊處理系統。 [論文] [回購協議]

設計師角色

[2024/06]多代理軟體開發實驗：邁向統一平台Sami 等人。 arXiv. [紙]
[2024/03]當基於LLM的程式碼產生滿足軟體開發流程。林等人。 arXiv. [論文] [回購協議]
[2024/01]用法學碩士實驗新的程式設計實踐。張等人。 arXiv. [論文] [回購協議]
[2023/11]軟體開發中的自主代理：願景論文Rasheed 等人。 arXiv. [紙]
[2023/08] METAGPT：多代理協作框架的元程式設計。洪等人。 ICLR。 [論文] [回購協議]
[2023/08] AgentVerse：促進多智能體協作並探索緊急行為。陳等人。 ICLR。 [論文] [回購協議]
[2023/07]軟體開發的通訊代理。錢等人。前十字韌帶。 [論文] [回購協議]
[2023/06]多代理協作：利用智慧 LLM 代理的力量。塔勒比拉德等人。 arXiv. [紙]

開發者角色

[2024/06]多代理軟體開發實驗：邁向統一平台Sami 等人。 arXiv. [紙]
[2024/06] AgileCoder：基於敏捷方法論的軟體開發動態協作代理。阮等人。 arXiv. [論文] [回購協議]
[2024/05] AutoCoder：使用 AIEV-INSTRUCT 增強程式碼大型語言模型。雷等人。 arXiv. [論文] [回購協議]
[2024/05] MapCoder：用於解決競爭性問題的多代理程式碼產生。伊斯蘭等人。前十字韌帶。 [論文] [回購協議]
[2024/04]自組織代理程式：針對超大規模程式碼產生和最佳化的 LLM 多代理框架。石橋等人。 arXiv. [論文] [回購協議]
[2024/04] 3DGen：人工智慧輔助產生可證明正確的二進位格式解析器。法庫裡等人。 arXiv [論文]
[2024/03] CodeS：透過多層 Sketch 將自然語言轉換為程式碼儲存庫。讚等人。 arXiv. [論文] [回購協議]
[2024/03] MAGIS：基於 LLM 的多代理框架，用於 GitHub 問題解決方案。陶等人。 arXiv. [紙]
[2024/03]當基於LLM的程式碼產生滿足軟體開發流程。林等人。 arXiv. [論文] [回購協議]
[2024/02]程式碼產生的測試驅動開發。馬修斯等人。 arXiv. [論文] [回購協議]
[2024/02] CodePori：使用多代理進行自主軟體開發的大規模模型。拉希德等。 arXiv. [紙]
[2024/01]用法學碩士實驗新的程式設計實踐。張等人。 arXiv. [論文] [回購協議]
[2023/12] AgentCoder：基於多代理程式的程式碼產生與迭代測試和最佳化。黃等人。 arXiv. [紙]
[2023/11]軟體開發中的自主代理：願景論文Rasheed 等人。 arXiv. [紙]
[2023/11] INTERVENOR：透過互動式修復鏈提升大型語言模式的編碼能力。王等人。前十字韌帶。 [論文] [回購協議]
[2023/08] AutoGen：透過多代理對話啟用下一代 LLM 應用程式。吳等。 arXiv. [論文] [回購協議]
[2023/08] METAGPT：多代理協作框架的元程式設計。洪等人。 ICLR。 [論文] [回購協議]
[2023/08] AgentVerse：促進多智能體協作並探索緊急行為。陳等人。 ICLR。 [論文] [回購協議]
[2023/07]軟體開發的通訊代理。錢等人。前十字韌帶。 [論文] [回購協議]
[2023/06]自我修復是代碼產生的銀彈嗎？奧勞森等人。 ICLR。 [論文] [回購協議]
[2023/06]多代理協作：利用智慧 LLM 代理的力量。塔勒比拉德等人。 arXiv. [紙]
[2023/05]自我編輯：用於程式碼產生的故障感知代碼編輯器。張等人。前十字韌帶。 [紙]
[2023/04]透過 ChatGPT 進行自協作程式碼產生。董等人。 arXiv. [論文] [回購協議]
[2023/03] CAMEL：大語言模型社會「心靈」探索的溝通代理人。李等人。神經資訊處理系統。 [論文] [回購協議]

軟體品質保證角色

[2024/08] SpecRover：透過法學碩士Ruan 等人進行程式碼意圖擷取。 arXiv. [論文] [回購協議]
[2024/07]透過多模態大語言模型進行視覺驅動的自動化移動 GUI 測試。劉等人。 arXiv. [論文] [回購協議]
[2024/06]多代理軟體開發實驗：邁向統一平台Sami 等人。 arXiv. [紙]
[2024/06]透過跨團隊協作進行多代理軟體開發。杜等人。 arXiv. [論文] [回購協議]
[2024/06] AgileCoder：基於敏捷方法論的軟體開發動態協作代理。阮等人。 arXiv. [論文] [回購協議]
[2024/06] MASAI：軟體工程人工智慧代理的模組化架構。阿羅拉等人。 arXiv. [紙]
[2024/05] AutoCoder：使用 AIEV-INSTRUCT 增強程式碼大型語言模型。雷等人。 arXiv. [論文] [回購協議]
[2024/05] MapCoder：用於解決競爭性問題的多代理程式碼產生。伊斯蘭等人。前十字韌帶。 [論文] [回購協議]
[2024/04]法學碩士人工智慧驅動的程式碼審查：早期結果。拉希德等。 arXiv. [紙]
[2024/04] 3DGen：人工智慧輔助產生可證明正確的二進位格式解析器。法庫裡等人。 arXiv [論文]
[2024/04]透過基於 LLM 的多代理協同的統一調試方法。李等人。 arXiv. [論文] [回購協議]
[2024/04]實用的功能級程式修復能走多遠？翔等人。 arXiv. [論文] [回購協議]
[2024/03] MAGIS：基於 LLM 的多代理框架，用於 GitHub 問題解決方案。陶等人。 arXiv. [紙]
[2024/03] AGENTFL：將基於 LLM 的故障定位擴展到專案級情境。秦等人。 arXiv. [紙]
[2024/03]將微調和基於 LLM 的代理程式結合，進行直覺的智慧合約審計和論證。馬等人。 arXiv. [論文] [回購協議]
[2024/03]當基於LLM的程式碼產生滿足軟體開發流程。林等人。 arXiv. [論文] [回購協議]
[2024/03] ACFIX：指導法學碩士利用挖掘的通用 RBAC 實踐對智慧合約中的存取控制漏洞進行情境感知修復。張等人。 arXiv. [紙]
[2024/02] CodeAgent：軟體工程協作代理。唐等人。 arXiv. [論文] [回購協議]
[2024/02]程式碼產生的測試驅動開發。馬修斯等人。 arXiv. [論文] [回購協議]
[2024/02] CodePori：使用多代理進行自主軟體開發的大規模模型。拉希德等。 arXiv. [紙]
[2024/01] XUAT-Copilot：使用大型語言模型進行自動使用者驗收測試的多代理協作系統。王等人。 arXiv. [紙]
[2023/12] AgentCoder：基於多代理程式的程式碼產生與迭代測試和最佳化。黃等人。 arXiv. [紙]
[2023/11]軟體開發中的自主代理：願景論文Rasheed 等人。 arXiv. [紙]
[2023/11]使用自主大型語言模型代理進行意圖驅動的行動 GUI 測試。尹等人。國際科學技術委員會。 [論文] [回購協議]
[2023/10]大語言模型驅動的智慧合約漏洞偵測：新視野。胡等人。 TPS-ISA。 [論文] [回購協議]
[2023/10] AI時代的靜態程式碼分析：深入探討智慧程式碼分析的概念、功能和潛力。範等。 arXiv. [紙]
[2023/10]大型語言模型支援的白盒編譯器模糊測試。楊等人。 arXiv. [論文] [回購協議]
[2023/10] AXNav：重播自然語言的輔助功能測試。泰布等。氣。 [紙]
[2023/08] AutoGen：透過多代理對話啟用下一代 LLM 應用程式。吳等。 arXiv. [論文] [回購協議]
[2023/08] METAGPT：多代理協作框架的元程式設計。洪等人。 ICLR。 [論文] [回購協議]
[2023/07]軟體開發的通訊代理。錢等人。前十字韌帶。 [論文] [回購協議]
[2023/06]自我修復是代碼產生的銀彈嗎？奧勞森等人。 ICLR。 [論文] [回購協議]
[2023/06]多代理協作：利用智慧 LLM 代理的力量。塔勒比拉德等人。 arXiv. [紙]
[2023/05]自我編輯：用於程式碼產生的故障感知代碼編輯器。張等人。前十字韌帶。 [紙]
[2023/03] CAMEL：大語言模型社會「心靈」探索的溝通代理人。李等人。神經資訊處理系統。 [論文] [回購協議]

助理角色

[2024/08]多樣性賦予智慧：整合軟體工程代理的專業知識張等人。 arXiv. [紙]
[2024/08] SpecRover：透過法學碩士Ruan 等人進行程式碼意圖擷取。 arXiv. [論文] [回購協議]
[2024/06] MASAI：軟體工程人工智慧代理的模組化架構。阿羅拉等人。 arXiv. [紙]
[2024/05] MapCoder：用於解決競爭性問題的多代理程式碼產生。伊斯蘭等人。前十字韌帶。 [論文] [回購協議]
[2024/03] MAGIS：基於 LLM 的多代理框架，用於 GitHub 問題解決方案。陶等人。 arXiv. [紙]
[2024/03] CodeS：透過多層 Sketch 將自然語言轉換為程式碼儲存庫。讚等人。 arXiv. [論文] [回購協議]
[2024/03]將微調和基於 LLM 的代理程式結合，進行直覺的智慧合約審計和論證。馬等人。 arXiv. [論文] [回購協議]
[2023/10] AI時代的靜態程式碼分析：深入探討智慧程式碼分析的概念、功能和潛力。範等。 arXiv. [紙]

協作機制

分層結構

[2024/08]多樣性賦予智慧：整合軟體工程代理的專業知識張等人。 arXiv. [紙]
[2024/08] SpecRover：透過法學碩士Ruan 等人進行程式碼意圖擷取。 arXiv. [論文] [回購協議]
[2024/06]多代理軟體開發實驗：邁向統一平台Sami 等人。 arXiv. [紙]
[2024/06]擴展以大語言模式為基礎的多智能體協作Qian等人。 arXiv. [論文] [回購協議]
[2024/06]透過跨團隊協作進行多代理軟體開發。杜等人。 arXiv. [論文] [回購協議]
[2024/06] AgileCoder：基於敏捷方法論的軟體開發動態協作代理。阮等人。 arXiv. [論文] [回購協議]
[2024/05] MapCoder：用於解決競爭性問題的多代理程式碼產生。伊斯蘭等人。前十字韌帶。 [論文] [回購協議]
[2024/05] MARE：需求工程多代理協作框架。金等人。 arXiv. [紙]
[2024/04] AutoCodeRover：自主程序改進。張等人。 ISSTA。 [論文] [回購協議]
[2024/04]實用的功能級程式修復能走多遠？翔等人。 arXiv. [論文] [回購協議]
[2024/03] CodeS：透過多層 Sketch 將自然語言轉換為程式碼儲存庫。讚等人。 arXiv. [論文] [回購協議]
[2024/03]當基於LLM的程式碼產生滿足軟體開發流程。林等人。 arXiv. [論文] [回購協議]
[2024/03] AGENTFL：將基於 LLM 的故障定位擴展到專案級情境。秦等人。 arXiv. [紙]
[2024/02]當資料流分析遇到大型語言模型。王等人。 arXiv. [紙]
[2024/02] CodeAgent：軟體工程協作代理。唐等人。 arXiv. [論文] [回購協議]
[2024/02]您需要更多代理程式。李等人。 arXiv. [紙]
[2024/01]用法學碩士實驗新的程式設計實踐。張等人。 arXiv. [論文] [回購協議]
[2023/11]軟體開發中的自主代理：願景論文Rasheed 等人。 arXiv. [紙]
[2023/10] AI時代的靜態程式碼分析：深入探討智慧程式碼分析的概念、功能和潛力。範等。 arXiv. [紙]
[2023/10]大語言模型驅動的智慧合約漏洞偵測：新視野。胡等人。 TPS-ISA。 [論文] [回購協議]
[2023/10]大型語言模型支援的白盒編譯器模糊測試。楊等人。 arXiv. [論文] [回購協議]
[2023/10]動態 LLM-代理網絡：具有代理團隊優化功能的 LLM-代理協作框架。劉等人。 arXiv. [論文] [回購協議]
[2023/08] METAGPT：多代理協作框架的元程式設計。洪等人。 ICLR。 [論文] [回購協議]
[2023/08]流程：推理和協作人工智慧的建構模組。約西福斯基等人。 arXiv. [論文] [回購協議]
[2023/07]軟體開發的通訊代理。錢等人。前十字韌帶。 [論文] [回購協議]
[2023/05]自我編輯：用於程式碼產生的故障感知代碼編輯器。張等人。前十字韌帶。紙
[2023/04]低代碼法學碩士：法學碩士視覺化程式設計。蔡等人。 arXiv. [論文] [回購協議]

圓形結構

[2024/05] AutoCoder：使用 AIEV-INSTRUCT 增強程式碼大型語言模型。雷等人。 arXiv. [論文] [回購協議]
[2024/04]透過基於 LLM 的多代理協同的統一調試方法。李等人。 arXiv. [論文] [回購協議]
[2024/03] ACFIX：指導法學碩士利用挖掘的通用 RBAC 實踐對智慧合約中的存取控制漏洞進行情境感知修復。張等人。 arXiv. [紙]
[2024/03]透過法學碩士討論達成多角色共識以進行漏洞檢測。毛等人。 QRS波。 [紙]
[2024/03]將微調和基於 LLM 的代理程式結合，進行直覺的智慧合約審計和論證。馬等人。 arXiv. [論文] [回購協議]
[2024/02]程式碼產生的測試驅動開發。馬修斯等人。 arXiv. [論文] [回購協議]
[2024/02] CodePori：使用多代理進行自主軟體開發的大規模模型。拉希德等。 arXiv. [紙]
[2023/12]軟體開發代理人的體驗式共同學習。錢等人。前十字韌帶。 [論文] [回購協議]
[2023/12] AgentCoder：基於多代理程式的程式碼產生與迭代測試和最佳化。黃等人。 arXiv. [紙]
[2023/11] INTERVENOR：透過互動式修復鏈提升大型語言模式的編碼能力。王等人。前十字韌帶。 [論文] [回購協議]
[2023/11]使用自主大型語言模型代理進行意圖驅動的行動 GUI 測試。尹等人。國際科學技術委員會。 [論文] [回購協議]
[2023/10] AXNav：重播自然語言的輔助功能測試。泰布等。氣。 [紙]
[2023/06]自我修復是代碼產生的銀彈嗎？奧勞森等人。 ICLR。 [論文] [回購協議]
[2023/03] CAMEL：大語言模型社會「心靈」探索的溝通代理人。李等人。神經資訊處理系統。 [論文] [回購協議]
[2023/03]反思：具有語言強化學習的語言代理人。辛恩等人。神經資訊處理系統。 [論文] [回購協議]

樹狀結構

[2024/06]擴展以大語言模式為基礎的多智能體協作Qian等人。 arXiv. [論文] [回購協議]
[2024/06] MASAI：軟體工程人工智慧代理的模組化架構。阿羅拉等人。 arXiv. [紙]
[2024/04]自組織代理程式：針對超大規模程式碼產生和最佳化的 LLM 多代理框架。石橋等人。 arXiv. [論文] [回購協議]

星狀結構

[2024/06]擴展以大語言模式為基礎的多智能體協作Qian等人。 arXiv. [論文] [回購協議]
[2024/03] AutoDev：自動化人工智慧驅動開發。圖法諾等。 arXiv [論文]
[2024/01] XUAT-Copilot：使用大型語言模型進行自動使用者驗收測試的多代理協作系統。王等人。 arXiv. [紙]
[2023/10] RCAgent：使用工具增強大型語言模型的自治代理進行雲根本原因分析。王等人。 arXiv. [紙]
[2023/08] AutoGen：透過多代理對話啟用下一代 LLM 應用程式。吳等。 arXiv. [論文] [回購協議]

網狀結構

[2024/06]擴展以大語言模式為基礎的多智能體協作Qian等人。 arXiv. [論文] [回購協議]
[2024/04] 3DGen：人工智慧輔助產生可證明正確的二進位格式解析器。法庫裡等人。 arXiv [論文]

人機協作

人類代理

規劃階段

[2024/01]用法學碩士實驗新的程式設計實踐。張等人。 arXiv. [論文] [回購協議]
[2024/01] LLM4PLC：利用大型語言模型對工業控制系統中的 PLC 進行可驗證程式設計。法基赫等人。國際科學教育協會。 [論文] [回購協議]
[2023/10] AI時代的靜態程式碼分析：深入探討智慧程式碼分析的概念、功能和潛力。範等。 arXiv. [紙]
[2023/04]低代碼法學碩士：法學碩士視覺化程式設計。蔡等人。 arXiv. [論文] [回購協議]

需求階段

[2024/05] MARE：需求工程多代理協作框架。金等人。 arXiv. [紙]
[2024/02]可執行程式碼操作引出更好的 LLM 代理程式。王等人。 ICML。 [論文] [回購協議]
[2024/01]用法學碩士實驗新的程式設計實踐。張等人。 arXiv. [論文] [回購協議]
[2023/10] ClarifyGPT：透過意圖澄清增強基於 LLM 的程式碼產生。穆等人。 arXiv. [論文] [回購協議]
[2023/06] Prompt Sapper：法學碩士授權的 AI 原生服務軟體工程基礎設施。邢等人。 arXiv. [紙]

開發階段

[2024/03] CodeS：透過多層 Sketch 將自然語言轉換為程式碼儲存庫。讚等人。 arXiv. [論文] [回購協議]
[2024/01] LLM4PLC：利用大型語言模型對工業控制系統中的 PLC 進行可驗證程式設計。法基赫等人。國際科學教育協會。 [論文] [回購協議]
[2023/09] MINT：評估 LLMS 與工具和語言回饋的多輪交互作用。王等人。 ICLR。 [論文] [回購協議]
[2023/08]流程：推理和協作人工智慧的建構模組。約西福斯基等人。 arXiv. [論文] [回購協議]
[2023/08] AutoGen：透過多代理對話啟用下一代 LLM 應用程式。吳等。 arXiv. [論文] [回購協議]

評估階段

[2024/01]用法學碩士實驗新的程式設計實踐。張等人。 arXiv. [論文] [回購協議]
[2023/08] Gentopia：工具增強法學碩士協作平台。徐等人。 EMNLP。 [論文] [回購協議]
[2023/06] Prompt Sapper：法學碩士授權的 AI 原生服務軟體工程基礎設施。邢等人。 arXiv. [紙]
[2023/03] ART：大型語言模型的自動多步驟推理與工具使用。帕蘭賈普等人。 arXiv. [論文] [回購協議]

引文

@misc{Agent4SE, title={基於大型語言模型的軟體工程代理：調查}，
       作者={劉俊偉、王凱欣、陳逸軒、彭鑫、陳振鵬、張令明、樓一凌}，年份={2024}，eprint={2409.02977}，archivePrefix={arXiv}，primaryClass={cs.SE} ，url = { https://arxiv.org/abs/2409.02977}，
 }