최근 LLM(Large Language Models)의 발전으로 AI 에이전트, 즉 LLM 기반 에이전트의 새로운 패러다임이 형성되었습니다. 독립형 LLM에 비해 LLM 기반 에이전트는 외부 리소스 및 도구를 인식하고 활용하는 기능으로 LLM을 향상시켜 LLM의 다양성과 전문성을 크게 확장합니다. 현재까지 소프트웨어 엔지니어링(SE) 분야에서는 LLM 기반의 에이전트가 적용되어 놀라운 효율성을 보여주고 있습니다. 여러 에이전트와 인간 상호 작용 간의 시너지 효과는 복잡한 실제 SE 문제를 해결하는 데 더 많은 가능성을 제공합니다. 본 연구에서는 SE를 위한 LLM 기반 에이전트에 대한 포괄적이고 체계적인 설문 조사를 제시합니다. 우리는 106편의 논문을 수집하여 이를 SE 관점과 에이전트 관점이라는 두 가지 관점으로 분류했습니다. 또한 우리는 이 중요한 영역에서 열려 있는 과제와 향후 방향에 대해 논의합니다.
? 우리는 소프트웨어 엔지니어링 작업과 에이전트 아키텍처 의 관점에서 Agent4SE의 진행 상황을 체계적으로 요약했습니다.
? 논문 링크: 소프트웨어 엔지니어링을 위한 대규모 언어 모델 기반 에이전트: 설문 조사
이 연구 분야는 빠르게 발전하고 있습니다. 업데이트를 따라가려면 이 저장소에 별표를 표시하세요!
[2024/09/04] arXiv 설문조사의 첫 번째 버전을 공개했습니다.
소식
SE 관점
결함 위치 파악
프로그램 복구
통합 디버깅
단위 테스트
시스템 테스트
정적 버그 감지
코드 검토
요구공학
코드 생성
확인
정적 코드 검사
테스트
디버깅
풀어 주다
엔드투엔드 소프트웨어 개발
엔드 투 엔드 소프트웨어 유지 관리
상담원의 관점
계획 단계
요구사항 단계
개발 단계
평가 단계
상담원 역할
협업 메커니즘
계획
메모리
지각
행동
에이전트 프레임워크
멀티 에이전트 시스템
인간-에이전트 협업
소환
유지관리자
문의하기
스타의 역사
[2024/05] MARE: 요구사항 엔지니어링을 위한 다중 에이전트 협업 프레임워크. Jinet al. arXiv. [종이]
[2024/04] Elicitron: 설계 요구사항 도출을 위한 LLM 에이전트 기반 시뮬레이션 프레임워크. Ataeiet al. arXiv. [종이]
[2024/01] SpecGen: 대규모 언어 모델을 통한 공식 프로그램 사양의 자동 생성. Maet al. arXiv. [종이] [저장소]
[2023/10] 생성 AI를 통한 요구 엔지니어링 발전: LLM의 역할 평가. Aroraet al. arXiv. [종이]
[2024/11] 계획 중심 프로그래밍: 대규모 언어 모델 프로그래밍 작업 흐름 Lei et al. arXiv [논문]
[2024/11] 프로그래밍 체인: 지리공간 코드 생성을 위한 대규모 언어 모델 강화 Hou et al. arXiv [논문]
[2024/10] LLM을 위한 다중 프로그래밍 언어 샌드박스 Dou et al. arXiv [논문]
[2024/10] SceneGenAgent: 코딩 에이전트를 사용한 정확한 산업 장면 생성 Xia et al. arXiv [논문] [저장소]
[2024/10] MCCoder: LLM 지원 코드 생성 및 엄격한 검증을 통한 모션 제어 간소화 Li 외. arXiv [논문] [저장소]
[2024/10] Agents4PLC: LLM 기반 에이전트를 사용하여 산업 제어 시스템에서 폐쇄 루프 PLC 코드 생성 및 검증 자동화 Liu 외. arXiv [논문] [저장소]
[2024/10] LLM 최적화 도구를 사용한 DSL 기반 코드 생성을 통해 병렬 프로그램 성능 향상 Wei et al. arXiv. [종이]
[2024/10] AgentBank: 50000개 이상의 상호 작용 궤적에 대한 미세 조정을 통한 일반화된 LLM 에이전트를 향하여 Song et al. arXiv. [종이]
[2024/10] RLEF: 강화 학습을 통한 실행 피드백의 접지 코드 LLMS Gehring et al. arXiv. [종이]
[2024/10] 선생님보다 낫다: 권한 있는 AI 피드백으로부터 학습하는 LLM 에이전트 Choudhury et al. arXiv. [종이]
[2024/10] AMR-Evol: 적응형 모듈식 응답 진화는 코드 생성에서 대규모 언어 모델에 대한 더 나은 지식 추출을 유도합니다. Luo et al. arXiv. [종이] [저장소]
[2024/10] RGD: 개선 및 생성 지침을 통한 다중 LLM 기반 에이전트 디버거 Jin et al. arXiv. [종이]
[2024/09] AutoSafeCoder: 정적 분석 및 Fuzz 테스트를 통해 LLM 코드 생성 보안을 위한 다중 에이전트 프레임워크 Nunez et al. arXiv [논문] [저장소]
[2024/09] 다중 계획 탐색 및 피드백 기반 개선을 통한 코드 생성을 위한 쌍 프로그래밍 프레임워크 Zhang et al. arXiv [논문] [저장소]
[2024/08] Chaff 선별: 생성된 코드 후보 순위 지정을 위한 실행 피드백 활용 Sun et al. arXiv [논문]
[2024/08] CODEXGRAPH: 코드 그래프 데이터베이스를 통해 대규모 언어 모델 및 코드 저장소 연결 Liu et al. arXiv. [종이] [저장소]
[2024/07] OPENHANDS: 일반 에이전트인 AI 소프트웨어 개발자를 위한 개방형 플랫폼 Wang et al. arXiv [논문] [저장소]
[2024/05] 리포지토리에 대한 반복적이고 도구 강화된 추론을 사용하여 자연어에서 클래스 수준 코드 생성. Deshpandeet al. arXiv. [종이]
[2024/05] MapCoder: 경쟁 문제 해결을 위한 다중 에이전트 코드 생성. 이슬람 등. ACL. [종이] [저장소]
[2024/05] AutoCoder: AIEV-INSTRUCT로 코드 대규모 언어 모델 강화. Leiet al. arXiv. [종이] [저장소]
[2024/04] 3DGen: 입증 가능하게 올바른 바이너리 형식 파서의 AI 지원 생성 . Fakhouryet al. arXiv [논문]
[2024/04] 자체 구성 에이전트: 초대형 코드 생성 및 최적화를 위한 LLM 다중 에이전트 프레임워크. Ishibashiet al. arXiv. [종이] [저장소]
[2024/03] AutoDev: 자동화된 AI 기반 개발 . Tufanoet al. arXiv [논문]
[2024/03] CoCoST: 온라인 검색 및 정확성 테스트를 통한 자동 복합 코드 생성. 그 외 여러분. arXiv. [종이]
[2024/03] RAT: 검색 증강 생각은 Long-Horizon Generation에서 상황 인식 추론을 유도합니다 . 왕 외. arXiv. [종이] [저장소]
[2024/02] 실행 가능한 코드 작업으로 더 나은 LLM 에이전트를 유도합니다. 왕 외. ICML. [종이] [저장소]
[2024/02] 더 많은 에이전트만 있으면 됩니다. Li et al. arXiv. [종이]
[2024/02] 코드 생성을 위한 테스트 중심 개발. Mathewset al. arXiv. [종이] [저장소]
[2024/02] LDB: 런타임 실행을 단계별로 검증하는 대규모 언어 모델 디버거. Zhonget al. arXiv. [종이] [저장소]
[2024/01] CodeAgent: 실제 Repo 수준 코딩 문제를 위한 도구 통합 에이전트 시스템으로 코드 생성 향상. Zhang et al. ACL. [종이]
[2024/01] 리포지토리 수준 코드 생성에서 자동 완성 도구를 사용하도록 코드 LLM을 교육합니다. 왕 외. arXiv. [종이]
[2024/01] AlphaCodium을 사용한 코드 생성: 프롬프트 엔지니어링에서 흐름 엔지니어링까지. Ridniket al. arXiv. [종이] [저장소]
[2023/12] AgentCoder: 반복 테스트 및 최적화를 통한 다중 에이전트 기반 코드 생성. Huang et al. arXiv. [종이]
[2023/12] LLM4TDD: 대규모 언어 모델을 사용한 테스트 중심 개발 모범 사례. Piyaet al. arXiv. [종이] [저장소]
[2023/11] INTERVENOR: 대화형 수리 체인을 통해 대규모 언어 모델의 코딩 능력 촉진. 왕 외. ACL. [종이] [저장소]
[2023/10] 동적 LLM-에이전트 네트워크: 에이전트 팀 최적화를 갖춘 LLM-에이전트 협업 프레임워크. Liu et al. arXiv. [종이] [저장소]
[2023/10] 여우원숭이: 언어 에이전트를 위한 자연어와 코드의 조화. Xu et al. ICLR. [종이] [저장소]
[2023/10] ClarifyGPT: 의도 명확화를 통해 LLM 기반 코드 생성 지원. Muet al. arXiv. [종이] [저장소]
[2023/10] 코드체인: 대표적인 하위 모듈을 통한 자체 개정 체인을 통한 모듈형 코드 생성을 지향합니다. Le et al. ICLR. [종이] [저장소]
[2023/10] 언어 에이전트 트리 검색은 언어 모델의 추론, 행동 및 계획을 통합합니다. Zhouet al. ICML. [종이] [저장소]
[2023/09] MINT: 도구 및 언어 피드백을 사용한 다단계 상호 작용에서 LLMS를 평가합니다. 왕 외. ICLR. [종이] [저장소]
[2023/09] 더 나은 코드 생성을 위한 대규모 언어 모델의 테스트 사례 중심 프로그래밍 이해. Tianet al. arXiv. [종이]
[2023/09] CodePlan: LLM 및 계획을 사용한 리포지토리 수준 코딩. Bairiet al. FSE. [종이] [저장소]
[2023/09] 오용에서 숙달까지: 지식 기반 AI 체이닝으로 코드 생성 향상. Renet al. ASE. [종이]
[2023/09] Parsel?: 분해 구성을 통한 언어 모델을 이용한 알고리즘 추론. Zelikmanet al. NeurIPS. [종이] [저장소]
[2023/08] AutoGen: 다중 에이전트 대화를 통해 차세대 LLM 애플리케이션 활성화. Wuet al. arXiv. [종이] [저장소]
[2023/08] Gentopia: 도구 증강 LLM을 위한 협업 플랫폼. Xu et al. EMNLP. [종이] [저장소]
[2023/08] 흐름: 추론 및 협업 AI의 구성 요소. Josifoskiet al. arXiv. [종이] [저장소]
[2023/08] CodeCoT: 코드 생성을 위한 CoT 추론의 코드 구문 오류 해결. Huang et al. arXiv. [종이]
[2023/06] SELFEVOLVE: 대규모 언어 모델을 통한 코드 진화 프레임워크. Jianget al. arXiv. [종이]
[2023/06] InterCode: 실행 피드백을 통한 대화형 코딩 표준화 및 벤치마킹. Yanget al. NeurIPS. [종이] [저장소]
[2023/06] 자가 수리가 코드 생성의 묘미인가요?. Olaussonet al. ICLR. [종이] [저장소]
[2023/05] ToolCoder: API 검색 도구를 사용하도록 코드 생성 모델을 가르칩니다. Zhang et al. arXiv. [종이]
[2023/05] 자가 편집: 코드 생성을 위한 오류 인식 코드 편집기 . Zhang et al. ACL. [종이]
[2023/04] 대규모 언어 모델의 자체 디버깅 교육. Chenet al. ICLR. [종이]
[2023/04] 대규모 언어 모델을 사용한 완전 자율 프로그래밍. Liventsevet al. 게코. [종이]
[2023/03] CAMEL: 대규모 언어 모델 사회의 "마음" 탐색을 위한 의사소통 에이전트. Li et al. NeurIPS. [종이] [저장소]
[2023/03] 반사: 언어 강화 학습을 통한 언어 에이전트. Shinnet al. NeurIPS. [종이] [저장소]
[2023/03] SELF-REFINE: 셀프 피드백을 통한 반복적 개선. Madaanet al. NeurIPS. [종이] [저장소]
[2024/10] Self-Evolution을 통한 Rust 코드 자동 증명 생성 Chen et al. arXiv [논문]
[2024/09] AutoVerus: Rust 코드를 위한 자동 증명 생성 Yang et al. arXiv [논문]
[2024/10] 효율적이고 정확한 스마트 계약 감사를 위해 미세 조정된 언어 모델 활용 Wei et al. arXiv [논문] [저장소]
[2024/10] LLM-SmartAudit: 고급 스마트 계약 취약점 탐지 Wei et al. arXiv. [종이] [저장소]
[2024/05] 보안 취약점 탐지를 위한 LLM 지원 정적 분석. Li et al. arXiv. [종이]
[2024/05] PropertyGPT: 검색 증강 속성 생성을 통한 LLM 기반 스마트 계약의 공식 검증. Liu et al. arXiv. [종이] [저장소]
[2024/03] 취약점 탐지를 위한 LLM 토론을 통한 다중 역할 합의. Maoet al. QRS. [종이]
[2024/03] 직관적인 스마트 계약 감사를 위한 미세 조정 및 LLM 기반 에이전트 결합 및 정당성. Maet al. arXiv. [종이] [저장소]
[2024/02] 데이터 흐름 분석이 대규모 언어 모델을 만났을 때. 왕 외. arXiv. [종이]
[2024/01] LLM4Vuln: LLM의 취약성 추론을 분리하고 강화하기 위한 통합 평가 프레임워크입니다. Sunet al. arXiv. [종이] [저장소]
[2023/12] E&V: 의사 코드 실행 및 검증을 통해 대규모 언어 모델에 정적 분석을 수행하도록 유도. Haoet al. arXiv. [종이]
[2023/10] 대규모 언어 모델 기반 스마트 계약 취약점 탐지: 새로운 관점. Huet al. TPS-ISA. [종이] [저장소]
[2023/10] AI 시대의 정적 코드 분석: 지능형 코드 분석의 개념, 기능 및 잠재력에 대한 심층 탐구. 팬 외. arXiv. [종이]
[2023/08] 실용적인 버그 탐지를 위한 정적 분석 강화: LLM 통합 접근 방식. Li et al. arXiv. [종이] [저장소]
[2023/03] ART: 대규모 언어 모델을 위한 자동 다단계 추론 및 도구 사용. Paranjapeet al. arXiv. [종이] [저장소]
[2024/10] 판사로서의 대리인: 대리인을 통한 대리인 평가 Zhuge et al. arXiv. [종이] [저장소]
[2024/09] 분할 및 정복: 지역화 및 수정을 통한 코드 수정 자동화 Wang et al. ACM 트랜스. 소프트웨어 영어 방법. [종이]
[2024/04] LLM을 통한 AI 기반 코드 검토: 초기 결과. Rasheedet al. arXiv. [종이]
[2024/02] CodeAgent: 소프트웨어 엔지니어링을 위한 협업 에이전트. Tanget al. arXiv. [종이] [저장소]
[2023/10] AI 시대의 정적 코드 분석: 지능형 코드 분석의 개념, 기능 및 잠재력에 대한 심층 탐구. 팬 외. arXiv. [종이]
[2023/09] CORE: LLM을 사용하여 코드 품질 문제 해결. Wadhwaet al. FSE. [종이] [저장소]
[2024/11] ReAccept: 동적 검증 및 대규모 언어 모델을 기반으로 하는 생산 및 테스트 코드의 자동화된 공동 진화 Chi et al. arXiv [논문] [저장소]
[2024/09] LLM 기반 코드 생성을 통한 Python 기호 실행 Wang et al. arXiv [논문]
[2024/06] Mokav: LLM을 사용한 실행 중심 차등 테스트. Etemadiet al. arXiv. [종이] [저장소]
[2024/04] 프로그램 분석을 통해 다루기 어려운 분기에 대한 LLM 기반 테스트 생성을 향상합니다. Yanget al. arXiv. [종이]
[2024/03] AutoDev: 자동화된 AI 기반 개발 . Tufanoet al. arXiv [논문]
[2024/03] COVERUP: Coverage-Guided LLM 기반 테스트 생성. Pizzornoet al. arXiv. [종이] [저장소]
[2023/08] 사전 학습된 대형 언어 모델 및 돌연변이 테스트를 사용한 효과적인 테스트 생성. Dakhelet al. 정보 소프트웨어 기술. . [종이] [저장소]
[2023/05] 수동 테스트는 더 이상 없나요? 단위 테스트 생성을 위한 ChatGPT 평가 및 개선. Yuan et al. arXiv. [종이] [저장소]
[2023/05] ChatUniTest: LLM 기반 테스트 생성을 위한 프레임워크. Chenet al. FSE. [종이] [저장소]
[2023/02] 자동화된 단위 테스트 생성을 위한 대규모 언어 모델 사용에 대한 실증적 평가. Schäferet al. IEEE 트랜스. 소프트웨어 엔지니어링.. [논문] [저장소]
[2024/11] LLM 기반 퍼즈 드라이버 생성을 위한 코드 지식 그래프 강화 시스템 Xu et al. arXiv. [종이]
[2024/07] 다중 모드 대형 언어 모델을 통한 비전 기반 자동화 모바일 GUI 테스트. Liu et al. arXiv. [종이] [저장소]
[2024/04] LLM 에이전트는 1일 취약점을 자율적으로 악용할 수 있습니다. Fang et al. arXiv. [종이]
[2024/02] 지금 REST를 사용할 수 있습니다: 대규모 언어 모델을 사용한 RESTful API의 자동화된 사양 추론 및 블랙박스 테스트. Decropet al. arXiv. [종이] [저장소]
[2024/01] XUAT-Copilot: 대규모 언어 모델을 사용한 자동화된 사용자 승인 테스트를 위한 다중 에이전트 협업 시스템. 왕 외. arXiv. [종이]
[2024/01] KernelGPT: 대규모 언어 모델을 통해 향상된 커널 퍼징. Yanget al. arXiv. [종이]
[2023/11] 자율적 대형 언어 모델 에이전트를 사용한 의도 기반 모바일 GUI 테스트 . 윤 외. ICST. [종이] [저장소]
[2023/10] LLM을 테스트 전문가로 만들기: 기능 인식 결정을 통해 모바일 GUI 테스트에 인간과 유사한 상호 작용을 도입합니다. Liu et al. ICSE. [종이]
[2023/10] AXNav: 자연어에서 접근성 테스트 재생. Taebet al. 치. [종이]
[2023/10] 대형 언어 모델로 강화된 화이트박스 컴파일러 퍼징. Yanget al. arXiv. [종이] [저장소]
[2023/10] 한계 테스트: 대규모 언어 모델을 사용한 모바일 앱 충돌 감지를 위한 비정상적인 텍스트 입력 생성. Liu et al. ICSE. [종이] [저장소]
[2023/08] PENTESTGPT: LLM 기반 자동 침투 테스트 도구입니다. Deng et al. arXiv. [종이] [저장소]
[2023/08] Fuzz4All: 대규모 언어 모델을 사용한 범용 퍼징. Xiaet al. ICSE. [종이] [저장소]
[2023/07] 대규모 언어 모델을 사용하여 효과적인 증인 프로그램을 생성하여 컴파일러 버그 격리. Tu et al. IEEE 트랜스. 소프트웨어공학 [종이] [저장소]
[2023/06] 프롬프트만 있으면 됩니다: 대규모 언어 모델을 사용한 자동화된 Android 버그 재생. Feng et al. ICSE. [종이] [저장소]
[2024/11] FlexFL: 오픈 소스 대형 언어 모델을 사용한 유연하고 효과적인 오류 위치 파악 Xu et al. arXiv [논문]
[2024/09] LLM 에이전트 및 자체 반사를 사용한 순서 코드 분석을 통해 오류 위치 파악 강화 Rafi et al. arXiv [논문]
[2024/03] AGENTFL: LLM 기반 오류 위치 파악을 프로젝트 수준 컨텍스트로 확장합니다. Qinet al. arXiv. [종이]
[2023/10] RCAgent: 도구로 강화된 대규모 언어 모델을 사용한 자율 에이전트에 의한 클라우드 근본 원인 분석. 왕 외. arXiv. [종이]
[2023/08] LLM 기반 설명 가능한 결함 위치 파악의 정량적 및 정성적 평가 . Kanget al. FSE. [종이]
[2024/07] OPENHANDS: 일반 에이전트인 AI 소프트웨어 개발자를 위한 개방형 플랫폼 Wang et al. arXiv [논문] [저장소]
[2024/10] 대규모 언어 모델을 사용한 효율적인 프로그램 복구를 위한 의미 기반 검색 Thanh et al. arXiv [논문]
[2024/09] 테스트 박리의 신경 기호 복구 . Chenet al. ISSTA. [종이]
[2024/04] 실용적인 기능 수준 프로그램 복구, 어디까지 갈 수 있을까?. Xianget al. arXiv. [종이] [저장소]
[2024/03] RepairAgent: 프로그램 복구를 위한 자율 LLM 기반 에이전트입니다. Bouzeniaet al. arXiv. [종이]
[2024/03] ACFIX: 스마트 계약의 액세스 제어 취약점에 대한 컨텍스트 인식 복구를 위한 마이닝된 공통 RBAC 관행을 갖춘 LLM 안내. Zhang et al. arXiv. [종이]
[2024/02] CigaR: LLM을 통한 비용 효율적인 프로그램 복구. Hidvégiet al. arXiv. [종이] [저장소]
[2023/04] 대규모 언어 모델 기반 과학 디버깅을 통한 설명 가능한 자동 디버깅. Kanget al. arXiv. [종이]
[2023/04] 대화를 계속하세요: ChatGPT를 사용하여 버그 337개 중 162개를 각각 $0.42에 수정합니다. Xiaet al. arXiv. [종이]
[2023/01] 대화형 자동 프로그램 복구. Xiaet al. arXiv. [종이]
[2024/04] LLM 기반 다중 에이전트 시너지를 통한 통합 디버깅 접근 방식. Lee et al. arXiv. [종이] [저장소]
[2024/02] LDB: 런타임 실행을 단계별로 검증하는 대규모 언어 모델 디버거. Zhonget al. arXiv. [종이] [저장소]
[2024/08] GoNoGo: 자동차 소프트웨어 출시 의사결정 간소화를 위한 효율적인 LLM 기반 다중 에이전트 시스템 Khoee et al. arXiv [논문]
[2024/09] ChatGPT Zhao et al. 을 사용하여 Java 코드 페어링 생성 . 이론컴퓨터공학 [논문]
[2024/07] 인간-AI 팀워크를 통한 민첩한 기반 생성 소프트웨어 개발 강화 Zhang et al. TOSEM [종이] [저장소]
[2024/06] 다중 에이전트 소프트웨어 개발 실험: 통합 플랫폼을 향하여 Sami et al. arXiv. [종이]
[2024/06] 대규모 언어 모델 기반 다중 에이전트 협업 확장 Qian et al. arXiv. [종이] [저장소]
[2024/06] 팀 간 협업을 통한 다중 에이전트 소프트웨어 개발. Duet al. arXiv. [종이] [저장소]
[2024/06] AgileCoder: Agile 방법론을 기반으로 한 소프트웨어 개발을 위한 동적 협업 에이전트. Nguyenet al. arXiv. [종이] [저장소]
[2024/05] 소프트웨어 개발 에이전트의 반복 경험 개선. Qianet al. arXiv. [종이]
[2024/03] LLM 기반 코드 생성이 소프트웨어 개발 프로세스를 만났을 때. Linet al. arXiv. [종이] [저장소]
[2024/03] CodeS: 다층 스케치를 통한 자연어를 코드 저장소로. Zan et al. arXiv. [종이] [저장소]
[2024/02] CodePori: 다중 에이전트를 활용한 자율 소프트웨어 개발을 위한 대규모 모델. Rasheedet al. arXiv. [종이]
[2024/01] LLM을 통한 새로운 프로그래밍 실습 실험. Zhang et al. arXiv. [종이] [저장소]
[2024/01] LLM4PLC: 산업 제어 시스템에서 PLC의 검증 가능한 프로그래밍을 위한 대규모 언어 모델 활용. Fakihet al. ICSE. [종이] [저장소]
[2023/12] 소프트웨어 개발 에이전트의 체험적 공동 학습. Qianet al. ACL. [종이] [저장소]
[2023/11] 소프트웨어 개발의 자율 에이전트: 비전 논문 Rasheed et al. arXiv. [종이]
[2023/09] AutoAgents: 자동 에이전트 생성을 위한 프레임워크. Chenet al. arXiv. [종이] [저장소]
[2023/08] AgentVerse: 다중 에이전트 협업 촉진 및 새로운 동작 탐색. Chenet al. ICLR. [종이] [저장소]
[2023/08] METAGPT: 멀티 에이전트 협업 프레임워크를 위한 메타 프로그래밍. 홍 외. ICLR. [종이] [저장소]
[2023/07] 소프트웨어 개발을 위한 의사소통 에이전트. Qianet al. ACL. [종이] [저장소]
[2023/06] 다중 에이전트 협업: 지능형 LLM 에이전트의 성능 활용. Talebiradet al. arXiv. [종이]
[2023/06] Prompt Sapper: AI 기반 서비스를 위한 LLM 기반 소프트웨어 엔지니어링 인프라. Xinget al. arXiv. [종이]
[2023/04] ChatGPT를 통한 자체 협업 코드 생성. Dong et al. arXiv. [종이] [저장소]
[2023/04] 로우 코드 LLM: LLM을 통한 시각적 프로그래밍. Caiet al. arXiv. [종이] [저장소]
[2024/11] 지속적인 학습자로서의 LLM: 소프트웨어 문제에서 결함 코드의 재생산 개선 Lin et al. arXiv [논문]
[2024/11] Human-In-the-Loop 소프트웨어 개발 에이전트 Takerngsaksiri et al. arXiv [논문]
[2024/11] Lingma SWE-GPT: 자동화된 소프트웨어 개선을 위한 개방형 개발 프로세스 중심 언어 모델 Ma et al. arXiv [논문] [저장소]
[2024/10] RepoGraph: 리포지토리 수준 코드 그래프로 AI 소프트웨어 엔지니어링 강화 Ouyang et al. arXiv [논문] [저장소]
[2024/09] MarsCode 에이전트: AI 기반 자동 버그 수정 Liu et al. arXiv. [종이]
[2024/08] CODEXGRAPH: 코드 그래프 데이터베이스를 통해 대규모 언어 모델 및 코드 저장소 연결 Liu et al. arXiv. [종이] [저장소]
[2024/08] 다양성은 지능을 강화합니다: 소프트웨어 엔지니어링 에이전트의 전문 지식 통합 Zhang et al. arXiv. [종이]
[2024/08] SpecRover: LLM을 통한 코드 의도 추출 Ruan et al. arXiv. [종이] [저장소]
[2024/07] OPENHANDS: 일반 에이전트인 AI 소프트웨어 개발자를 위한 개방형 플랫폼 Wang et al. arXiv [논문] [저장소]
[2024/07] Agentless: LLM 기반 소프트웨어 엔지니어링 에이전트의 신비화. Xiaet al. arXiv. [종이] [저장소]
[2024/06] 전체 소프트웨어 리포지토리를 이해하는 방법은 무엇입니까?. Maet al. arXiv. [종이] [저장소]
[2024/06] CODER: 멀티 에이전트 및 작업 그래프를 통한 문제 해결. Chenet al. arXiv. [종이] [저장소]
[2024/06] MASAI: 소프트웨어 엔지니어링 AI 에이전트를 위한 모듈형 아키텍처. Aroraet al. arXiv. [종이]
[2024/05] SWE-AGENT: 에이전트-컴퓨터 인터페이스를 통해 자동화된 소프트웨어 엔지니어링이 가능합니다. Yanget al. arXiv. [종이] [저장소]
[2024/04] AutoCodeRover: 자율 프로그램 개선. Zhang et al. ISSTA. [종이] [저장소]
[2024/03] MAGIS: GitHub 문제 해결을 위한 LLM 기반 다중 에이전트 프레임워크. Taoet al. arXiv. [종이]
기준
[2024/10] SWE-Bench+: LLM을 위한 향상된 코딩 벤치마크 Aleithan et al. arXiv. [종이]
[2024/10] SWE-벤치 멀티모달: AI 시스템이 시각적 소프트웨어 도메인으로 일반화됩니까? Yanget al. arXiv. [종이] [저장소]
[2024/08] SWE-bench-java: Java Zan 외 GitHub 문제 해결 벤치마크 arXiv [논문] [저장소]
[2024/07] Agentless: LLM 기반 소프트웨어 엔지니어링 에이전트의 신비화. Xiaet al. arXiv. [종이] [저장소]
[2023/10] Swe-bench: 언어 모델이 실제 github 문제를 해결할 수 있습니까? Jimenezet al. ICLR [논문] [저장소]
단일 회전 계획
[2024/06] AgileCoder: Agile 방법론을 기반으로 한 소프트웨어 개발을 위한 동적 협업 에이전트. Nguyenet al. arXiv. [종이] [저장소]
[2024/06] 팀 간 협업을 통한 다중 에이전트 소프트웨어 개발. Duet al. arXiv. [종이] [저장소]
[2024/05] MapCoder: 경쟁 문제 해결을 위한 다중 에이전트 코드 생성. 이슬람 등. ACL. [종이] [저장소]
[2024/03] MAGIS: GitHub 문제 해결을 위한 LLM 기반 다중 에이전트 프레임워크. Taoet al. arXiv. [종이]
[2024/03] CodeS: 다층 스케치를 통한 자연어를 코드 저장소로. Zan et al. arXiv. [종이] [저장소]
[2024/03] CoCoST: 온라인 검색 및 정확성 테스트를 통한 자동 복합 코드 생성. 그 외 여러분. arXiv. [종이]
[2024/02] CodePori: 다중 에이전트를 활용한 자율 소프트웨어 개발을 위한 대규모 모델. Rasheedet al. arXiv. [종이]
[2024/01] CodeAgent: 실제 Repo 수준 코딩 문제를 위한 도구 통합 에이전트 시스템으로 코드 생성 향상. Zhang et al. ACL. [종이]
[2024/01] LLM4PLC: 산업 제어 시스템에서 PLC의 검증 가능한 프로그래밍을 위한 대규모 언어 모델 활용. Fakihet al. ICSE. [종이] [저장소]
[2024/01] LLM을 통한 새로운 프로그래밍 실습 실험. Zhang et al. arXiv. [종이] [저장소]
[2023/11] 소프트웨어 개발의 자율 에이전트: 비전 논문 Rasheed et al. arXiv. [종이]
[2023/10] AI 시대의 정적 코드 분석: 지능형 코드 분석의 개념, 기능 및 잠재력에 대한 심층 탐구. 팬 외. arXiv. [종이]
[2023/09] Parsel?: 분해 구성을 통한 언어 모델을 이용한 알고리즘 추론. Zelikmanet al. NeurIPS. [종이] [저장소]
[2023/08] PENTESTGPT: LLM 기반 자동 침투 테스트 도구입니다. Deng et al. arXiv. [종이] [저장소]
[2023/08] 흐름: 추론 및 협업 AI의 구성 요소. Josifoskiet al. arXiv. [종이] [저장소]
[2023/08] METAGPT: 멀티 에이전트 협업 프레임워크를 위한 메타 프로그래밍. 홍 외. ICLR. [종이] [저장소]
[2023/07] 소프트웨어 개발을 위한 의사소통 에이전트. Qianet al. ACL. [종이] [저장소]
[2023/04] ChatGPT를 통한 자체 협업 코드 생성. Dong et al. arXiv. [종이] [저장소]
[2023/04] 로우 코드 LLM: LLM을 통한 시각적 프로그래밍. Caiet al. arXiv. [종이] [저장소]
다회전 계획
[2024/03] RAT: 검색 증강 생각은 Long-Horizon Generation에서 상황 인식 추론을 유도합니다 . 왕 외. arXiv. [종이] [저장소]
반응형
[2024/06] MASAI: 소프트웨어 엔지니어링 AI 에이전트를 위한 모듈형 아키텍처. Aroraet al. arXiv. [종이]
[2024/02] 실행 가능한 코드 작업으로 더 나은 LLM 에이전트를 유도합니다. 왕 외. ICML. [종이] [저장소]
[2024/01] CodeAgent: 실제 Repo 수준 코딩 문제를 위한 도구 통합 에이전트 시스템으로 코드 생성 향상. Zhang et al. ACL. [종이]
[2024/01] XUAT-Copilot: 대규모 언어 모델을 사용한 자동화된 사용자 승인 테스트를 위한 다중 에이전트 협업 시스템. 왕 외. arXiv. [종이]
[2023/11] 자율적 대형 언어 모델 에이전트를 사용한 의도 기반 모바일 GUI 테스트 . 윤 외. ICST. [종이] [저장소]
[2023/10] RCAgent: 도구로 강화된 대규모 언어 모델을 사용한 자율 에이전트에 의한 클라우드 근본 원인 분석. 왕 외. arXiv. [종이]
[2023/10] 언어 에이전트 트리 검색은 언어 모델의 추론, 행동 및 계획을 통합합니다. Zhouet al. ICML. [종이] [저장소]
[2023/10] AXNav: 자연어에서 접근성 테스트 재생. Taebet al. 치. [종이]
[2023/09] CodePlan: LLM 및 계획을 사용한 리포지토리 수준 코딩. Bairiet al. FSE. [종이] [저장소]
계층화
[2024/04] 자체 구성 에이전트: 초대형 코드 생성 및 최적화를 위한 LLM 다중 에이전트 프레임워크. Ishibashiet al. arXiv. [종이] [저장소]
장기 기억
[2024/06] 대규모 언어 모델 기반 다중 에이전트 협업 확장 Qian et al. arXiv. [종이] [저장소]
[2024/06] 팀 간 협업을 통한 다중 에이전트 소프트웨어 개발. Duet al. arXiv. [종이] [저장소]
[2024/05] 소프트웨어 개발 에이전트의 반복 경험 개선. Qianet al. arXiv. [종이]
[2023/12] 소프트웨어 개발 에이전트의 체험적 공동 학습. Qianet al. ACL. [종이] [저장소]
[2023/11] 자율적 대형 언어 모델 에이전트를 사용한 의도 기반 모바일 GUI 테스트 . 윤 외. ICST. [종이] [저장소]
[2023/09] AutoAgents: 자동 에이전트 생성을 위한 프레임워크. Chenet al. arXiv. [종이] [저장소]
[2023/08] METAGPT: 멀티 에이전트 협업 프레임워크를 위한 메타 프로그래밍. 홍 외. ICLR. [종이] [저장소]
[2023/07] 소프트웨어 개발을 위한 의사소통 에이전트. Qianet al. ACL. [종이] [저장소]
[2023/03] 반사: 언어 강화 학습을 통한 언어 에이전트. Shinnet al. NeurIPS. [종이] [저장소]
단기 기억
[2024/07] 다중 모드 대형 언어 모델을 통한 비전 기반 자동화 모바일 GUI 테스트. Liu et al. arXiv. [종이] [저장소]
[2024/06] 대규모 언어 모델 기반 다중 에이전트 협업 확장 Qian et al. arXiv. [종이] [저장소]
[2024/06] 팀 간 협업을 통한 다중 에이전트 소프트웨어 개발. Duet al. arXiv. [종이] [저장소]
[2024/06] AgileCoder: Agile 방법론을 기반으로 한 소프트웨어 개발을 위한 동적 협업 에이전트. Nguyenet al. arXiv. [종이] [저장소]
[2024/04] 자체 구성 에이전트: 초대형 코드 생성 및 최적화를 위한 LLM 다중 에이전트 프레임워크. Ishibashiet al. arXiv. [종이] [저장소]
[2024/03] MAGIS: GitHub 문제 해결을 위한 LLM 기반 다중 에이전트 프레임워크. Taoet al. arXiv. [종이]
[2024/01] XUAT-Copilot: 대규모 언어 모델을 사용한 자동화된 사용자 승인 테스트를 위한 다중 에이전트 협업 시스템. 왕 외. arXiv. [종이]
[2023/12] E&V: 의사 코드 실행 및 검증을 통해 대규모 언어 모델에 정적 분석을 수행하도록 유도. Haoet al. arXiv. [종이]
[2023/11] 자율적 대형 언어 모델 에이전트를 사용한 의도 기반 모바일 GUI 테스트 . 윤 외. ICST. [종이] [저장소]
[2023/10] RCAgent: 도구로 강화된 대규모 언어 모델을 사용한 자율 에이전트에 의한 클라우드 근본 원인 분석. 왕 외. arXiv. [종이]
[2023/10] AI 시대의 정적 코드 분석: 지능형 코드 분석의 개념, 기능 및 잠재력에 대한 심층 탐구. 팬 외. arXiv. [종이]
[2023/10] LLM을 테스트 전문가로 만들기: 기능 인식 결정을 통해 모바일 GUI 테스트에 인간과 유사한 상호 작용을 도입합니다. Liu et al. ICSE. [종이]
[2023/09] CodePlan: LLM 및 계획을 사용한 리포지토리 수준 코딩. Bairiet al. FSE. [종이] [저장소]
[2023/09] AutoAgents: 자동 에이전트 생성을 위한 프레임워크. Chenet al. arXiv. [종이] [저장소]
[2023/08] METAGPT: 멀티 에이전트 협업 프레임워크를 위한 메타 프로그래밍. 홍 외. ICLR. [종이] [저장소]
[2023/07] 소프트웨어 개발을 위한 의사소통 에이전트. Qianet al. ACL. [종이] [저장소]
[2023/03] 반사: 언어 강화 학습을 통한 언어 에이전트. Shinnet al. NeurIPS. [종이] [저장소]
공유 메모리: 특별한 종류의 단기 기억
[2024/06] AgileCoder: Agile 방법론을 기반으로 한 소프트웨어 개발을 위한 동적 협업 에이전트. Nguyenet al. arXiv. [종이] [저장소]
[2024/05] MARE: 요구사항 엔지니어링을 위한 다중 에이전트 협업 프레임워크. Jinet al. arXiv. [종이]
[2024/03] LLM 기반 코드 생성이 소프트웨어 개발 프로세스를 만났을 때. Linet al. arXiv. [종이] [저장소]
[2024/03] AGENTFL: LLM 기반 오류 위치 파악을 프로젝트 수준 컨텍스트로 확장합니다. Qinet al. arXiv. [종이]
[2023/08] METAGPT: 멀티 에이전트 협업 프레임워크를 위한 메타 프로그래밍. 홍 외. ICLR. [종이] [저장소]
[2023/04] ChatGPT를 통한 자체 협업 코드 생성. Dong et al. arXiv. [종이] [저장소]
시각적 입력
[2024/10] SWE-벤치 멀티모달: AI 시스템이 시각적 소프트웨어 도메인으로 일반화됩니까? Yanget al. arXiv. [종이] [저장소]
[2024/07] 다중 모드 대형 언어 모델을 통한 비전 기반 자동화 모바일 GUI 테스트. Liu et al. arXiv. [종이] [저장소]
[2024/06] 다중 에이전트 소프트웨어 개발 실험: 통합 플랫폼을 향하여 Sami et al. arXiv. [종이]
[2024/01] XUAT-Copilot: 대규모 언어 모델을 사용한 자동화된 사용자 승인 테스트를 위한 다중 에이전트 협업 시스템. 왕 외. arXiv. [종이]
[2023/10] AXNav: 자연어에서 접근성 테스트 재생. Taebet al. 치. [종이]
[2023/10] 한계 테스트: 대규모 언어 모델을 사용한 모바일 앱 충돌 감지를 위한 비정상적인 텍스트 입력 생성. Liu et al. ICSE. [종이] [저장소]
[2023/08] METAGPT: 멀티 에이전트 협업 프레임워크를 위한 메타 프로그래밍. 홍 외. ICLR. [종이] [저장소]
도구 검색
[2024/05] 리포지토리에 대한 반복적이고 도구 강화된 추론을 사용하여 자연어에서 클래스 수준 코드 생성. Deshpandeet al. arXiv. [종이]
[2024/04] LLM 에이전트는 1일 취약점을 자율적으로 악용할 수 있습니다. Fang et al. arXiv. [종이]
[2024/03] AutoDev: 자동화된 AI 기반 개발 . Tufanoet al. arXiv [논문]
[2024/03] RepairAgent: 프로그램 복구를 위한 자율 LLM 기반 에이전트입니다. Bouzeniaet al. arXiv. [종이]
[2024/03] CoCoST: 온라인 검색 및 정확성 테스트를 통한 자동 복합 코드 생성. 그 외 여러분. arXiv. [종이]
[2024/03] RAT: 검색 증강 생각은 Long-Horizon Generation에서 상황 인식 추론을 유도합니다 . 왕 외. arXiv. [종이] [저장소]
[2024/02] CodePori: 다중 에이전트를 활용한 자율 소프트웨어 개발을 위한 대규모 모델. Rasheedet al. arXiv. [종이]
[2024/01] LLM4Vuln: LLM의 취약성 추론을 분리하고 강화하기 위한 통합 평가 프레임워크입니다. Sunet al. arXiv. [종이] [저장소]
[2024/01] CodeAgent: 실제 Repo 수준 코딩 문제를 위한 도구 통합 에이전트 시스템으로 코드 생성 향상. Zhang et al. ACL. [종이]
[2023/12] E&V: 의사 코드 실행 및 검증을 통해 대규모 언어 모델에 정적 분석을 수행하도록 유도. Haoet al. arXiv. [종이]
[2023/12] 소프트웨어 개발 에이전트의 체험적 공동 학습. Qianet al. ACL. [종이] [저장소]
[2023/11] 자율적 대형 언어 모델 에이전트를 사용한 의도 기반 모바일 GUI 테스트 . 윤 외. ICST. [종이] [저장소]
[2023/10] 여우원숭이: 언어 에이전트를 위한 자연어와 코드의 조화. Xu et al. ICLR. [종이] [저장소]
[2023/10] RCAgent: 도구로 강화된 대규모 언어 모델을 사용한 자율 에이전트에 의한 클라우드 근본 원인 분석. 왕 외. arXiv. [종이]
[2023/10] AI 시대의 정적 코드 분석: 지능형 코드 분석의 개념, 기능 및 잠재력에 대한 심층 탐구. 팬 외. arXiv. [종이]
[2023/08] METAGPT: 멀티 에이전트 협업 프레임워크를 위한 메타 프로그래밍. 홍 외. ICLR. [종이] [저장소]
[2023/08] PENTESTGPT: LLM 기반 자동 침투 테스트 도구입니다. Deng et al. arXiv. [종이] [저장소]
[2023/08] AgentVerse: 다중 에이전트 협업 촉진 및 새로운 동작 탐색. Chenet al. ICLR. [종이] [저장소]
[2023/08] Gentopia: 도구 증강 LLM을 위한 협업 플랫폼. Xu et al. EMNLP. [종이] [저장소]
[2023/08] AutoGen: 다중 에이전트 대화를 통해 차세대 LLM 애플리케이션 활성화. Wuet al. arXiv. [종이] [저장소]
[2023/05] ToolCoder: API 검색 도구를 사용하도록 코드 생성 모델을 가르칩니다. Zhang et al. arXiv. [종이]
[2023/03] ART: 대규모 언어 모델을 위한 자동 다단계 추론 및 도구 사용. Paranjapeet al. arXiv. [종이] [저장소]
파일 작업
[2024/08] SpecRover: LLM을 통한 코드 의도 추출 Ruan et al. arXiv. [종이] [저장소]
[2024/06] MASAI: 소프트웨어 엔지니어링 AI 에이전트를 위한 모듈형 아키텍처. Aroraet al. arXiv. [종이]
[2024/05] 보안 취약점 탐지를 위한 LLM 지원 정적 분석. Li et al. arXiv. [종이]
[2024/05] SWE-AGENT: 에이전트-컴퓨터 인터페이스를 통해 자동화된 소프트웨어 엔지니어링이 가능합니다. Yanget al. arXiv. [종이] [저장소]
[2024/04] LLM 에이전트는 1일 취약점을 자율적으로 악용할 수 있습니다. Fang et al. arXiv. [종이]
[2024/03] RepairAgent: 프로그램 복구를 위한 자율 LLM 기반 에이전트입니다. Bouzeniaet al. arXiv. [종이]
[2024/03] AutoDev: 자동화된 AI 기반 개발 . Tufanoet al. arXiv [논문]
[2023/04] 대규모 언어 모델 기반 과학 디버깅을 통한 설명 가능한 자동 디버깅. Kanget al. arXiv. [종이]
GUI 작업
[2024/07] 다중 모드 대형 언어 모델을 통한 비전 기반 자동화 모바일 GUI 테스트. Liu et al. arXiv. [종이] [저장소]
[2024/01] XUAT-Copilot: 대규모 언어 모델을 사용한 자동화된 사용자 승인 테스트를 위한 다중 에이전트 협업 시스템. 왕 외. arXiv. [종이]
[2023/10] LLM을 테스트 전문가로 만들기: 기능 인식 결정을 통해 모바일 GUI 테스트에 인간과 유사한 상호 작용을 도입합니다. Liu et al. ICSE. [종이]
[2023/10] AXNav: 자연어에서 접근성 테스트 재생. Taebet al. 치. [종이]
[2023/10] 한계 테스트: 대규모 언어 모델을 사용한 모바일 앱 충돌 감지를 위한 비정상적인 텍스트 입력 생성. Liu et al. ICSE. [종이] [저장소]
[2023/06] 프롬프트만 있으면 됩니다: 대규모 언어 모델을 사용한 자동화된 Android 버그 재생. Feng et al. ICSE. [종이] [저장소]
정적 프로그램 분석
[2024/06] 팀 간 협업을 통한 다중 에이전트 소프트웨어 개발. Duet al. arXiv. [종이] [저장소]
[2024/06] AgileCoder: Agile 방법론을 기반으로 한 소프트웨어 개발을 위한 동적 협업 에이전트. Nguyenet al. arXiv. [종이] [저장소]
[2024/06] MASAI: 소프트웨어 엔지니어링 AI 에이전트를 위한 모듈형 아키텍처. Aroraet al. arXiv. [종이]
[2024/05] 리포지토리에 대한 반복적이고 도구 강화된 추론을 사용하여 자연어에서 클래스 수준 코드 생성. Deshpandeet al. arXiv. [종이]
[2024/05] 보안 취약점 탐지를 위한 LLM 지원 정적 분석. Li et al. arXiv. [종이]
[2024/04] AutoCodeRover: 자율 프로그램 개선. Zhang et al. ISSTA. [종이] [저장소]
[2024/04] 프로그램 분석을 통해 다루기 어려운 분기에 대한 LLM 기반 테스트 생성을 향상합니다. Yanget al. arXiv. [종이]
[2024/04] 3DGen: 입증 가능하게 올바른 바이너리 형식 파서의 AI 지원 생성 . Fakhouryet al. arXiv [논문]
[2024/03] AutoDev: 자동화된 AI 기반 개발 . Tufanoet al. arXiv [논문]
[2024/03] RepairAgent: 프로그램 복구를 위한 자율 LLM 기반 에이전트입니다. Bouzeniaet al. arXiv. [종이]
[2024/03] COVERUP: Coverage-Guided LLM 기반 테스트 생성. Pizzornoet al. arXiv. [종이] [저장소]
[2024/03] ACFIX: 스마트 계약의 액세스 제어 취약점에 대한 컨텍스트 인식 복구를 위한 마이닝된 공통 RBAC 관행을 갖춘 LLM 안내. Zhang et al. arXiv. [종이]
[2024/03] AGENTFL: LLM 기반 오류 위치 파악을 프로젝트 수준 컨텍스트로 확장합니다. Qinet al. arXiv. [종이]
[2024/02] 데이터 흐름 분석이 대규모 언어 모델을 만났을 때. 왕 외. arXiv. [종이]
[2024/02] LDB: 런타임 실행을 단계별로 검증하는 대규모 언어 모델 디버거. Zhonget al. arXiv. [종이] [저장소]
[2024/01] 리포지토리 수준 코드 생성에서 자동 완성 도구를 사용하도록 코드 LLM을 교육합니다. 왕 외. arXiv. [종이]
[2024/01] CodeAgent: 실제 Repo 수준 코딩 문제를 위한 도구 통합 에이전트 시스템으로 코드 생성 향상. Zhang et al. ACL. [종이]
[2024/01] LLM4PLC: 산업 제어 시스템에서 PLC의 검증 가능한 프로그래밍을 위한 대규모 언어 모델 활용. Fakihet al. ICSE. [종이] [저장소]
[2023/12] E&V: 의사 코드 실행 및 검증을 통해 대규모 언어 모델에 정적 분석을 수행하도록 유도. Haoet al. arXiv. [종이]
[2023/09] CodePlan: LLM 및 계획을 사용한 리포지토리 수준 코딩. Bairiet al. FSE. [종이] [저장소]
[2023/08] CodeCoT: 코드 생성을 위한 CoT 추론의 코드 구문 오류 해결. Huang et al. arXiv. [종이]
[2023/07] 대규모 언어 모델을 사용하여 효과적인 증인 프로그램을 생성하여 컴파일러 버그 격리. Tu et al. IEEE 트랜스. 소프트웨어 엔지니어링.. [논문] [저장소]
[2023/06] 프롬프트만 있으면 됩니다: 대규모 언어 모델을 사용한 자동화된 Android 버그 재생. Feng et al. ICSE. [종이] [저장소]
동적 분석
[2024/04] 프로그램 분석을 통해 다루기 어려운 분기에 대한 LLM 기반 테스트 생성을 향상합니다. Yanget al. arXiv. [종이]
[2024/03] COVERUP: Coverage-Guided LLM 기반 테스트 생성. Pizzornoet al. arXiv. [종이] [저장소]
[2024/03] AGENTFL: LLM 기반 오류 위치 파악을 프로젝트 수준 컨텍스트로 확장합니다. Qinet al. arXiv. [종이]
[2024/02] LDB: 런타임 실행을 단계별로 검증하는 대규모 언어 모델 디버거. Zhonget al. arXiv. [종이] [저장소]
[2023/07] 대규모 언어 모델을 사용하여 효과적인 증인 프로그램을 생성하여 컴파일러 버그 격리. Tu et al. IEEE 트랜스. 소프트웨어 엔지니어링.. [논문] [저장소]
[2023/04] 대규모 언어 모델 기반 과학 디버깅을 통한 설명 가능한 자동 디버깅. Kanget al. arXiv. [종이]
테스트 도구
[2024/09] 테스트 박리의 신경 기호 복구 . Chenet al. ISSTA. [종이]
[2024/08] SpecRover: LLM을 통한 코드 의도 추출 Ruan et al. arXiv. [종이] [저장소]
[2024/06] AgileCoder: Agile 방법론을 기반으로 한 소프트웨어 개발을 위한 동적 협업 에이전트. Nguyenet al. arXiv. [종이] [저장소]
[2024/06] MASAI: 소프트웨어 엔지니어링 AI 에이전트를 위한 모듈형 아키텍처. Aroraet al. arXiv. [종이]
[2024/05] AutoCoder: AIEV-INSTRUCT로 코드 대규모 언어 모델 강화. Leiet al. arXiv. [종이] [저장소]
[2024/05] MapCoder: 경쟁 문제 해결을 위한 다중 에이전트 코드 생성. 이슬람 등. ACL. [종이] [저장소]
[2024/04] 자체 구성 에이전트: 초대형 코드 생성 및 최적화를 위한 LLM 다중 에이전트 프레임워크. Ishibashiet al. arXiv. [종이] [저장소]
[2024/04] LLM 기반 다중 에이전트 시너지를 통한 통합 디버깅 접근 방식. Lee et al. arXiv. [종이] [저장소]
[2024/04] LLM 에이전트는 1일 취약점을 자율적으로 악용할 수 있습니다. Fang et al. arXiv. [종이]
[2024/04] 프로그램 분석을 통해 다루기 어려운 분기에 대한 LLM 기반 테스트 생성을 향상합니다. Yanget al. arXiv. [종이]
[2024/04] 3DGen: 입증 가능하게 올바른 바이너리 형식 파서의 AI 지원 생성 . Fakhouryet al. arXiv [논문]
[2024/04] AutoCodeRover: 자율 프로그램 개선. Zhang et al. ISSTA. [종이] [저장소]
[2024/03] AutoDev: 자동화된 AI 기반 개발 . Tufanoet al. arXiv [논문]
[2024/03] LLM 기반 코드 생성이 소프트웨어 개발 프로세스를 만났을 때. Linet al. arXiv. [종이] [저장소]
[2024/03] RepairAgent: 프로그램 복구를 위한 자율 LLM 기반 에이전트입니다. Bouzeniaet al. arXiv. [종이]
[2024/03] CoCoST: 온라인 검색 및 정확성 테스트를 통한 자동 복합 코드 생성. 그 외 여러분. arXiv. [종이]
[2024/02] 실행 가능한 코드 작업으로 더 나은 LLM 에이전트를 유도합니다. 왕 외. ICML. [종이] [저장소]
[2024/02] 코드 생성을 위한 테스트 중심 개발. Mathewset al. arXiv. [종이] [저장소]
[2024/01] AlphaCodium을 사용한 코드 생성: 프롬프트 엔지니어링에서 흐름 엔지니어링까지. Ridniket al. arXiv. [종이] [저장소]
[2024/01] LLM을 통한 새로운 프로그래밍 실습 실험. Zhang et al. arXiv. [종이] [저장소]
[2024/01] CodeAgent: 실제 Repo 수준 코딩 문제를 위한 도구 통합 에이전트 시스템으로 코드 생성 향상. Zhang et al. ACL. [종이]
[2023/12] AgentCoder: 반복 테스트 및 최적화를 통한 다중 에이전트 기반 코드 생성. Huang et al. arXiv. [종이]
[2023/12] LLM4TDD: 대규모 언어 모델을 사용한 테스트 중심 개발 모범 사례. Piyaet al. arXiv. [종이] [저장소]
[2023/11] INTERVENOR: 대화형 수리 체인을 통해 대규모 언어 모델의 코딩 능력 촉진. 왕 외. ACL. [종이] [저장소]
[2023/10] ClarifyGPT: 의도 명확화를 통해 LLM 기반 코드 생성 지원. Muet al. arXiv. [종이] [저장소]
[2023/10] 여우원숭이: 언어 에이전트를 위한 자연어와 코드의 조화. Xu et al. ICLR. [종이] [저장소]
[2023/10] 대형 언어 모델로 강화된 화이트박스 컴파일러 퍼징. Yanget al. arXiv. [종이] [저장소]
[2023/09] 더 나은 코드 생성을 위한 대규모 언어 모델의 테스트 사례 중심 프로그래밍 이해. Tianet al. arXiv. [종이]
[2023/09] MINT: 도구 및 언어 피드백을 사용한 다단계 상호 작용에서 LLMS를 평가합니다. 왕 외. ICLR. [종이] [저장소]
[2023/08] METAGPT: 멀티 에이전트 협업 프레임워크를 위한 메타 프로그래밍. 홍 외. ICLR. [종이] [저장소]
[2023/08] 사전 학습된 대형 언어 모델 및 돌연변이 테스트를 사용한 효과적인 테스트 생성. Dakhelet al. 정보 소프트웨어 기술. . [종이] [저장소]
[2023/08] AgentVerse: 다중 에이전트 협업 촉진 및 새로운 동작 탐색. Chenet al. ICLR. [종이] [저장소]
[2023/08] AutoGen: 다중 에이전트 대화를 통해 차세대 LLM 애플리케이션 활성화. Wuet al. arXiv. [종이] [저장소]
[2023/08] 흐름: 추론 및 협업 AI의 구성 요소. Josifoskiet al. arXiv. [종이] [저장소]
[2023/06] SELFEVOLVE: 대규모 언어 모델을 통한 코드 진화 프레임워크. Jianget al. arXiv. [종이]
[2023/06] InterCode: 실행 피드백을 통한 대화형 코딩 표준화 및 벤치마킹. Yanget al. NeurIPS. [종이] [저장소]
[2023/06] 자가 수리가 코드 생성의 묘미인가요?. Olaussonet al. ICLR. [종이] [저장소]
[2023/05] 수동 테스트는 더 이상 없나요? 단위 테스트 생성을 위한 ChatGPT 평가 및 개선. Yuan et al. arXiv. [종이] [저장소]
[2023/04] 대규모 언어 모델을 사용한 완전 자율 프로그래밍. Liventsevet al. 게코. [종이]
[2023/04] 대규모 언어 모델 기반 과학 디버깅을 통한 설명 가능한 자동 디버깅. Kanget al. arXiv. [종이]
[2023/03] ART: 대규모 언어 모델을 위한 자동 다단계 추론 및 도구 사용. Paranjapeet al. arXiv. [종이] [저장소]
[2023/03] 반사: 언어 강화 학습을 통한 언어 에이전트. Shinnet al. NeurIPS. [종이] [저장소]
[2023/02] 자동화된 단위 테스트 생성을 위한 대규모 언어 모델 사용에 대한 실증적 평가. Schäferet al. IEEE 트랜스. 소프트웨어 엔지니어링.. [논문] [저장소]
[2023/01] 대화형 자동 프로그램 복구. Xiaet al. arXiv. [종이]
결함 위치 파악 도구
[2024/04] AutoCodeRover: 자율 프로그램 개선. Zhang et al. ISSTA. [종이] [저장소]
[2024/03] RepairAgent: 프로그램 복구를 위한 자율 LLM 기반 에이전트입니다. Bouzeniaet al. arXiv. [종이]
관리자 역할
[2024/06] AgileCoder: Agile 방법론을 기반으로 한 소프트웨어 개발을 위한 동적 협업 에이전트. Nguyenet al. arXiv. [종이] [저장소]
[2024/05] 소프트웨어 개발 에이전트의 반복 경험 개선. Qianet al. arXiv. [종이]
[2024/05] MapCoder: 경쟁 문제 해결을 위한 다중 에이전트 코드 생성. 이슬람 등. ACL. [종이] [저장소]
[2024/04] 자체 구성 에이전트: 초대형 코드 생성 및 최적화를 위한 LLM 다중 에이전트 프레임워크. Ishibashiet al. arXiv. [종이] [저장소]
[2024/04] 3DGen: 입증 가능하게 올바른 바이너리 형식 파서의 AI 지원 생성 . Fakhouryet al. arXiv [논문]
[2024/03] MAGIS: GitHub 문제 해결을 위한 LLM 기반 다중 에이전트 프레임워크. Taoet al. arXiv. [종이]
[2024/03] LLM 기반 코드 생성이 소프트웨어 개발 프로세스를 만났을 때. Linet al. arXiv. [종이] [저장소]
[2024/02] CodeAgent: 소프트웨어 엔지니어링을 위한 협업 에이전트. Tanget al. arXiv. [종이] [저장소]
[2024/02] CodePori: 다중 에이전트를 활용한 자율 소프트웨어 개발을 위한 대규모 모델. Rasheedet al. arXiv. [종이]
[2023/12] 소프트웨어 개발 에이전트의 체험적 공동 학습. Qianet al. ACL. [종이] [저장소]
[2023/11] 소프트웨어 개발의 자율 에이전트: 비전 논문 Rasheed et al. arXiv. [종이]
[2023/11] 자율적 대형 언어 모델 에이전트를 사용한 의도 기반 모바일 GUI 테스트 . 윤 외. ICST. [종이] [저장소]
[2023/10] AXNav: 자연어에서 접근성 테스트 재생. Taebet al. 치. [종이]
[2023/10] RCAgent: 도구로 강화된 대규모 언어 모델을 사용한 자율 에이전트에 의한 클라우드 근본 원인 분석. 왕 외. arXiv. [종이]
[2023/09] AutoAgents: 자동 에이전트 생성을 위한 프레임워크. Chenet al. arXiv. [종이] [저장소]
[2023/08] METAGPT: 멀티 에이전트 협업 프레임워크를 위한 메타 프로그래밍. 홍 외. ICLR. [종이] [저장소]
[2023/04] 로우 코드 LLM: LLM을 통한 시각적 프로그래밍. Caiet al. arXiv. [종이] [저장소]
[2023/03] CAMEL: 대규모 언어 모델 사회의 "마음" 탐색을 위한 의사소통 에이전트. Li et al. NeurIPS. [종이] [저장소]
요구사항 분석 역할
[2024/06] 다중 에이전트 소프트웨어 개발 실험: 통합 플랫폼을 향하여 Sami et al. arXiv. [종이]
[2024/06] AgileCoder: Agile 방법론을 기반으로 한 소프트웨어 개발을 위한 동적 협업 에이전트. Nguyenet al. arXiv. [종이] [저장소]
[2024/05] MARE: 요구사항 엔지니어링을 위한 다중 에이전트 협업 프레임워크. Jinet al. arXiv. [종이]
[2024/04] Elicitron: 설계 요구사항 도출을 위한 LLM 에이전트 기반 시뮬레이션 프레임워크. Ataeiet al. arXiv. [종이]
[2024/03] LLM 기반 코드 생성이 소프트웨어 개발 프로세스를 만났을 때. Linet al. arXiv. [종이] [저장소]
[2024/01] LLM을 통한 새로운 프로그래밍 실습 실험. Zhang et al. arXiv. [종이] [저장소]
[2023/11] 소프트웨어 개발의 자율 에이전트: 비전 논문 Rasheed et al. arXiv. [종이]
[2023/10] AI 시대의 정적 코드 분석: 지능형 코드 분석의 개념, 기능 및 잠재력에 대한 심층 탐구. 팬 외. arXiv. [종이]
[2023/08] METAGPT: 멀티 에이전트 협업 프레임워크를 위한 메타 프로그래밍. 홍 외. ICLR. [종이] [저장소]
[2023/06] 다중 에이전트 협업: 지능형 LLM 에이전트의 성능 활용. Talebiradet al. arXiv. [종이]
[2023/04] ChatGPT를 통한 자체 협업 코드 생성. Dong et al. arXiv. [종이] [저장소]
[2023/03] CAMEL: 대규모 언어 모델 사회의 "마음" 탐색을 위한 의사소통 에이전트. Li et al. NeurIPS. [종이] [저장소]
디자이너 역할
[2024/06] 다중 에이전트 소프트웨어 개발 실험: 통합 플랫폼을 향하여 Sami et al. arXiv. [종이]
[2024/03] LLM 기반 코드 생성이 소프트웨어 개발 프로세스를 만났을 때. Linet al. arXiv. [종이] [저장소]
[2024/01] LLM을 통한 새로운 프로그래밍 실습 실험. Zhang et al. arXiv. [종이] [저장소]
[2023/11] 소프트웨어 개발의 자율 에이전트: 비전 논문 Rasheed et al. arXiv. [종이]
[2023/08] METAGPT: 멀티 에이전트 협업 프레임워크를 위한 메타 프로그래밍. 홍 외. ICLR. [종이] [저장소]
[2023/08] AgentVerse: 다중 에이전트 협업 촉진 및 새로운 동작 탐색. Chenet al. ICLR. [종이] [저장소]
[2023/07] 소프트웨어 개발을 위한 의사소통 에이전트. Qianet al. ACL. [종이] [저장소]
[2023/06] 다중 에이전트 협업: 지능형 LLM 에이전트의 성능 활용. Talebiradet al. arXiv. [종이]
개발자 역할
[2024/06] 다중 에이전트 소프트웨어 개발 실험: 통합 플랫폼을 향하여 Sami et al. arXiv. [종이]
[2024/06] AgileCoder: Agile 방법론을 기반으로 한 소프트웨어 개발을 위한 동적 협업 에이전트. Nguyenet al. arXiv. [종이] [저장소]
[2024/05] AutoCoder: AIEV-INSTRUCT로 코드 대규모 언어 모델 강화. Leiet al. arXiv. [종이] [저장소]
[2024/05] MapCoder: 경쟁 문제 해결을 위한 다중 에이전트 코드 생성. 이슬람 등. ACL. [종이] [저장소]
[2024/04] 자체 구성 에이전트: 초대형 코드 생성 및 최적화를 위한 LLM 다중 에이전트 프레임워크. Ishibashiet al. arXiv. [종이] [저장소]
[2024/04] 3DGen: 입증 가능하게 올바른 바이너리 형식 파서의 AI 지원 생성 . Fakhouryet al. arXiv [논문]
[2024/03] CodeS: 다층 스케치를 통한 자연어를 코드 저장소로. Zan et al. arXiv. [종이] [저장소]
[2024/03] MAGIS: GitHub 문제 해결을 위한 LLM 기반 다중 에이전트 프레임워크. Taoet al. arXiv. [종이]
[2024/03] LLM 기반 코드 생성이 소프트웨어 개발 프로세스를 만났을 때. Linet al. arXiv. [종이] [저장소]
[2024/02] 코드 생성을 위한 테스트 중심 개발. Mathewset al. arXiv. [종이] [저장소]
[2024/02] CodePori: 다중 에이전트를 활용한 자율 소프트웨어 개발을 위한 대규모 모델. Rasheedet al. arXiv. [종이]
[2024/01] LLM을 통한 새로운 프로그래밍 실습 실험. Zhang et al. arXiv. [종이] [저장소]
[2023/12] AgentCoder: 반복 테스트 및 최적화를 통한 다중 에이전트 기반 코드 생성. Huang et al. arXiv. [종이]
[2023/11] 소프트웨어 개발의 자율 에이전트: 비전 논문 Rasheed et al. arXiv. [종이]
[2023/11] INTERVENOR: 대화형 수리 체인을 통해 대규모 언어 모델의 코딩 능력 촉진. 왕 외. ACL. [종이] [저장소]
[2023/08] AutoGen: 다중 에이전트 대화를 통해 차세대 LLM 애플리케이션 활성화. Wuet al. arXiv. [종이] [저장소]
[2023/08] METAGPT: 멀티 에이전트 협업 프레임워크를 위한 메타 프로그래밍. 홍 외. ICLR. [종이] [저장소]
[2023/08] AgentVerse: 다중 에이전트 협업 촉진 및 새로운 동작 탐색. Chenet al. ICLR. [종이] [저장소]
[2023/07] 소프트웨어 개발을 위한 의사소통 에이전트. Qianet al. ACL. [종이] [저장소]
[2023/06] 자가 수리가 코드 생성의 묘미인가요?. Olaussonet al. ICLR. [종이] [저장소]
[2023/06] 다중 에이전트 협업: 지능형 LLM 에이전트의 성능 활용. Talebiradet al. arXiv. [종이]
[2023/05] 자가 편집: 코드 생성을 위한 오류 인식 코드 편집기 . Zhang et al. ACL. [종이]
[2023/04] ChatGPT를 통한 자체 협업 코드 생성. Dong et al. arXiv. [종이] [저장소]
[2023/03] CAMEL: 대규모 언어 모델 사회의 "마음" 탐색을 위한 의사소통 에이전트. Li et al. NeurIPS. [종이] [저장소]
소프트웨어 품질 보증 역할
[2024/08] SpecRover: LLM을 통한 코드 의도 추출 Ruan et al. arXiv. [종이] [저장소]
[2024/07] 다중 모드 대형 언어 모델을 통한 비전 기반 자동화 모바일 GUI 테스트. Liu et al. arXiv. [종이] [저장소]
[2024/06] 다중 에이전트 소프트웨어 개발 실험: 통합 플랫폼을 향하여 Sami et al. arXiv. [종이]
[2024/06] 팀 간 협업을 통한 다중 에이전트 소프트웨어 개발. Duet al. arXiv. [종이] [저장소]
[2024/06] AgileCoder: Agile 방법론을 기반으로 한 소프트웨어 개발을 위한 동적 협업 에이전트. Nguyenet al. arXiv. [종이] [저장소]
[2024/06] MASAI: 소프트웨어 엔지니어링 AI 에이전트를 위한 모듈형 아키텍처. Aroraet al. arXiv. [종이]
[2024/05] AutoCoder: AIEV-INSTRUCT로 코드 대규모 언어 모델 강화. Leiet al. arXiv. [종이] [저장소]
[2024/05] MapCoder: 경쟁 문제 해결을 위한 다중 에이전트 코드 생성. 이슬람 등. ACL. [종이] [저장소]
[2024/04] LLM을 통한 AI 기반 코드 검토: 초기 결과. Rasheedet al. arXiv. [종이]
[2024/04] 3DGen: 입증 가능하게 올바른 바이너리 형식 파서의 AI 지원 생성 . Fakhouryet al. arXiv [논문]
[2024/04] LLM 기반 다중 에이전트 시너지를 통한 통합 디버깅 접근 방식. Lee et al. arXiv. [종이] [저장소]
[2024/04] 실용적인 기능 수준 프로그램 복구, 어디까지 갈 수 있을까?. Xianget al. arXiv. [종이] [저장소]
[2024/03] MAGIS: GitHub 문제 해결을 위한 LLM 기반 다중 에이전트 프레임워크. Taoet al. arXiv. [종이]
[2024/03] AGENTFL: LLM 기반 오류 위치 파악을 프로젝트 수준 컨텍스트로 확장합니다. Qinet al. arXiv. [종이]
[2024/03] 직관적인 스마트 계약 감사를 위한 미세 조정 및 LLM 기반 에이전트 결합 및 정당성. Maet al. arXiv. [종이] [저장소]
[2024/03] LLM 기반 코드 생성이 소프트웨어 개발 프로세스를 만났을 때. Linet al. arXiv. [종이] [저장소]
[2024/03] ACFIX: 스마트 계약의 액세스 제어 취약점에 대한 컨텍스트 인식 복구를 위한 마이닝된 공통 RBAC 관행을 갖춘 LLM 안내. Zhang et al. arXiv. [종이]
[2024/02] CodeAgent: 소프트웨어 엔지니어링을 위한 협업 에이전트. Tanget al. arXiv. [종이] [저장소]
[2024/02] 코드 생성을 위한 테스트 중심 개발. Mathewset al. arXiv. [종이] [저장소]
[2024/02] CodePori: 다중 에이전트를 활용한 자율 소프트웨어 개발을 위한 대규모 모델. Rasheedet al. arXiv. [종이]
[2024/01] XUAT-Copilot: 대규모 언어 모델을 사용한 자동화된 사용자 승인 테스트를 위한 다중 에이전트 협업 시스템. 왕 외. arXiv. [종이]
[2023/12] AgentCoder: 반복 테스트 및 최적화를 통한 다중 에이전트 기반 코드 생성. Huang et al. arXiv. [종이]
[2023/11] 소프트웨어 개발의 자율 에이전트: 비전 논문 Rasheed et al. arXiv. [종이]
[2023/11] 자율적 대형 언어 모델 에이전트를 사용한 의도 기반 모바일 GUI 테스트 . 윤 외. ICST. [종이] [저장소]
[2023/10] 대규모 언어 모델 기반 스마트 계약 취약점 탐지: 새로운 관점. Huet al. TPS-ISA. [종이] [저장소]
[2023/10] AI 시대의 정적 코드 분석: 지능형 코드 분석의 개념, 기능 및 잠재력에 대한 심층 탐구. 팬 외. arXiv. [종이]
[2023/10] 대형 언어 모델로 강화된 화이트박스 컴파일러 퍼징. Yanget al. arXiv. [종이] [저장소]
[2023/10] AXNav: 자연어에서 접근성 테스트 재생. Taebet al. 치. [종이]
[2023/08] AutoGen: 다중 에이전트 대화를 통해 차세대 LLM 애플리케이션 활성화. Wuet al. arXiv. [종이] [저장소]
[2023/08] METAGPT: 멀티 에이전트 협업 프레임워크를 위한 메타 프로그래밍. 홍 외. ICLR. [종이] [저장소]
[2023/07] 소프트웨어 개발을 위한 의사소통 에이전트. Qianet al. ACL. [종이] [저장소]
[2023/06] 자가 수리가 코드 생성의 묘미인가요?. Olaussonet al. ICLR. [종이] [저장소]
[2023/06] 다중 에이전트 협업: 지능형 LLM 에이전트의 성능 활용. Talebiradet al. arXiv. [종이]
[2023/05] 자가 편집: 코드 생성을 위한 오류 인식 코드 편집기 . Zhang et al. ACL. [종이]
[2023/03] CAMEL: 대규모 언어 모델 사회의 "마음" 탐색을 위한 의사소통 에이전트. Li et al. NeurIPS. [종이] [저장소]
보조 역할
[2024/08] 다양성은 지능을 강화합니다: 소프트웨어 엔지니어링 에이전트의 전문 지식 통합 Zhang et al. arXiv. [종이]
[2024/08] SpecRover: LLM을 통한 코드 의도 추출 Ruan et al. arXiv. [종이] [저장소]
[2024/06] MASAI: 소프트웨어 엔지니어링 AI 에이전트를 위한 모듈형 아키텍처. Aroraet al. arXiv. [종이]
[2024/05] MapCoder: 경쟁 문제 해결을 위한 다중 에이전트 코드 생성. 이슬람 등. ACL. [종이] [저장소]
[2024/03] MAGIS: GitHub 문제 해결을 위한 LLM 기반 다중 에이전트 프레임워크. Taoet al. arXiv. [종이]
[2024/03] CodeS: 다층 스케치를 통한 자연어를 코드 저장소로. Zan et al. arXiv. [종이] [저장소]
[2024/03] 직관적인 스마트 계약 감사를 위한 미세 조정 및 LLM 기반 에이전트 결합 및 정당성. Maet al. arXiv. [종이] [저장소]
[2023/10] AI 시대의 정적 코드 분석: 지능형 코드 분석의 개념, 기능 및 잠재력에 대한 심층 탐구. 팬 외. arXiv. [종이]
계층화된 구조
[2024/08] 다양성은 지능을 강화합니다: 소프트웨어 엔지니어링 에이전트의 전문 지식 통합 Zhang et al. arXiv. [종이]
[2024/08] SpecRover: LLM을 통한 코드 의도 추출 Ruan et al. arXiv. [종이] [저장소]
[2024/06] 다중 에이전트 소프트웨어 개발 실험: 통합 플랫폼을 향하여 Sami et al. arXiv. [종이]
[2024/06] 대규모 언어 모델 기반 다중 에이전트 협업 확장 Qian et al. arXiv. [종이] [저장소]
[2024/06] 팀 간 협업을 통한 다중 에이전트 소프트웨어 개발. Duet al. arXiv. [종이] [저장소]
[2024/06] AgileCoder: Agile 방법론을 기반으로 한 소프트웨어 개발을 위한 동적 협업 에이전트. Nguyenet al. arXiv. [종이] [저장소]
[2024/05] MapCoder: 경쟁 문제 해결을 위한 다중 에이전트 코드 생성. 이슬람 등. ACL. [종이] [저장소]
[2024/05] MARE: 요구사항 엔지니어링을 위한 다중 에이전트 협업 프레임워크. Jinet al. arXiv. [종이]
[2024/04] AutoCodeRover: 자율 프로그램 개선. Zhang et al. ISSTA. [종이] [저장소]
[2024/04] 실용적인 기능 수준 프로그램 복구, 어디까지 갈 수 있을까?. Xianget al. arXiv. [종이] [저장소]
[2024/03] CodeS: 다층 스케치를 통한 자연어를 코드 저장소로. Zan et al. arXiv. [종이] [저장소]
[2024/03] LLM 기반 코드 생성이 소프트웨어 개발 프로세스를 만났을 때. Linet al. arXiv. [종이] [저장소]
[2024/03] AGENTFL: LLM 기반 오류 위치 파악을 프로젝트 수준 컨텍스트로 확장합니다. Qinet al. arXiv. [종이]
[2024/02] 데이터 흐름 분석이 대규모 언어 모델을 만났을 때. 왕 외. arXiv. [종이]
[2024/02] CodeAgent: 소프트웨어 엔지니어링을 위한 협업 에이전트. Tanget al. arXiv. [종이] [저장소]
[2024/02] 더 많은 에이전트만 있으면 됩니다. Li et al. arXiv. [종이]
[2024/01] LLM을 통한 새로운 프로그래밍 실습 실험. Zhang et al. arXiv. [종이] [저장소]
[2023/11] 소프트웨어 개발의 자율 에이전트: 비전 논문 Rasheed et al. arXiv. [종이]
[2023/10] AI 시대의 정적 코드 분석: 지능형 코드 분석의 개념, 기능 및 잠재력에 대한 심층 탐구. 팬 외. arXiv. [종이]
[2023/10] 대규모 언어 모델 기반 스마트 계약 취약점 탐지: 새로운 관점. Huet al. TPS-ISA. [종이] [저장소]
[2023/10] 대형 언어 모델로 강화된 화이트박스 컴파일러 퍼징. Yanget al. arXiv. [종이] [저장소]
[2023/10] 동적 LLM-에이전트 네트워크: 에이전트 팀 최적화를 갖춘 LLM-에이전트 협업 프레임워크. Liu et al. arXiv. [종이] [저장소]
[2023/08] METAGPT: 멀티 에이전트 협업 프레임워크를 위한 메타 프로그래밍. 홍 외. ICLR. [종이] [저장소]
[2023/08] 흐름: 추론 및 협업 AI의 구성 요소. Josifoskiet al. arXiv. [종이] [저장소]
[2023/07] 소프트웨어 개발을 위한 의사소통 에이전트. Qianet al. ACL. [종이] [저장소]
[2023/05] 자가 편집: 코드 생성을 위한 오류 인식 코드 편집기 . Zhang et al. ACL. 종이
[2023/04] 로우 코드 LLM: LLM을 통한 시각적 프로그래밍. Caiet al. arXiv. [종이] [저장소]
원형 구조
[2024/05] AutoCoder: AIEV-INSTRUCT로 코드 대규모 언어 모델 강화. Leiet al. arXiv. [종이] [저장소]
[2024/04] LLM 기반 다중 에이전트 시너지를 통한 통합 디버깅 접근 방식. Lee et al. arXiv. [종이] [저장소]
[2024/03] ACFIX: 스마트 계약의 액세스 제어 취약점에 대한 컨텍스트 인식 복구를 위한 마이닝된 공통 RBAC 관행을 갖춘 LLM 안내. Zhang et al. arXiv. [종이]
[2024/03] 취약점 탐지를 위한 LLM 토론을 통한 다중 역할 합의. Maoet al. QRS. [종이]
[2024/03] 직관적인 스마트 계약 감사를 위한 미세 조정 및 LLM 기반 에이전트 결합 및 정당성. Maet al. arXiv. [종이] [저장소]
[2024/02] 코드 생성을 위한 테스트 중심 개발. Mathewset al. arXiv. [종이] [저장소]
[2024/02] CodePori: 다중 에이전트를 활용한 자율 소프트웨어 개발을 위한 대규모 모델. Rasheedet al. arXiv. [종이]
[2023/12] 소프트웨어 개발 에이전트의 체험적 공동 학습. Qianet al. ACL. [종이] [저장소]
[2023/12] AgentCoder: 반복 테스트 및 최적화를 통한 다중 에이전트 기반 코드 생성. Huang et al. arXiv. [종이]
[2023/11] INTERVENOR: 대화형 수리 체인을 통해 대규모 언어 모델의 코딩 능력 촉진. 왕 외. ACL. [종이] [저장소]
[2023/11] 자율적 대형 언어 모델 에이전트를 사용한 의도 기반 모바일 GUI 테스트 . 윤 외. ICST. [종이] [저장소]
[2023/10] AXNav: 자연어에서 접근성 테스트 재생. Taebet al. 치. [종이]
[2023/06] 자가 수리가 코드 생성의 묘미인가요?. Olaussonet al. ICLR. [종이] [저장소]
[2023/03] CAMEL: 대규모 언어 모델 사회의 "마음" 탐색을 위한 의사소통 에이전트. Li et al. NeurIPS. [종이] [저장소]
[2023/03] 반사: 언어 강화 학습을 통한 언어 에이전트. Shinnet al. NeurIPS. [종이] [저장소]
나무와 같은 구조
[2024/06] 대규모 언어 모델 기반 다중 에이전트 협업 확장 Qian et al. arXiv. [종이] [저장소]
[2024/06] MASAI: 소프트웨어 엔지니어링 AI 에이전트를 위한 모듈형 아키텍처. Aroraet al. arXiv. [종이]
[2024/04] 자체 구성 에이전트: 초대형 코드 생성 및 최적화를 위한 LLM 다중 에이전트 프레임워크. Ishibashiet al. arXiv. [종이] [저장소]
별과 같은 구조
[2024/06] 대규모 언어 모델 기반 다중 에이전트 협업 확장 Qian et al. arXiv. [종이] [저장소]
[2024/03] AutoDev: 자동화된 AI 기반 개발 . Tufanoet al. arXiv [논문]
[2024/01] XUAT-Copilot: 대규모 언어 모델을 사용한 자동화된 사용자 승인 테스트를 위한 다중 에이전트 협업 시스템. 왕 외. arXiv. [종이]
[2023/10] RCAgent: 도구로 강화된 대규모 언어 모델을 사용한 자율 에이전트에 의한 클라우드 근본 원인 분석. 왕 외. arXiv. [종이]
[2023/08] AutoGen: 다중 에이전트 대화를 통해 차세대 LLM 애플리케이션 활성화. Wuet al. arXiv. [종이] [저장소]
메쉬 구조
[2024/06] 대규모 언어 모델 기반 다중 에이전트 협업 확장 Qian et al. arXiv. [종이] [저장소]
[2024/04] 3DGen: 입증 가능하게 올바른 바이너리 형식 파서의 AI 지원 생성 . Fakhouryet al. arXiv [논문]
[2024/01] LLM을 통한 새로운 프로그래밍 실습 실험. Zhang et al. arXiv. [종이] [저장소]
[2024/01] LLM4PLC: 산업 제어 시스템에서 PLC의 검증 가능한 프로그래밍을 위한 대규모 언어 모델 활용. Fakihet al. ICSE. [종이] [저장소]
[2023/10] AI 시대의 정적 코드 분석: 지능형 코드 분석의 개념, 기능 및 잠재력에 대한 심층 탐구. 팬 외. arXiv. [종이]
[2023/04] 로우 코드 LLM: LLM을 통한 시각적 프로그래밍. Caiet al. arXiv. [종이] [저장소]
[2024/05] MARE: 요구사항 엔지니어링을 위한 다중 에이전트 협업 프레임워크. Jinet al. arXiv. [종이]
[2024/02] 실행 가능한 코드 작업으로 더 나은 LLM 에이전트를 유도합니다. 왕 외. ICML. [종이] [저장소]
[2024/01] LLM을 통한 새로운 프로그래밍 실습 실험. Zhang et al. arXiv. [종이] [저장소]
[2023/10] ClarifyGPT: 의도 명확화를 통해 LLM 기반 코드 생성 지원. Muet al. arXiv. [종이] [저장소]
[2023/06] Prompt Sapper: AI 기반 서비스를 위한 LLM 기반 소프트웨어 엔지니어링 인프라. Xinget al. arXiv. [종이]
[2024/03] CodeS: 다층 스케치를 통한 자연어를 코드 저장소로. Zan et al. arXiv. [종이] [저장소]
[2024/01] LLM4PLC: 산업 제어 시스템에서 PLC의 검증 가능한 프로그래밍을 위한 대규모 언어 모델 활용. Fakihet al. ICSE. [종이] [저장소]
[2023/09] MINT: 도구 및 언어 피드백을 사용한 다단계 상호 작용에서 LLMS를 평가합니다. 왕 외. ICLR. [종이] [저장소]
[2023/08] 흐름: 추론 및 협업 AI의 구성 요소. Josifoskiet al. arXiv. [종이] [저장소]
[2023/08] AutoGen: 다중 에이전트 대화를 통해 차세대 LLM 애플리케이션 활성화. Wuet al. arXiv. [종이] [저장소]
[2024/01] LLM을 통한 새로운 프로그래밍 실습 실험. Zhang et al. arXiv. [종이] [저장소]
[2023/08] Gentopia: 도구 증강 LLM을 위한 협업 플랫폼. Xu et al. EMNLP. [종이] [저장소]
[2023/06] Prompt Sapper: AI 기반 서비스를 위한 LLM 기반 소프트웨어 엔지니어링 인프라. Xinget al. arXiv. [종이]
[2023/03] ART: 대규모 언어 모델을 위한 자동 다단계 추론 및 도구 사용. Paranjapeet al. arXiv. [종이] [저장소]
@misc{Agent4SE, title={소프트웨어 엔지니어링을 위한 대형 언어 모델 기반 에이전트: 설문 조사}, 작성자={Junwei Liu 및 Kaixin Wang 및 Yixuan Chen 및 Xin Peng 및 Zhenpeng Chen 및 Lingming Zhang 및 Yiling Lou}, 연도={2024}, eprint={2409.02977}, archivePrefix={arXiv}, PrimaryClass={cs.SE} , URL={https://arxiv.org/abs/2409.02977}, }
류준웨이 @To-D
왕 카이신 @wkx228
이쉬안 첸 @FloridaSpidee
질문이 있으시면 언제든지 문의하시거나 다음을 통해 몇 가지 제안 사항을 제공해 주십시오.
류준웨이: [email protected]