Kemajuan terbaru dalam Model Bahasa Besar (LLM) telah membentuk paradigma baru agen AI, yaitu agen berbasis LLM. Dibandingkan dengan LLM yang berdiri sendiri, agen berbasis LLM secara substansial memperluas keserbagunaan dan keahlian LLM dengan meningkatkan kemampuan LLM dalam memahami dan memanfaatkan sumber daya dan alat eksternal. Sampai saat ini, agen berbasis LLM telah diterapkan dan menunjukkan efektivitas luar biasa dalam Rekayasa Perangkat Lunak (SE). Sinergi antara berbagai agen dan interaksi manusia memberikan harapan lebih lanjut dalam mengatasi masalah-masalah sosial yang kompleks di dunia nyata. Dalam karya ini, kami menyajikan survei komprehensif dan sistematis mengenai agen SE berbasis LLM. Kami mengumpulkan 106 makalah dan mengkategorikannya dari dua perspektif, yaitu perspektif SE dan agen. Selain itu, kami membahas tantangan terbuka dan arah masa depan dalam bidang penting ini.
? Kami secara sistematis merangkum kemajuan Agent4SE dari perspektif tugas Rekayasa Perangkat Lunak dan Arsitektur Agen .
? Tautan Makalah: Agen Berbasis Model Bahasa Besar untuk Rekayasa Perangkat Lunak: Sebuah Survei
Bidang penelitian ini berkembang pesat; bintangi repositori ini untuk mengikuti pembaruan!
[2024/09/04] Kami merilis versi pertama survei kami di arXiv.
Berita
Perspektif SE
Lokalisasi Kesalahan
Perbaikan Program
Debug Terpadu
Pengujian Satuan
Pengujian Sistem
Deteksi Bug Statis
Tinjauan Kode
Rekayasa Kebutuhan
Pembuatan Kode
Verifikasi
Pemeriksaan Kode Statis
Pengujian
Men-debug
Melepaskan
Pengembangan Perangkat Lunak ujung ke ujung
Pemeliharaan Perangkat Lunak ujung ke ujung
Perspektif Agen
Fase Perencanaan
Fase Persyaratan
Fase Pengembangan
Fase Evaluasi
Peran Agen
Mekanisme Kolaborasi
Perencanaan
Ingatan
Persepsi
Tindakan
Kerangka Agen
Sistem Multi-agen
Kolaborasi Manusia-Agen
Kutipan
Pemelihara
Hubungi kami
Sejarah Bintang
[2024/05] MARE: Kerangka Kolaborasi Multi-Agen untuk Rekayasa Persyaratan. Jin dkk. arXiv. [kertas]
[2024/04] Elicitron: Kerangka Simulasi Berbasis Agen LLM untuk Perolehan Persyaratan Desain. Ataei dkk. arXiv. [kertas]
[2024/01] SpecGen: Pembuatan Spesifikasi Program Formal Secara Otomatis melalui Model Bahasa Besar. Ma dkk. arXiv. [kertas] [repo]
[2023/10] Memajukan Rekayasa Persyaratan melalui AI Generatif: Menilai Peran LLM. Arora dkk. arXiv. [kertas]
[2024/11] Pemrograman Berbasis Perencanaan: Alur Kerja Pemrograman Model Bahasa Besar Lei dkk. arXiv [kertas]
[2024/11] Rantai Pemrograman: Memberdayakan Model Bahasa Besar untuk Pembuatan Kode Geospasial Hou dkk. arXiv [kertas]
[2024/10] Sandbox Bahasa Multi-Pemrograman untuk LLM Dou dkk. arXiv [kertas]
[2024/10] SceneGenAgent: Pembuatan Adegan Industri yang Tepat dengan Coding Agent Xia dkk. arXiv [kertas] [repo]
[2024/10] MCCoder: Menyederhanakan Kontrol Gerakan dengan Pembuatan Kode Berbantuan LLM dan Verifikasi Ketat Li dkk. arXiv [kertas] [repo]
[2024/10] Agents4PLC: Mengotomatiskan Pembuatan Kode PLC Loop Tertutup dan Verifikasi dalam Sistem Kontrol Industri menggunakan Agen berbasis LLM Liu dkk. arXiv [kertas] [repo]
[2024/10] Meningkatkan Kinerja Program Paralel Melalui Pembuatan Kode Berbasis DSL dengan Pengoptimal LLM Wei dkk. arXiv. [kertas]
[2024/10] AgentBank: Menuju Agen LLM yang Digeneralisasi melalui Penyempurnaan pada 50000+ Lintasan Interaksi Song dkk. arXiv. [kertas]
[2024/10] RLEF: GROUNDING CODE LLMS DALAM UMPAN BALIK EKSEKUSI DENGAN PEMBELAJARAN PENGUATAN Gehring dkk. arXiv. [kertas]
[2024/10] Lebih Baik dari Guru Anda: Agen LLM yang belajar dari Umpan Balik AI Istimewa Choudhury dkk. arXiv. [kertas]
[2024/10] AMR-Evol: Evolusi Respons Modular Adaptif Menghasilkan Distilasi Pengetahuan yang Lebih Baik untuk Model Bahasa Besar dalam Pembuatan Kode Luo dkk. arXiv. [kertas] [repo]
[2024/10] RGD: Debugger Agen Berbasis Multi-LLM melalui Panduan Penyempurnaan dan Pembuatan Jin dkk. arXiv. [kertas]
[2024/09] AutoSafeCoder: Kerangka Multi-Agen untuk Mengamankan Pembuatan Kode LLM melalui Analisis Statis dan Pengujian Fuzz Nunez dkk. arXiv [kertas] [repo]
[2024/09] Kerangka Pemrograman Berpasangan untuk Pembuatan Kode melalui Eksplorasi Multi-Rencana dan Penyempurnaan Berbasis Umpan Balik Zhang dkk. arXiv [kertas] [repo]
[2024/08] Memilah Sekam: Tentang Memanfaatkan Umpan Balik Eksekusi untuk Memberi Peringkat Kandidat Kode yang Dihasilkan Sun dkk. arXiv [kertas]
[2024/08] CODEXGRAPH: Menjembatani Model Bahasa Besar dan Repositori Kode melalui Database Grafik Kode Liu dkk. arXiv. [kertas] [repo]
[2024/07] OPENHANDS: PLATFORM TERBUKA UNTUK PENGEMBANG PERANGKAT LUNAK AI SEBAGAI AGEN UMUM Wang dkk. arXiv [kertas] [repo]
[2024/05] Pembuatan Kode Tingkat Kelas dari Bahasa Alami Menggunakan Penalaran Berulang dan Ditingkatkan dengan Alat melalui Repositori. Deshpande dkk. arXiv. [kertas]
[2024/05] MapCoder: Pembuatan Kode Multi-Agen untuk Pemecahan Masalah Kompetitif. Islam dkk. ACL. [kertas] [repo]
[2024/05] AutoCoder: Meningkatkan Model Bahasa Kode Besar dengan AIEV-INSTRUCT. Lei dkk. arXiv. [kertas] [repo]
[2024/04] 3DGen: Pembuatan Parser Format Biner yang Terbukti Benar dengan Bantuan AI . Fakhory dkk. arXiv [kertas]
[2024/04] Agen yang Terorganisir Sendiri: Kerangka Kerja Multi-Agen LLM menuju Pembuatan dan Pengoptimalan Kode Berskala Sangat Besar. Ishibashi dkk. arXiv. [kertas] [repo]
[2024/03] AutoDev: Pengembangan Otomatis Berbasis AI . Tufano dkk. arXiv [kertas]
[2024/03] CoCoST: Pembuatan Kode Kompleks Otomatis dengan Pencarian Online dan Pengujian Kebenaran. Dia dkk. arXiv. [kertas]
[2024/03] RAT: Retrieval Augmented Thoughts Menimbulkan Penalaran Sadar Konteks dalam Generasi Long-Horizon . Wang dkk. arXiv. [kertas] [repo]
[2024/02] Tindakan Kode yang Dapat Dieksekusi Menghasilkan Agen LLM yang Lebih Baik. Wang dkk. ICML. [kertas] [repo]
[2024/02] Hanya Lebih Banyak Agen yang Anda Butuhkan. Li dkk. arXiv. [kertas]
[2024/02] Pengembangan Berbasis Uji untuk Pembuatan Kode. Mathews dkk. arXiv. [kertas] [repo]
[2024/02] LDB: Debugger Model Bahasa Besar melalui Memverifikasi Eksekusi Runtime Langkah demi Langkah. Zhong dkk. arXiv. [kertas] [repo]
[2024/01] CodeAgent: Meningkatkan Pembuatan Kode dengan Sistem Agen Terintegrasi Alat untuk Tantangan Pengodean Tingkat Repo Dunia Nyata. Zhang dkk. ACL. [kertas]
[2024/01] Mengajarkan Kode LLM untuk Menggunakan Alat Pelengkapan Otomatis dalam Pembuatan Kode Tingkat Repositori. Wang dkk. arXiv. [kertas]
[2024/01] Pembuatan Kode dengan AlphaCodium: Dari Rekayasa Cepat hingga Rekayasa Aliran. Ridnik dkk. arXiv. [kertas] [repo]
[2023/12] AgentCoder: Pembuatan Kode Berbasis Multi-Agen dengan Pengujian dan Optimasi Iteratif. Huang dkk. arXiv. [kertas]
[2023/12] LLM4TDD: Praktik Terbaik untuk Pengembangan Berbasis Tes Menggunakan Model Bahasa Besar. Piya dkk. arXiv. [kertas] [repo]
[2023/11] INTERVENOR: Mendorong Kemampuan Pengkodean Model Bahasa Besar dengan Rantai Perbaikan Interaktif. Wang dkk. ACL. [kertas] [repo]
[2023/10] Jaringan Agen LLM Dinamis: Kerangka Kolaborasi Agen LLM dengan Optimasi Tim Agen. Liu dkk. arXiv. [kertas] [repo]
[2023/10] Lemur: Harmonisasi Bahasa Alami dan Kode Agen Bahasa. Xu dkk. ICLR. [kertas] [repo]
[2023/10] ClarifyGPT: Memberdayakan Pembuatan Kode berbasis LLM dengan Klarifikasi Niat. Mu dkk. arXiv. [kertas] [repo]
[2023/10] CODECHAIN: MENUJU PEMBUATAN KODE MODULAR MELALUI RANTAI REVISI DIRI DENGAN SUB-MODUL PERWAKILAN. Le dkk. ICLR. [kertas] [repo]
[2023/10] Pencarian Pohon Agen Bahasa Menyatukan Penalaran, Tindakan, dan Perencanaan dalam Model Bahasa. Zhou dkk. ICML. [kertas] [repo]
[2023/09] MINT: MENGEVALUASI LLMS DALAM INTERAKSI MULTI-TURN DENGAN ALAT DAN UMPAN BALIK BAHASA. Wang dkk. ICLR. [kertas] [repo]
[2023/09] Pemahaman Pemrograman Berbasis Kasus Uji dalam Model Bahasa Besar untuk Pembuatan Kode yang Lebih Baik. Tian dkk. arXiv. [kertas]
[2023/09] CodePlan: Pengkodean tingkat repositori menggunakan LLM dan Perencanaan. Bairi dkk. FSE. [kertas] [repo]
[2023/09] Dari Penyalahgunaan ke Penguasaan: Meningkatkan Pembuatan Kode dengan Rangkaian AI Berbasis Pengetahuan. Ren dkk. ASE. [kertas]
[2023/09] Parsel?: Penalaran Algoritma dengan Model Bahasa dengan Menyusun Dekomposisi. Zelikman dkk. sarafIPS. [kertas] [repo]
[2023/08] AutoGen: Mengaktifkan Aplikasi LLM Generasi Berikutnya melalui Percakapan Multi-Agen. Wu dkk. arXiv. [kertas] [repo]
[2023/08] Gentopia: Platform Kolaboratif untuk LLM yang Ditambah Alat. Xu dkk. EMNLP. [kertas] [repo]
[2023/08] Alur: Blok Bangunan Penalaran dan Kolaborasi AI. Josifoski dkk. arXiv. [kertas] [repo]
[2023/08] CodeCoT: Mengatasi Kesalahan Sintaks Kode dalam Penalaran CoT untuk Pembuatan Kode. Huang dkk. arXiv. [kertas]
[2023/06] SELFEVOLVE: Kerangka Evolusi Kode melalui Model Bahasa Besar. Jiang dkk. arXiv. [kertas]
[2023/06] InterCode: Standarisasi dan Pembandingan Pengodean Interaktif dengan Umpan Balik Eksekusi. Yang dkk. sarafIPS. [kertas] [repo]
[2023/06] APAKAH PERBAIKAN DIRI SEBAGAI BULLET PERAK UNTUK PEMBUATAN KODE?. Olausson dkk. ICLR. [kertas] [repo]
[2023/05] ToolCoder: Ajarkan Model Pembuatan Kode untuk menggunakan alat pencarian API. Zhang dkk. arXiv. [kertas]
[2023/05] Pengeditan Mandiri: Editor Kode Sadar Kesalahan untuk Pembuatan Kode . Zhang dkk. ACL. [kertas]
[2023/04] Mengajarkan Model Bahasa Besar untuk Melakukan Debug Mandiri. Chen dkk. ICLR. [kertas]
[2023/04] Pemrograman Otonom Sepenuhnya dengan Model Bahasa Besar. Liventsev dkk. tokek. [kertas]
[2023/03] CAMEL: Agen Komunikatif untuk Eksplorasi “Pikiran” Masyarakat Model Bahasa Besar. Li dkk. sarafIPS. [kertas] [repo]
[2023/03] Refleksi: Agen Bahasa dengan Pembelajaran Penguatan Verbal. Shinn dkk. sarafIPS. [kertas] [repo]
[2023/03] PERBAIKAN DIRI: Penyempurnaan Berulang dengan Umpan Balik Mandiri. Madaan dkk. sarafIPS. [kertas] [repo]
[2024/10] Pembuatan Bukti Otomatis untuk Kode Karat melalui Self-Evolution Chen dkk. arXiv [kertas]
[2024/09] AutoVerus: Pembuatan Bukti Otomatis untuk Rust Code Yang dkk. arXiv [kertas]
[2024/10] Memanfaatkan Model Bahasa yang Disempurnakan untuk Audit Kontrak Cerdas yang Efisien dan Akurat Wei dkk. arXiv [kertas] [repo]
[2024/10] LLM-SmartAudit: Deteksi Kerentanan Kontrak Cerdas Tingkat Lanjut Wei dkk. arXiv. [kertas] [repo]
[2024/05] Analisis Statis Berbantuan LLM untuk Mendeteksi Kerentanan Keamanan. Li dkk. arXiv. [kertas]
[2024/05] PropertyGPT: Verifikasi Formal Kontrak Cerdas berbasis LLM melalui Pembuatan Properti yang Ditambah Pengambilan. Liu dkk. arXiv. [kertas] [repo]
[2024/03] Konsensus Multiperan melalui Diskusi LLM untuk Deteksi Kerentanan. Mao dkk. QRS. [kertas]
[2024/03] Menggabungkan Agen Penyempurnaan dan Berbasis LLM untuk Audit Kontrak Cerdas Intuitif dengan Justifikasi. Ma dkk. arXiv. [kertas] [repo]
[2024/02] Saat Analisis Aliran Data Memenuhi Model Bahasa Besar. Wang dkk. arXiv. [kertas]
[2024/01] LLM4Vuln: Kerangka Evaluasi Terpadu untuk Memisahkan dan Meningkatkan Penalaran Kerentanan LLM. Matahari dkk. arXiv. [kertas] [repo]
[2023/12] E&V: Mendorong Model Bahasa Besar untuk Melakukan Analisis Statis dengan Eksekusi dan Verifikasi Kode Pseudo. Hao dkk. arXiv. [kertas]
[2023/10] Deteksi Kerentanan Kontrak Cerdas Bertenaga Model Bahasa Besar: Perspektif Baru. Hu dkk. TPS-ISA. [kertas] [repo]
[2023/10] Analisis Kode Statis di Era AI: Eksplorasi Mendalam Konsep, Fungsi, dan Potensi Analisis Kode Cerdas. Penggemar dkk. arXiv. [kertas]
[2023/08] Meningkatkan Analisis Statis untuk Deteksi Bug Praktis: Pendekatan Terintegrasi LLM. Li dkk. arXiv. [kertas] [repo]
[2023/03] SENI: Penalaran multi-langkah otomatis dan penggunaan alat untuk model bahasa besar. Paranjape dkk. arXiv. [kertas] [repo]
[2024/10] Agen sebagai Hakim: Evaluasi Agen dengan Agen Zhuge dkk. arXiv. [kertas] [repo]
[2024/09] Divide-and-Conquer: Mengotomatiskan Revisi Kode melalui Lokalisasi-dan-Revisi Wang dkk. ACM Trans. perangkat lunak. bahasa Inggris Metodologi. [kertas]
[2024/04] Tinjauan Kode bertenaga AI dengan LLM: Hasil Awal. Rasheed dkk. arXiv. [kertas]
[2024/02] CodeAgent: Agen Kolaboratif untuk Rekayasa Perangkat Lunak. Tang dkk. arXiv. [kertas] [repo]
[2023/10] Analisis Kode Statis di Era AI: Eksplorasi Mendalam Konsep, Fungsi, dan Potensi Analisis Kode Cerdas. Penggemar dkk. arXiv. [kertas]
[2023/09] INTI: Menyelesaikan Masalah Kualitas Kode menggunakan LLM. Wadhwa dkk. FSE. [kertas] [repo]
[2024/11] ReAccept: Ko-evolusi Otomatis Kode Produksi dan Pengujian Berdasarkan Validasi Dinamis dan Model Bahasa Besar Chi dkk. arXiv [kertas] [repo]
[2024/09] Eksekusi Simbolik Python dengan Pembuatan Kode yang didukung LLM Wang dkk. arXiv [kertas]
[2024/06] Mokav: Pengujian Diferensial Berbasis Eksekusi dengan LLM. Etemadi dkk. arXiv. [kertas] [repo]
[2024/04] Meningkatkan Pembuatan Tes Berbasis LLM untuk Cabang yang Sulit Dicakup melalui Analisis Program. Yang dkk. arXiv. [kertas]
[2024/03] AutoDev: Pengembangan Otomatis Berbasis AI . Tufano dkk. arXiv [kertas]
[2024/03] COVERUP: Pembuatan Tes Berbasis LLM yang Dipandu Cakupan. Pizzorno dkk. arXiv. [kertas] [repo]
[2023/08] Pembuatan Tes yang Efektif Menggunakan Model Bahasa Besar yang telah dilatih sebelumnya dan Pengujian Mutasi. Dakhel dkk. Inf. perangkat lunak. Teknologi. . [kertas] [repo]
[2023/05] Tidak Ada Lagi Tes Manual? Mengevaluasi dan Meningkatkan ChatGPT untuk Pembuatan Unit Test. Yuan dkk. arXiv. [kertas] [repo]
[2023/05] ChatUniTest: Kerangka Kerja Pembuatan Tes Berbasis LLM. Chen dkk. FSE. [kertas] [repo]
[2023/02] Evaluasi Empiris Penggunaan Model Bahasa Besar untuk Pembuatan Tes Unit Otomatis. Schäfer dkk. IEEE Trans. Bahasa Inggris Perangkat Lunak.. [makalah] [repo]
[2024/11] Sistem Peningkatan Grafik Pengetahuan Kode untuk Generasi Driver Fuzz Berbasis LLM Xu dkk. arXiv. [kertas]
[2024/07] Pengujian GUI Seluler Otomatis Berbasis Visi melalui Model Bahasa Besar Multimodal. Liu dkk. arXiv. [kertas] [repo]
[2024/04] Agen LLM Dapat Secara Mandiri Mengeksploitasi Kerentanan Satu Hari. Fang dkk. arXiv. [kertas]
[2024/02] Anda Dapat ISTIRAHAT Sekarang: Inferensi Spesifikasi Otomatis dan Pengujian Black-Box dari RESTful API dengan Model Bahasa Besar. Decrop dkk. arXiv. [kertas] [repo]
[2024/01] XUAT-Copilot: Sistem Kolaborasi Multi-Agen untuk Pengujian Penerimaan Pengguna Otomatis dengan Model Bahasa Besar. Wang dkk. arXiv. [kertas]
[2024/01] KernelGPT: Fuzzing Kernel yang Ditingkatkan melalui Model Bahasa Besar. Yang dkk. arXiv. [kertas]
[2023/11] Pengujian GUI Seluler Berbasis Niat dengan Agen Model Bahasa Besar Otonom . Yoon dkk. ICST. [kertas] [repo]
[2023/10] Jadikan LLM Pakar Pengujian: Menghadirkan Interaksi Mirip Manusia ke Pengujian GUI Seluler melalui Keputusan yang Sadar Fungsi. Liu dkk. ICSE. [kertas]
[2023/10] AXNav: Memutar Ulang Tes Aksesibilitas dari Bahasa Alami. Taeb dkk. CHI. [kertas]
[2023/10] Fuzzing Kompiler Kotak Putih Diberdayakan oleh Model Bahasa Besar. Yang dkk. arXiv. [kertas] [repo]
[2023/10] Menguji Batas: Pembuatan Input Teks Tidak Biasa untuk Deteksi Kerusakan Aplikasi Seluler dengan Model Bahasa Besar. Liu dkk. ICSE. [kertas] [repo]
[2023/08] PENTESTGPT: Alat Pengujian Penetrasi Otomatis yang didukung LLM. Deng dkk. arXiv. [kertas] [repo]
[2023/08] Fuzz4All: Fuzzing Universal dengan Model Bahasa Besar. Xia dkk. ICSE. [kertas] [repo]
[2023/07] Mengisolasi Bug Kompiler dengan Menghasilkan Program Saksi yang Efektif dengan Model Bahasa Besar. Tu dkk. IEEE Trans. Perangkat Lunak Bahasa Inggris. [kertas] [repo]
[2023/06] Yang Anda Butuhkan hanyalah Anjuran: Pemutaran Ulang Bug Android Otomatis dengan Model Bahasa Besar. Feng dkk. ICSE. [kertas] [repo]
[2024/11] FlexFL: Lokalisasi Kesalahan yang Fleksibel dan Efektif dengan Model Bahasa Besar Sumber Terbuka Xu dkk. arXiv [kertas]
[2024/09] Meningkatkan Lokalisasi Kesalahan Melalui Analisis Kode Terurut dengan Agen LLM dan Refleksi Diri Rafi dkk. arXiv [kertas]
[2024/03] AGENTFL: Menskalakan Lokalisasi Kesalahan berbasis LLM ke Konteks Tingkat Proyek. Qin dkk. arXiv. [kertas]
[2023/10] RCAgent: Analisis Akar Penyebab Cloud oleh Agen Otonom dengan Model Bahasa Besar yang Ditambah Alat. Wang dkk. arXiv. [kertas]
[2023/08] Evaluasi Kuantitatif dan Kualitatif Lokalisasi Kesalahan yang Dapat Dijelaskan Berbasis LLM . Kang dkk. FSE. [kertas]
[2024/07] OPENHANDS: PLATFORM TERBUKA UNTUK PENGEMBANG PERANGKAT LUNAK AI SEBAGAI AGEN UMUM Wang dkk. arXiv [kertas] [repo]
[2024/10] Pencarian Berpanduan Semantik untuk Perbaikan Program yang Efisien dengan Model Bahasa Besar Thanh dkk. arXiv [kertas]
[2024/09] Perbaikan Neurosimbolik pada Tes Flakiness . Chen dkk. ISSTA. [kertas]
[2024/04] Seberapa Jauh Kita Dapat Melakukan Perbaikan Program Tingkat Fungsi Praktis?. Xiang dkk. arXiv. [kertas] [repo]
[2024/03] Agen Perbaikan: Agen Otonom Berbasis LLM untuk Perbaikan Program. Bouzenia dkk. arXiv. [kertas]
[2024/03] ACFIX: Memandu LLM dengan Praktik RBAC Umum yang Ditambang untuk Perbaikan Kerentanan Kontrol Akses yang Sadar Konteks dalam Kontrak Cerdas. Zhang dkk. arXiv. [kertas]
[2024/02] CigaR: Perbaikan Program Hemat Biaya dengan LLM. Hidvegi dkk. arXiv. [kertas] [repo]
[2023/04] Debugging Otomatis yang Dapat Dijelaskan melalui Debugging Ilmiah Berbasis Model Bahasa Besar. Kang dkk. arXiv. [kertas]
[2023/04] Pertahankan Percakapan: Memperbaiki 162 dari 337 bug seharga $0,42 masing-masing menggunakan ChatGPT. Xia dkk. arXiv. [kertas]
[2023/01] Perbaikan Program Otomatis Percakapan. Xia dkk. arXiv. [kertas]
[2024/04] Pendekatan Debugging Terpadu melalui Sinergi Multi-Agen Berbasis LLM. Lee dkk. arXiv. [kertas] [repo]
[2024/02] LDB: Debugger Model Bahasa Besar melalui Memverifikasi Eksekusi Runtime Langkah demi Langkah. Zhong dkk. arXiv. [kertas] [repo]
[2024/08] GoNoGo: Sistem Multi-Agen Berbasis LLM yang Efisien untuk Menyederhanakan Pengambilan Keputusan Rilis Perangkat Lunak Otomotif Khoee dkk. arXiv [kertas]
[2024/09] Menghasilkan pasangan kode Java dengan ChatGPT Zhao dkk. Ilmu Komputer Teoritis [makalah]
[2024/07] Memberdayakan Pengembangan Perangkat Lunak Generatif Berbasis Agile melalui Kerja Sama Tim Manusia-AI Zhang dkk. TOSEM [kertas] [repo]
[2024/06] Bereksperimen dengan Pengembangan Perangkat Lunak Multi-Agen: Menuju Platform Terpadu Sami dkk. arXiv. [kertas]
[2024/06] Menskalakan Kolaborasi Multi-Agen Berbasis Model Bahasa Besar Qian dkk. arXiv. [kertas] [repo]
[2024/06] Pengembangan Perangkat Lunak Multi-Agen melalui Kolaborasi Lintas Tim. Du dkk. arXiv. [kertas] [repo]
[2024/06] AgileCoder: Agen Kolaboratif Dinamis untuk Pengembangan Perangkat Lunak berdasarkan Metodologi Agile. Nguyen dkk. arXiv. [kertas] [repo]
[2024/05] Penyempurnaan Pengalaman Berulang dari Agen Pengembang Perangkat Lunak. Qian dkk. arXiv. [kertas]
[2024/03] Ketika Pembuatan Kode Berbasis LLM Memenuhi Proses Pengembangan Perangkat Lunak. Lin dkk. arXiv. [kertas] [repo]
[2024/03] CodeS: Bahasa Alami ke Repositori Kode melalui Sketsa Multi-Lapisan. Zan dkk. arXiv. [kertas] [repo]
[2024/02] CodePori: Model Skala Besar untuk Pengembangan Perangkat Lunak Otonom dengan Menggunakan Multi-Agen. Rasheed dkk. arXiv. [kertas]
[2024/01] Bereksperimen Praktek Pemrograman Baru dengan LLM. Zhang dkk. arXiv. [kertas] [repo]
[2024/01] LLM4PLC: Memanfaatkan Model Bahasa Besar untuk Pemrograman PLC yang Dapat Diverifikasi dalam Sistem Kontrol Industri. Fakih dkk. ICSE. [kertas] [repo]
[2023/12] Pembelajaran Bersama Eksperiensial dari Agen Pengembang Perangkat Lunak. Qian dkk. ACL. [kertas] [repo]
[2023/11] Agen Otonom dalam Pengembangan Perangkat Lunak: Makalah Visi Rasheed dkk. arXiv. [kertas]
[2023/09] AutoAgents: Kerangka Kerja untuk Pembuatan Agen Otomatis. Chen dkk. arXiv. [kertas] [repo]
[2023/08] AgentVerse: Memfasilitasi Kolaborasi Multi-Agen dan Menjelajahi Perilaku yang Muncul. Chen dkk. ICLR. [kertas] [repo]
[2023/08] METAGPT: PEMROGRAMAN META UNTUK KERANGKA KOLABORATIF MULTI-AGEN. Hong dkk. ICLR. [kertas] [repo]
[2023/07] Agen Komunikatif untuk Pengembangan Perangkat Lunak. Qian dkk. ACL. [kertas] [repo]
[2023/06] KOLABORASI MULTI-AGEN: MEMANFAATKAN KEKUATAN AGEN LLM CERDAS. Talebirad dkk. arXiv. [kertas]
[2023/06] Prompt Sapper: Infrastruktur Rekayasa Perangkat Lunak yang Diberdayakan LLM untuk Layanan Asli AI. Xing dkk. arXiv. [kertas]
[2023/04] Pembuatan Kode Kolaborasi Mandiri melalui ChatGPT. Dong dkk. arXiv. [kertas] [repo]
[2023/04] LLM kode rendah: Pemrograman Visual melalui LLM. Cai dkk. arXiv. [kertas] [repo]
[2024/11] LLM sebagai Pembelajar Berkelanjutan: Meningkatkan Reproduksi Kode yang Rusak dalam Masalah Perangkat Lunak Lin dkk. arXiv [kertas]
[2024/11] Agen Pengembangan Perangkat Lunak Human-In-the-Loop Takerngsaksiri dkk. arXiv [kertas]
[2024/11] Lingma SWE-GPT: Model Bahasa Berpusat pada Proses Pengembangan Terbuka untuk Peningkatan Perangkat Lunak Otomatis Ma dkk. arXiv [kertas] [repo]
[2024/10] RepoGraph: Meningkatkan Rekayasa Perangkat Lunak AI dengan Grafik Kode Tingkat Repositori Ouyang dkk. arXiv [kertas] [repo]
[2024/09] Agen MarsCode: Perbaikan Bug Otomatis asli AI Liu dkk. arXiv. [kertas]
[2024/08] CODEXGRAPH: Menjembatani Model Bahasa Besar dan Repositori Kode melalui Database Grafik Kode Liu dkk. arXiv. [kertas] [repo]
[2024/08] KEBERAGAMAN MEMBERDAYAKAN KECERDASAN: KEAHLIAN INTEGRASI AGEN TEKNIK PERANGKAT LUNAK Zhang dkk. arXiv. [kertas]
[2024/08] SpecRover: Ekstraksi Maksud Kode melalui LLMs Ruan et al. arXiv. [kertas] [repo]
[2024/07] OPENHANDS: PLATFORM TERBUKA UNTUK PENGEMBANG PERANGKAT LUNAK AI SEBAGAI AGEN UMUM Wang dkk. arXiv [kertas] [repo]
[2024/07] Agentless: Mengungkap Agen Rekayasa Perangkat Lunak berbasis LLM. Xia dkk. arXiv. [kertas] [repo]
[2024/06] Bagaimana Memahami Seluruh Repositori Perangkat Lunak?. Ma dkk. arXiv. [kertas] [repo]
[2024/06] CODER: PENYELESAIAN MASALAH DENGAN GRAFIK MULTI-AGEN DAN TUGAS. Chen dkk. arXiv. [kertas] [repo]
[2024/06] MASAI: Arsitektur Modular untuk Agen AI Rekayasa Perangkat Lunak. Arora dkk. arXiv. [kertas]
[2024/05] SWE-AGENT: ANTARMUKA AGEN-KOMPUTER MENGAKTIFKAN REKAYASA PERANGKAT LUNAK OTOMATIS. Yang dkk. arXiv. [kertas] [repo]
[2024/04] AutoCodeRover: Peningkatan Program Otonom. Zhang dkk. ISSTA. [kertas] [repo]
[2024/03] MAGIS: Kerangka Kerja Multi-Agen Berbasis LLM untuk Penyelesaian Masalah GitHub. Tao dkk. arXiv. [kertas]
Tolok ukur
[2024/10] SWE-Bench+: Tolok Ukur Coding yang Ditingkatkan untuk LLM Aleithan dkk. arXiv. [kertas]
[2024/10] Multimodal SWE-bench: Apakah Sistem AI Menggeneralisasi ke Domain Perangkat Lunak Visual? Yang dkk. arXiv. [kertas] [repo]
[2024/08] SWE-bench-java: Tolok Ukur Penyelesaian Masalah GitHub untuk Java Zan dkk. arXiv [kertas] [repo]
[2024/07] Agentless: Mengungkap Agen Rekayasa Perangkat Lunak berbasis LLM. Xia dkk. arXiv. [kertas] [repo]
[2023/10] Swe-bench: Bisakah model bahasa menyelesaikan masalah github di dunia nyata? Jimenez dkk. ICLR [kertas] [repo]
Perencanaan Putaran Tunggal
[2024/06] AgileCoder: Agen Kolaboratif Dinamis untuk Pengembangan Perangkat Lunak berdasarkan Metodologi Agile. Nguyen dkk. arXiv. [kertas] [repo]
[2024/06] Pengembangan Perangkat Lunak Multi-Agen melalui Kolaborasi Lintas Tim. Du dkk. arXiv. [kertas] [repo]
[2024/05] MapCoder: Pembuatan Kode Multi-Agen untuk Pemecahan Masalah Kompetitif. Islam dkk. ACL. [kertas] [repo]
[2024/03] MAGIS: Kerangka Kerja Multi-Agen Berbasis LLM untuk Penyelesaian Masalah GitHub. Tao dkk. arXiv. [kertas]
[2024/03] CodeS: Bahasa Alami ke Repositori Kode melalui Sketsa Multi-Lapisan. Zan dkk. arXiv. [kertas] [repo]
[2024/03] CoCoST: Pembuatan Kode Kompleks Otomatis dengan Pencarian Online dan Pengujian Kebenaran. Dia dkk. arXiv. [kertas]
[2024/02] CodePori: Model Skala Besar untuk Pengembangan Perangkat Lunak Otonom dengan Menggunakan Multi-Agen. Rasheed dkk. arXiv. [kertas]
[2024/01] CodeAgent: Meningkatkan Pembuatan Kode dengan Sistem Agen Terintegrasi Alat untuk Tantangan Pengodean Tingkat Repo Dunia Nyata. Zhang dkk. ACL. [kertas]
[2024/01] LLM4PLC: Memanfaatkan Model Bahasa Besar untuk Pemrograman PLC yang Dapat Diverifikasi dalam Sistem Kontrol Industri. Fakih dkk. ICSE. [kertas] [repo]
[2024/01] Bereksperimen Praktek Pemrograman Baru dengan LLM. Zhang dkk. arXiv. [kertas] [repo]
[2023/11] Agen Otonom dalam Pengembangan Perangkat Lunak: Makalah Visi Rasheed dkk. arXiv. [kertas]
[2023/10] Analisis Kode Statis di Era AI: Eksplorasi Mendalam Konsep, Fungsi, dan Potensi Analisis Kode Cerdas. Penggemar dkk. arXiv. [kertas]
[2023/09] Parsel?: Penalaran Algoritma dengan Model Bahasa dengan Menyusun Dekomposisi. Zelikman dkk. sarafIPS. [kertas] [repo]
[2023/08] PENTESTGPT: Alat Pengujian Penetrasi Otomatis yang didukung LLM. Deng dkk. arXiv. [kertas] [repo]
[2023/08] Alur: Blok Bangunan Penalaran dan Kolaborasi AI. Josifoski dkk. arXiv. [kertas] [repo]
[2023/08] METAGPT: PEMROGRAMAN META UNTUK KERANGKA KOLABORATIF MULTI-AGEN. Hong dkk. ICLR. [kertas] [repo]
[2023/07] Agen Komunikatif untuk Pengembangan Perangkat Lunak. Qian dkk. ACL. [kertas] [repo]
[2023/04] Pembuatan Kode Kolaborasi Mandiri melalui ChatGPT. Dong dkk. arXiv. [kertas] [repo]
[2023/04] LLM kode rendah: Pemrograman Visual melalui LLM. Cai dkk. arXiv. [kertas] [repo]
Perencanaan Multi-putaran
[2024/03] RAT: Retrieval Augmented Thoughts Menimbulkan Penalaran Sadar Konteks dalam Generasi Long-Horizon . Wang dkk. arXiv. [kertas] [repo]
Seperti bereaksi
[2024/06] MASAI: Arsitektur Modular untuk Agen AI Rekayasa Perangkat Lunak. Arora dkk. arXiv. [kertas]
[2024/02] Tindakan Kode yang Dapat Dieksekusi Menghasilkan Agen LLM yang Lebih Baik. Wang dkk. ICML. [kertas] [repo]
[2024/01] CodeAgent: Meningkatkan Pembuatan Kode dengan Sistem Agen Terintegrasi Alat untuk Tantangan Pengodean Tingkat Repo Dunia Nyata. Zhang dkk. ACL. [kertas]
[2024/01] XUAT-Copilot: Sistem Kolaborasi Multi-Agen untuk Pengujian Penerimaan Pengguna Otomatis dengan Model Bahasa Besar. Wang dkk. arXiv. [kertas]
[2023/11] Pengujian GUI Seluler Berbasis Niat dengan Agen Model Bahasa Besar Otonom . Yoon dkk. ICST. [kertas] [repo]
[2023/10] RCAgent: Analisis Akar Penyebab Cloud oleh Agen Otonom dengan Model Bahasa Besar yang Ditambah Alat. Wang dkk. arXiv. [kertas]
[2023/10] Pencarian Pohon Agen Bahasa Menyatukan Penalaran, Tindakan, dan Perencanaan dalam Model Bahasa. Zhou dkk. ICML. [kertas] [repo]
[2023/10] AXNav: Memutar Ulang Tes Aksesibilitas dari Bahasa Alami. Taeb dkk. CHI. [kertas]
[2023/09] CodePlan: Pengkodean tingkat repositori menggunakan LLM dan Perencanaan. Bairi dkk. FSE. [kertas] [repo]
Berlapis
[2024/04] Agen yang Terorganisir Sendiri: Kerangka Kerja Multi-Agen LLM menuju Pembuatan dan Pengoptimalan Kode Berskala Sangat Besar. Ishibashi dkk. arXiv. [kertas] [repo]
Memori Jangka Panjang
[2024/06] Menskalakan Kolaborasi Multi-Agen Berbasis Model Bahasa Besar Qian dkk. arXiv. [kertas] [repo]
[2024/06] Pengembangan Perangkat Lunak Multi-Agen melalui Kolaborasi Lintas Tim. Du dkk. arXiv. [kertas] [repo]
[2024/05] Penyempurnaan Pengalaman Berulang dari Agen Pengembang Perangkat Lunak. Qian dkk. arXiv. [kertas]
[2023/12] Pembelajaran Bersama Eksperiensial dari Agen Pengembang Perangkat Lunak. Qian dkk. ACL. [kertas] [repo]
[2023/11] Pengujian GUI Seluler Berbasis Niat dengan Agen Model Bahasa Besar Otonom . Yoon dkk. ICST. [kertas] [repo]
[2023/09] AutoAgents: Kerangka Kerja untuk Pembuatan Agen Otomatis. Chen dkk. arXiv. [kertas] [repo]
[2023/08] METAGPT: PEMROGRAMAN META UNTUK KERANGKA KOLABORATIF MULTI-AGEN. Hong dkk. ICLR. [kertas] [repo]
[2023/07] Agen Komunikatif untuk Pengembangan Perangkat Lunak. Qian dkk. ACL. [kertas] [repo]
[2023/03] Refleksi: Agen Bahasa dengan Pembelajaran Penguatan Verbal. Shinn dkk. sarafIPS. [kertas] [repo]
Memori Jangka Pendek
[2024/07] Pengujian GUI Seluler Otomatis Berbasis Visi melalui Model Bahasa Besar Multimodal. Liu dkk. arXiv. [kertas] [repo]
[2024/06] Menskalakan Kolaborasi Multi-Agen Berbasis Model Bahasa Besar Qian dkk. arXiv. [kertas] [repo]
[2024/06] Pengembangan Perangkat Lunak Multi-Agen melalui Kolaborasi Lintas Tim. Du dkk. arXiv. [kertas] [repo]
[2024/06] AgileCoder: Agen Kolaboratif Dinamis untuk Pengembangan Perangkat Lunak berdasarkan Metodologi Agile. Nguyen dkk. arXiv. [kertas] [repo]
[2024/04] Agen yang Terorganisir Sendiri: Kerangka Kerja Multi-Agen LLM menuju Pembuatan dan Pengoptimalan Kode Berskala Sangat Besar. Ishibashi dkk. arXiv. [kertas] [repo]
[2024/03] MAGIS: Kerangka Kerja Multi-Agen Berbasis LLM untuk Penyelesaian Masalah GitHub. Tao dkk. arXiv. [kertas]
[2024/01] XUAT-Copilot: Sistem Kolaborasi Multi-Agen untuk Pengujian Penerimaan Pengguna Otomatis dengan Model Bahasa Besar. Wang dkk. arXiv. [kertas]
[2023/12] E&V: Mendorong Model Bahasa Besar untuk Melakukan Analisis Statis dengan Eksekusi dan Verifikasi Kode Pseudo. Hao dkk. arXiv. [kertas]
[2023/11] Pengujian GUI Seluler Berbasis Niat dengan Agen Model Bahasa Besar Otonom . Yoon dkk. ICST. [kertas] [repo]
[2023/10] RCAgent: Analisis Akar Penyebab Cloud oleh Agen Otonom dengan Model Bahasa Besar yang Ditambah Alat. Wang dkk. arXiv. [kertas]
[2023/10] Analisis Kode Statis di Era AI: Eksplorasi Mendalam Konsep, Fungsi, dan Potensi Analisis Kode Cerdas. Penggemar dkk. arXiv. [kertas]
[2023/10] Jadikan LLM Pakar Pengujian: Menghadirkan Interaksi Mirip Manusia ke Pengujian GUI Seluler melalui Keputusan yang Sadar Fungsi. Liu dkk. ICSE. [kertas]
[2023/09] CodePlan: Pengkodean tingkat repositori menggunakan LLM dan Perencanaan. Bairi dkk. FSE. [kertas] [repo]
[2023/09] AutoAgents: Kerangka Kerja untuk Pembuatan Agen Otomatis. Chen dkk. arXiv. [kertas] [repo]
[2023/08] METAGPT: PEMROGRAMAN META UNTUK KERANGKA KOLABORATIF MULTI-AGEN. Hong dkk. ICLR. [kertas] [repo]
[2023/07] Agen Komunikatif untuk Pengembangan Perangkat Lunak. Qian dkk. ACL. [kertas] [repo]
[2023/03] Refleksi: Agen Bahasa dengan Pembelajaran Penguatan Verbal. Shinn dkk. sarafIPS. [kertas] [repo]
Memori Bersama: Jenis Memori Jangka Pendek khusus
[2024/06] AgileCoder: Agen Kolaboratif Dinamis untuk Pengembangan Perangkat Lunak berdasarkan Metodologi Agile. Nguyen dkk. arXiv. [kertas] [repo]
[2024/05] MARE: Kerangka Kolaborasi Multi-Agen untuk Rekayasa Persyaratan. Jin dkk. arXiv. [kertas]
[2024/03] Ketika Pembuatan Kode Berbasis LLM Memenuhi Proses Pengembangan Perangkat Lunak. Lin dkk. arXiv. [kertas] [repo]
[2024/03] AGENTFL: Menskalakan Lokalisasi Kesalahan berbasis LLM ke Konteks Tingkat Proyek. Qin dkk. arXiv. [kertas]
[2023/08] METAGPT: PEMROGRAMAN META UNTUK KERANGKA KOLABORATIF MULTI-AGEN. Hong dkk. ICLR. [kertas] [repo]
[2023/04] Pembuatan Kode Kolaborasi Mandiri melalui ChatGPT. Dong dkk. arXiv. [kertas] [repo]
Masukan Visual
[2024/10] Multimodal SWE-bench: Apakah Sistem AI Menggeneralisasi ke Domain Perangkat Lunak Visual? Yang dkk. arXiv. [kertas] [repo]
[2024/07] Pengujian GUI Seluler Otomatis Berbasis Visi melalui Model Bahasa Besar Multimodal. Liu dkk. arXiv. [kertas] [repo]
[2024/06] Bereksperimen dengan Pengembangan Perangkat Lunak Multi-Agen: Menuju Platform Terpadu Sami dkk. arXiv. [kertas]
[2024/01] XUAT-Copilot: Sistem Kolaborasi Multi-Agen untuk Pengujian Penerimaan Pengguna Otomatis dengan Model Bahasa Besar. Wang dkk. arXiv. [kertas]
[2023/10] AXNav: Memutar Ulang Tes Aksesibilitas dari Bahasa Alami. Taeb dkk. CHI. [kertas]
[2023/10] Menguji Batas: Pembuatan Input Teks Tidak Biasa untuk Deteksi Kerusakan Aplikasi Seluler dengan Model Bahasa Besar. Liu dkk. ICSE. [kertas] [repo]
[2023/08] METAGPT: PEMROGRAMAN META UNTUK KERANGKA KOLABORATIF MULTI-AGEN. Hong dkk. ICLR. [kertas] [repo]
Alat Pencarian
[2024/05] Pembuatan Kode Tingkat Kelas dari Bahasa Alami Menggunakan Penalaran Berulang dan Ditingkatkan dengan Alat melalui Repositori. Deshpande dkk. arXiv. [kertas]
[2024/04] Agen LLM Dapat Secara Mandiri Mengeksploitasi Kerentanan Satu Hari. Fang dkk. arXiv. [kertas]
[2024/03] AutoDev: Pengembangan Otomatis Berbasis AI . Tufano dkk. arXiv [kertas]
[2024/03] Agen Perbaikan: Agen Otonom Berbasis LLM untuk Perbaikan Program. Bouzenia dkk. arXiv. [kertas]
[2024/03] CoCoST: Pembuatan Kode Kompleks Otomatis dengan Pencarian Online dan Pengujian Kebenaran. Dia dkk. arXiv. [kertas]
[2024/03] RAT: Retrieval Augmented Thoughts Menimbulkan Penalaran Sadar Konteks dalam Generasi Long-Horizon . Wang dkk. arXiv. [kertas] [repo]
[2024/02] CodePori: Model Skala Besar untuk Pengembangan Perangkat Lunak Otonom dengan Menggunakan Multi-Agen. Rasheed dkk. arXiv. [kertas]
[2024/01] LLM4Vuln: Kerangka Evaluasi Terpadu untuk Memisahkan dan Meningkatkan Penalaran Kerentanan LLM. Matahari dkk. arXiv. [kertas] [repo]
[2024/01] CodeAgent: Meningkatkan Pembuatan Kode dengan Sistem Agen Terintegrasi Alat untuk Tantangan Pengodean Tingkat Repo Dunia Nyata. Zhang dkk. ACL. [kertas]
[2023/12] E&V: Mendorong Model Bahasa Besar untuk Melakukan Analisis Statis dengan Eksekusi dan Verifikasi Kode Pseudo. Hao dkk. arXiv. [kertas]
[2023/12] Pembelajaran Bersama Eksperiensial dari Agen Pengembang Perangkat Lunak. Qian dkk. ACL. [kertas] [repo]
[2023/11] Pengujian GUI Seluler Berbasis Niat dengan Agen Model Bahasa Besar Otonom . Yoon dkk. ICST. [kertas] [repo]
[2023/10] Lemur: Harmonisasi Bahasa Alami dan Kode Agen Bahasa. Xu dkk. ICLR. [kertas] [repo]
[2023/10] RCAgent: Analisis Akar Penyebab Cloud oleh Agen Otonom dengan Model Bahasa Besar yang Ditambah Alat. Wang dkk. arXiv. [kertas]
[2023/10] Analisis Kode Statis di Era AI: Eksplorasi Mendalam Konsep, Fungsi, dan Potensi Analisis Kode Cerdas. Penggemar dkk. arXiv. [kertas]
[2023/08] METAGPT: PEMROGRAMAN META UNTUK KERANGKA KOLABORATIF MULTI-AGEN. Hong dkk. ICLR. [kertas] [repo]
[2023/08] PENTESTGPT: Alat Pengujian Penetrasi Otomatis yang didukung LLM. Deng dkk. arXiv. [kertas] [repo]
[2023/08] AgentVerse: Memfasilitasi Kolaborasi Multi-Agen dan Menjelajahi Perilaku yang Muncul. Chen dkk. ICLR. [kertas] [repo]
[2023/08] Gentopia: Platform Kolaboratif untuk LLM yang Ditambah Alat. Xu dkk. EMNLP. [kertas] [repo]
[2023/08] AutoGen: Mengaktifkan Aplikasi LLM Generasi Berikutnya melalui Percakapan Multi-Agen. Wu dkk. arXiv. [kertas] [repo]
[2023/05] ToolCoder: Ajarkan Model Pembuatan Kode untuk menggunakan alat pencarian API. Zhang dkk. arXiv. [kertas]
[2023/03] SENI: Penalaran multi-langkah otomatis dan penggunaan alat untuk model bahasa besar. Paranjape dkk. arXiv. [kertas] [repo]
Operasi Berkas
[2024/08] SpecRover: Ekstraksi Maksud Kode melalui LLMs Ruan et al. arXiv. [kertas] [repo]
[2024/06] MASAI: Arsitektur Modular untuk Agen AI Rekayasa Perangkat Lunak. Arora dkk. arXiv. [kertas]
[2024/05] Analisis Statis Berbantuan LLM untuk Mendeteksi Kerentanan Keamanan. Li dkk. arXiv. [kertas]
[2024/05] SWE-AGENT: ANTARMUKA AGEN-KOMPUTER MENGAKTIFKAN REKAYASA PERANGKAT LUNAK OTOMATIS. Yang dkk. arXiv. [kertas] [repo]
[2024/04] Agen LLM Dapat Secara Mandiri Mengeksploitasi Kerentanan Satu Hari. Fang dkk. arXiv. [kertas]
[2024/03] Agen Perbaikan: Agen Otonom Berbasis LLM untuk Perbaikan Program. Bouzenia dkk. arXiv. [kertas]
[2024/03] AutoDev: Pengembangan Otomatis Berbasis AI . Tufano dkk. arXiv [kertas]
[2023/04] Debugging Otomatis yang Dapat Dijelaskan melalui Debugging Ilmiah Berbasis Model Bahasa Besar. Kang dkk. arXiv. [kertas]
Operasi GUI
[2024/07] Pengujian GUI Seluler Otomatis Berbasis Visi melalui Model Bahasa Besar Multimodal. Liu dkk. arXiv. [kertas] [repo]
[2024/01] XUAT-Copilot: Sistem Kolaborasi Multi-Agen untuk Pengujian Penerimaan Pengguna Otomatis dengan Model Bahasa Besar. Wang dkk. arXiv. [kertas]
[2023/10] Jadikan LLM Pakar Pengujian: Menghadirkan Interaksi Mirip Manusia ke Pengujian GUI Seluler melalui Keputusan yang Sadar Fungsi. Liu dkk. ICSE. [kertas]
[2023/10] AXNav: Memutar Ulang Tes Aksesibilitas dari Bahasa Alami. Taeb dkk. CHI. [kertas]
[2023/10] Menguji Batas: Pembuatan Input Teks Tidak Biasa untuk Deteksi Kerusakan Aplikasi Seluler dengan Model Bahasa Besar. Liu dkk. ICSE. [kertas] [repo]
[2023/06] Yang Anda Butuhkan hanyalah Anjuran: Pemutaran Ulang Bug Android Otomatis dengan Model Bahasa Besar. Feng dkk. ICSE. [kertas] [repo]
Analisis Program Statis
[2024/06] Pengembangan Perangkat Lunak Multi-Agen melalui Kolaborasi Lintas Tim. Du dkk. arXiv. [kertas] [repo]
[2024/06] AgileCoder: Agen Kolaboratif Dinamis untuk Pengembangan Perangkat Lunak berdasarkan Metodologi Agile. Nguyen dkk. arXiv. [kertas] [repo]
[2024/06] MASAI: Arsitektur Modular untuk Agen AI Rekayasa Perangkat Lunak. Arora dkk. arXiv. [kertas]
[2024/05] Pembuatan Kode Tingkat Kelas dari Bahasa Alami Menggunakan Penalaran Berulang dan Ditingkatkan dengan Alat melalui Repositori. Deshpande dkk. arXiv. [kertas]
[2024/05] Analisis Statis Berbantuan LLM untuk Mendeteksi Kerentanan Keamanan. Li dkk. arXiv. [kertas]
[2024/04] AutoCodeRover: Peningkatan Program Otonom. Zhang dkk. ISSTA. [kertas] [repo]
[2024/04] Meningkatkan Pembuatan Tes Berbasis LLM untuk Cabang yang Sulit Dicakup melalui Analisis Program. Yang dkk. arXiv. [kertas]
[2024/04] 3DGen: Pembuatan Parser Format Biner yang Terbukti Benar dengan Bantuan AI . Fakhory dkk. arXiv [kertas]
[2024/03] AutoDev: Pengembangan Otomatis Berbasis AI . Tufano dkk. arXiv [kertas]
[2024/03] Agen Perbaikan: Agen Otonom Berbasis LLM untuk Perbaikan Program. Bouzenia dkk. arXiv. [kertas]
[2024/03] COVERUP: Pembuatan Tes Berbasis LLM yang Dipandu Cakupan. Pizzorno dkk. arXiv. [kertas] [repo]
[2024/03] ACFIX: Memandu LLM dengan Praktik RBAC Umum yang Ditambang untuk Perbaikan Kerentanan Kontrol Akses yang Sadar Konteks dalam Kontrak Cerdas. Zhang dkk. arXiv. [kertas]
[2024/03] AGENTFL: Menskalakan Lokalisasi Kesalahan berbasis LLM ke Konteks Tingkat Proyek. Qin dkk. arXiv. [kertas]
[2024/02] Saat Analisis Aliran Data Memenuhi Model Bahasa Besar. Wang dkk. arXiv. [kertas]
[2024/02] LDB: Debugger Model Bahasa Besar melalui Memverifikasi Eksekusi Runtime Langkah demi Langkah. Zhong dkk. arXiv. [kertas] [repo]
[2024/01] Mengajarkan Kode LLM untuk Menggunakan Alat Pelengkapan Otomatis dalam Pembuatan Kode Tingkat Repositori. Wang dkk. arXiv. [kertas]
[2024/01] CodeAgent: Meningkatkan Pembuatan Kode dengan Sistem Agen Terintegrasi Alat untuk Tantangan Pengodean Tingkat Repo Dunia Nyata. Zhang dkk. ACL. [kertas]
[2024/01] LLM4PLC: Memanfaatkan Model Bahasa Besar untuk Pemrograman PLC yang Dapat Diverifikasi dalam Sistem Kontrol Industri. Fakih dkk. ICSE. [kertas] [repo]
[2023/12] E&V: Mendorong Model Bahasa Besar untuk Melakukan Analisis Statis dengan Eksekusi dan Verifikasi Kode Pseudo. Hao dkk. arXiv. [kertas]
[2023/09] CodePlan: Pengkodean tingkat repositori menggunakan LLM dan Perencanaan. Bairi dkk. FSE. [kertas] [repo]
[2023/08] CodeCoT: Mengatasi Kesalahan Sintaks Kode dalam Penalaran CoT untuk Pembuatan Kode. Huang dkk. arXiv. [kertas]
[2023/07] Mengisolasi Bug Kompiler dengan Menghasilkan Program Saksi yang Efektif dengan Model Bahasa Besar. Tu dkk. IEEE Trans. Bahasa Inggris Perangkat Lunak.. [makalah] [repo]
[2023/06] Yang Anda Butuhkan hanyalah Anjuran: Pemutaran Ulang Bug Android Otomatis dengan Model Bahasa Besar. Feng dkk. ICSE. [kertas] [repo]
Analisis Dinamis
[2024/04] Meningkatkan Pembuatan Tes Berbasis LLM untuk Cabang yang Sulit Dicakup melalui Analisis Program. Yang dkk. arXiv. [kertas]
[2024/03] COVERUP: Pembuatan Tes Berbasis LLM yang Dipandu Cakupan. Pizzorno dkk. arXiv. [kertas] [repo]
[2024/03] AGENTFL: Menskalakan Lokalisasi Kesalahan berbasis LLM ke Konteks Tingkat Proyek. Qin dkk. arXiv. [kertas]
[2024/02] LDB: Debugger Model Bahasa Besar melalui Memverifikasi Eksekusi Runtime Langkah demi Langkah. Zhong dkk. arXiv. [kertas] [repo]
[2023/07] Mengisolasi Bug Kompiler dengan Menghasilkan Program Saksi yang Efektif dengan Model Bahasa Besar. Tu dkk. IEEE Trans. Bahasa Inggris Perangkat Lunak.. [makalah] [repo]
[2023/04] Debugging Otomatis yang Dapat Dijelaskan melalui Debugging Ilmiah Berbasis Model Bahasa Besar. Kang dkk. arXiv. [kertas]
Alat Pengujian
[2024/09] Perbaikan Neurosimbolik pada Tes Flakiness . Chen dkk. ISSTA. [kertas]
[2024/08] SpecRover: Ekstraksi Maksud Kode melalui LLMs Ruan et al. arXiv. [kertas] [repo]
[2024/06] AgileCoder: Agen Kolaboratif Dinamis untuk Pengembangan Perangkat Lunak berdasarkan Metodologi Agile. Nguyen dkk. arXiv. [kertas] [repo]
[2024/06] MASAI: Arsitektur Modular untuk Agen AI Rekayasa Perangkat Lunak. Arora dkk. arXiv. [kertas]
[2024/05] AutoCoder: Meningkatkan Model Bahasa Kode Besar dengan AIEV-INSTRUCT. Lei dkk. arXiv. [kertas] [repo]
[2024/05] MapCoder: Pembuatan Kode Multi-Agen untuk Pemecahan Masalah Kompetitif. Islam dkk. ACL. [kertas] [repo]
[2024/04] Agen yang Terorganisir Sendiri: Kerangka Kerja Multi-Agen LLM menuju Pembuatan dan Pengoptimalan Kode Berskala Sangat Besar. Ishibashi dkk. arXiv. [kertas] [repo]
[2024/04] Pendekatan Debugging Terpadu melalui Sinergi Multi-Agen Berbasis LLM. Lee dkk. arXiv. [kertas] [repo]
[2024/04] Agen LLM Dapat Secara Mandiri Mengeksploitasi Kerentanan Satu Hari. Fang dkk. arXiv. [kertas]
[2024/04] Meningkatkan Pembuatan Tes Berbasis LLM untuk Cabang yang Sulit Dicakup melalui Analisis Program. Yang dkk. arXiv. [kertas]
[2024/04] 3DGen: Pembuatan Parser Format Biner yang Terbukti Benar dengan Bantuan AI . Fakhory dkk. arXiv [kertas]
[2024/04] AutoCodeRover: Peningkatan Program Otonom. Zhang dkk. ISSTA. [kertas] [repo]
[2024/03] AutoDev: Pengembangan Otomatis Berbasis AI . Tufano dkk. arXiv [kertas]
[2024/03] Ketika Pembuatan Kode Berbasis LLM Memenuhi Proses Pengembangan Perangkat Lunak. Lin dkk. arXiv. [kertas] [repo]
[2024/03] Agen Perbaikan: Agen Otonom Berbasis LLM untuk Perbaikan Program. Bouzenia dkk. arXiv. [kertas]
[2024/03] CoCoST: Pembuatan Kode Kompleks Otomatis dengan Pencarian Online dan Pengujian Kebenaran. Dia dkk. arXiv. [kertas]
[2024/02] Tindakan Kode yang Dapat Dieksekusi Menghasilkan Agen LLM yang Lebih Baik. Wang dkk. ICML. [kertas] [repo]
[2024/02] Pengembangan Berbasis Uji untuk Pembuatan Kode. Mathews dkk. arXiv. [kertas] [repo]
[2024/01] Pembuatan Kode dengan AlphaCodium: Dari Rekayasa Cepat hingga Rekayasa Aliran. Ridnik dkk. arXiv. [kertas] [repo]
[2024/01] Bereksperimen Praktek Pemrograman Baru dengan LLM. Zhang dkk. arXiv. [kertas] [repo]
[2024/01] CodeAgent: Meningkatkan Pembuatan Kode dengan Sistem Agen Terintegrasi Alat untuk Tantangan Pengodean Tingkat Repo Dunia Nyata. Zhang dkk. ACL. [kertas]
[2023/12] AgentCoder: Pembuatan Kode Berbasis Multi-Agen dengan Pengujian dan Optimasi Iteratif. Huang dkk. arXiv. [kertas]
[2023/12] LLM4TDD: Praktik Terbaik untuk Pengembangan Berbasis Tes Menggunakan Model Bahasa Besar. Piya dkk. arXiv. [kertas] [repo]
[2023/11] INTERVENOR: Mendorong Kemampuan Pengkodean Model Bahasa Besar dengan Rantai Perbaikan Interaktif. Wang dkk. ACL. [kertas] [repo]
[2023/10] ClarifyGPT: Memberdayakan Pembuatan Kode berbasis LLM dengan Klarifikasi Niat. Mu dkk. arXiv. [kertas] [repo]
[2023/10] Lemur: Harmonisasi Bahasa Alami dan Kode Agen Bahasa. Xu dkk. ICLR. [kertas] [repo]
[2023/10] Fuzzing Kompiler Kotak Putih Diberdayakan oleh Model Bahasa Besar. Yang dkk. arXiv. [kertas] [repo]
[2023/09] Pemahaman Pemrograman Berbasis Kasus Uji dalam Model Bahasa Besar untuk Pembuatan Kode yang Lebih Baik. Tian dkk. arXiv. [kertas]
[2023/09] MINT: MENGEVALUASI LLMS DALAM INTERAKSI MULTI-TURN DENGAN ALAT DAN UMPAN BALIK BAHASA. Wang dkk. ICLR. [kertas] [repo]
[2023/08] METAGPT: PEMROGRAMAN META UNTUK KERANGKA KOLABORATIF MULTI-AGEN. Hong dkk. ICLR. [kertas] [repo]
[2023/08] Pembuatan Tes yang Efektif Menggunakan Model Bahasa Besar yang telah dilatih sebelumnya dan Pengujian Mutasi. Dakhel dkk. Inf. perangkat lunak. Teknologi. . [kertas] [repo]
[2023/08] AgentVerse: Memfasilitasi Kolaborasi Multi-Agen dan Menjelajahi Perilaku yang Muncul. Chen dkk. ICLR. [kertas] [repo]
[2023/08] AutoGen: Mengaktifkan Aplikasi LLM Generasi Berikutnya melalui Percakapan Multi-Agen. Wu dkk. arXiv. [kertas] [repo]
[2023/08] Alur: Blok Bangunan Penalaran dan Kolaborasi AI. Josifoski dkk. arXiv. [kertas] [repo]
[2023/06] SELFEVOLVE: Kerangka Evolusi Kode melalui Model Bahasa Besar. Jiang dkk. arXiv. [kertas]
[2023/06] InterCode: Standarisasi dan Pembandingan Pengodean Interaktif dengan Umpan Balik Eksekusi. Yang dkk. sarafIPS. [kertas] [repo]
[2023/06] APAKAH PERBAIKAN DIRI SEBAGAI BULLET PERAK UNTUK PEMBUATAN KODE?. Olausson dkk. ICLR. [kertas] [repo]
[2023/05] Tidak Ada Lagi Tes Manual? Mengevaluasi dan Meningkatkan ChatGPT untuk Pembuatan Unit Test. Yuan dkk. arXiv. [kertas] [repo]
[2023/04] Pemrograman Otonom Sepenuhnya dengan Model Bahasa Besar. Liventsev dkk. tokek. [kertas]
[2023/04] Debugging Otomatis yang Dapat Dijelaskan melalui Debugging Ilmiah Berbasis Model Bahasa Besar. Kang dkk. arXiv. [kertas]
[2023/03] SENI: Penalaran multi-langkah otomatis dan penggunaan alat untuk model bahasa besar. Paranjape dkk. arXiv. [kertas] [repo]
[2023/03] Refleksi: Agen Bahasa dengan Pembelajaran Penguatan Verbal. Shinn dkk. sarafIPS. [kertas] [repo]
[2023/02] Evaluasi Empiris Penggunaan Model Bahasa Besar untuk Pembuatan Tes Unit Otomatis. Schäfer dkk. IEEE Trans. Bahasa Inggris Perangkat Lunak.. [makalah] [repo]
[2023/01] Perbaikan Program Otomatis Percakapan. Xia dkk. arXiv. [kertas]
Alat Pelokalan Kesalahan
[2024/04] AutoCodeRover: Peningkatan Program Otonom. Zhang dkk. ISSTA. [kertas] [repo]
[2024/03] Agen Perbaikan: Agen Otonom Berbasis LLM untuk Perbaikan Program. Bouzenia dkk. arXiv. [kertas]
Peran Manajer
[2024/06] AgileCoder: Agen Kolaboratif Dinamis untuk Pengembangan Perangkat Lunak berdasarkan Metodologi Agile. Nguyen dkk. arXiv. [kertas] [repo]
[2024/05] Penyempurnaan Pengalaman Berulang dari Agen Pengembang Perangkat Lunak. Qian dkk. arXiv. [kertas]
[2024/05] MapCoder: Pembuatan Kode Multi-Agen untuk Pemecahan Masalah Kompetitif. Islam dkk. ACL. [kertas] [repo]
[2024/04] Agen yang Terorganisir Sendiri: Kerangka Kerja Multi-Agen LLM menuju Pembuatan dan Pengoptimalan Kode Berskala Sangat Besar. Ishibashi dkk. arXiv. [kertas] [repo]
[2024/04] 3DGen: Pembuatan Parser Format Biner yang Terbukti Benar dengan Bantuan AI . Fakhory dkk. arXiv [kertas]
[2024/03] MAGIS: Kerangka Kerja Multi-Agen Berbasis LLM untuk Penyelesaian Masalah GitHub. Tao dkk. arXiv. [kertas]
[2024/03] Ketika Pembuatan Kode Berbasis LLM Memenuhi Proses Pengembangan Perangkat Lunak. Lin dkk. arXiv. [kertas] [repo]
[2024/02] CodeAgent: Agen Kolaboratif untuk Rekayasa Perangkat Lunak. Tang dkk. arXiv. [kertas] [repo]
[2024/02] CodePori: Model Skala Besar untuk Pengembangan Perangkat Lunak Otonom dengan Menggunakan Multi-Agen. Rasheed dkk. arXiv. [kertas]
[2023/12] Pembelajaran Bersama Eksperiensial dari Agen Pengembang Perangkat Lunak. Qian dkk. ACL. [kertas] [repo]
[2023/11] Agen Otonom dalam Pengembangan Perangkat Lunak: Makalah Visi Rasheed dkk. arXiv. [kertas]
[2023/11] Pengujian GUI Seluler Berbasis Niat dengan Agen Model Bahasa Besar Otonom . Yoon dkk. ICST. [kertas] [repo]
[2023/10] AXNav: Memutar Ulang Tes Aksesibilitas dari Bahasa Alami. Taeb dkk. CHI. [kertas]
[2023/10] RCAgent: Analisis Akar Penyebab Cloud oleh Agen Otonom dengan Model Bahasa Besar yang Ditambah Alat. Wang dkk. arXiv. [kertas]
[2023/09] AutoAgents: Kerangka Kerja untuk Pembuatan Agen Otomatis. Chen dkk. arXiv. [kertas] [repo]
[2023/08] METAGPT: PEMROGRAMAN META UNTUK KERANGKA KOLABORATIF MULTI-AGEN. Hong dkk. ICLR. [kertas] [repo]
[2023/04] LLM kode rendah: Pemrograman Visual melalui LLM. Cai dkk. arXiv. [kertas] [repo]
[2023/03] CAMEL: Agen Komunikatif untuk Eksplorasi “Pikiran” Masyarakat Model Bahasa Besar. Li dkk. sarafIPS. [kertas] [repo]
Peran Analisis Kebutuhan
[2024/06] Bereksperimen dengan Pengembangan Perangkat Lunak Multi-Agen: Menuju Platform Terpadu Sami dkk. arXiv. [kertas]
[2024/06] AgileCoder: Agen Kolaboratif Dinamis untuk Pengembangan Perangkat Lunak berdasarkan Metodologi Agile. Nguyen dkk. arXiv. [kertas] [repo]
[2024/05] MARE: Kerangka Kolaborasi Multi-Agen untuk Rekayasa Persyaratan. Jin dkk. arXiv. [kertas]
[2024/04] Elicitron: Kerangka Simulasi Berbasis Agen LLM untuk Perolehan Persyaratan Desain. Ataei dkk. arXiv. [kertas]
[2024/03] Ketika Pembuatan Kode Berbasis LLM Memenuhi Proses Pengembangan Perangkat Lunak. Lin dkk. arXiv. [kertas] [repo]
[2024/01] Bereksperimen Praktek Pemrograman Baru dengan LLM. Zhang dkk. arXiv. [kertas] [repo]
[2023/11] Agen Otonom dalam Pengembangan Perangkat Lunak: Makalah Visi Rasheed dkk. arXiv. [kertas]
[2023/10] Analisis Kode Statis di Era AI: Eksplorasi Mendalam Konsep, Fungsi, dan Potensi Analisis Kode Cerdas. Penggemar dkk. arXiv. [kertas]
[2023/08] METAGPT: PEMROGRAMAN META UNTUK KERANGKA KOLABORATIF MULTI-AGEN. Hong dkk. ICLR. [kertas] [repo]
[2023/06] KOLABORASI MULTI-AGEN: MEMANFAATKAN KEKUATAN AGEN LLM CERDAS. Talebirad dkk. arXiv. [kertas]
[2023/04] Pembuatan Kode Kolaborasi Mandiri melalui ChatGPT. Dong dkk. arXiv. [kertas] [repo]
[2023/03] CAMEL: Agen Komunikatif untuk Eksplorasi “Pikiran” Masyarakat Model Bahasa Besar. Li dkk. sarafIPS. [kertas] [repo]
Peran Desainer
[2024/06] Bereksperimen dengan Pengembangan Perangkat Lunak Multi-Agen: Menuju Platform Terpadu Sami dkk. arXiv. [kertas]
[2024/03] Ketika Pembuatan Kode Berbasis LLM Memenuhi Proses Pengembangan Perangkat Lunak. Lin dkk. arXiv. [kertas] [repo]
[2024/01] Bereksperimen Praktek Pemrograman Baru dengan LLM. Zhang dkk. arXiv. [kertas] [repo]
[2023/11] Agen Otonom dalam Pengembangan Perangkat Lunak: Makalah Visi Rasheed dkk. arXiv. [kertas]
[2023/08] METAGPT: PEMROGRAMAN META UNTUK KERANGKA KOLABORATIF MULTI-AGEN. Hong dkk. ICLR. [kertas] [repo]
[2023/08] AgentVerse: Memfasilitasi Kolaborasi Multi-Agen dan Menjelajahi Perilaku yang Muncul. Chen dkk. ICLR. [kertas] [repo]
[2023/07] Agen Komunikatif untuk Pengembangan Perangkat Lunak. Qian dkk. ACL. [kertas] [repo]
[2023/06] KOLABORASI MULTI-AGEN: MEMANFAATKAN KEKUATAN AGEN LLM CERDAS. Talebirad dkk. arXiv. [kertas]
Peran Pengembang
[2024/06] Bereksperimen dengan Pengembangan Perangkat Lunak Multi-Agen: Menuju Platform Terpadu Sami dkk. arXiv. [kertas]
[2024/06] AgileCoder: Agen Kolaboratif Dinamis untuk Pengembangan Perangkat Lunak berdasarkan Metodologi Agile. Nguyen dkk. arXiv. [kertas] [repo]
[2024/05] AutoCoder: Meningkatkan Model Bahasa Kode Besar dengan AIEV-INSTRUCT. Lei dkk. arXiv. [kertas] [repo]
[2024/05] MapCoder: Pembuatan Kode Multi-Agen untuk Pemecahan Masalah Kompetitif. Islam dkk. ACL. [kertas] [repo]
[2024/04] Agen yang Terorganisir Sendiri: Kerangka Kerja Multi-Agen LLM menuju Pembuatan dan Pengoptimalan Kode Berskala Sangat Besar. Ishibashi dkk. arXiv. [kertas] [repo]
[2024/04] 3DGen: Pembuatan Parser Format Biner yang Terbukti Benar dengan Bantuan AI . Fakhory dkk. arXiv [kertas]
[2024/03] CodeS: Bahasa Alami ke Repositori Kode melalui Sketsa Multi-Lapisan. Zan dkk. arXiv. [kertas] [repo]
[2024/03] MAGIS: Kerangka Kerja Multi-Agen Berbasis LLM untuk Penyelesaian Masalah GitHub. Tao dkk. arXiv. [kertas]
[2024/03] Ketika Pembuatan Kode Berbasis LLM Memenuhi Proses Pengembangan Perangkat Lunak. Lin dkk. arXiv. [kertas] [repo]
[2024/02] Pengembangan Berbasis Uji untuk Pembuatan Kode. Mathews dkk. arXiv. [kertas] [repo]
[2024/02] CodePori: Model Skala Besar untuk Pengembangan Perangkat Lunak Otonom dengan Menggunakan Multi-Agen. Rasheed dkk. arXiv. [kertas]
[2024/01] Bereksperimen Praktek Pemrograman Baru dengan LLM. Zhang dkk. arXiv. [kertas] [repo]
[2023/12] AgentCoder: Pembuatan Kode Berbasis Multi-Agen dengan Pengujian dan Optimasi Iteratif. Huang dkk. arXiv. [kertas]
[2023/11] Agen Otonom dalam Pengembangan Perangkat Lunak: Makalah Visi Rasheed dkk. arXiv. [kertas]
[2023/11] INTERVENOR: Mendorong Kemampuan Pengkodean Model Bahasa Besar dengan Rantai Perbaikan Interaktif. Wang dkk. ACL. [kertas] [repo]
[2023/08] AutoGen: Mengaktifkan Aplikasi LLM Generasi Berikutnya melalui Percakapan Multi-Agen. Wu dkk. arXiv. [kertas] [repo]
[2023/08] METAGPT: PEMROGRAMAN META UNTUK KERANGKA KOLABORATIF MULTI-AGEN. Hong dkk. ICLR. [kertas] [repo]
[2023/08] AgentVerse: Memfasilitasi Kolaborasi Multi-Agen dan Menjelajahi Perilaku yang Muncul. Chen dkk. ICLR. [kertas] [repo]
[2023/07] Agen Komunikatif untuk Pengembangan Perangkat Lunak. Qian dkk. ACL. [kertas] [repo]
[2023/06] APAKAH PERBAIKAN DIRI SEBAGAI BULLET PERAK UNTUK PEMBUATAN KODE?. Olausson dkk. ICLR. [kertas] [repo]
[2023/06] KOLABORASI MULTI-AGEN: MEMANFAATKAN KEKUATAN AGEN LLM CERDAS. Talebirad dkk. arXiv. [kertas]
[2023/05] Pengeditan Mandiri: Editor Kode Sadar Kesalahan untuk Pembuatan Kode . Zhang dkk. ACL. [kertas]
[2023/04] Pembuatan Kode Kolaborasi Mandiri melalui ChatGPT. Dong dkk. arXiv. [kertas] [repo]
[2023/03] CAMEL: Agen Komunikatif untuk Eksplorasi “Pikiran” Masyarakat Model Bahasa Besar. Li dkk. sarafIPS. [kertas] [repo]
Peran Penjaminan Mutu Perangkat Lunak
[2024/08] SpecRover: Ekstraksi Maksud Kode melalui LLMs Ruan et al. arXiv. [kertas] [repo]
[2024/07] Pengujian GUI Seluler Otomatis Berbasis Visi melalui Model Bahasa Besar Multimodal. Liu dkk. arXiv. [kertas] [repo]
[2024/06] Bereksperimen dengan Pengembangan Perangkat Lunak Multi-Agen: Menuju Platform Terpadu Sami dkk. arXiv. [kertas]
[2024/06] Pengembangan Perangkat Lunak Multi-Agen melalui Kolaborasi Lintas Tim. Du dkk. arXiv. [kertas] [repo]
[2024/06] AgileCoder: Agen Kolaboratif Dinamis untuk Pengembangan Perangkat Lunak berdasarkan Metodologi Agile. Nguyen dkk. arXiv. [kertas] [repo]
[2024/06] MASAI: Arsitektur Modular untuk Agen AI Rekayasa Perangkat Lunak. Arora dkk. arXiv. [kertas]
[2024/05] AutoCoder: Meningkatkan Model Bahasa Kode Besar dengan AIEV-INSTRUCT. Lei dkk. arXiv. [kertas] [repo]
[2024/05] MapCoder: Pembuatan Kode Multi-Agen untuk Pemecahan Masalah Kompetitif. Islam dkk. ACL. [kertas] [repo]
[2024/04] Tinjauan Kode bertenaga AI dengan LLM: Hasil Awal. Rasheed dkk. arXiv. [kertas]
[2024/04] 3DGen: Pembuatan Parser Format Biner yang Terbukti Benar dengan Bantuan AI . Fakhory dkk. arXiv [kertas]
[2024/04] Pendekatan Debugging Terpadu melalui Sinergi Multi-Agen Berbasis LLM. Lee dkk. arXiv. [kertas] [repo]
[2024/04] Seberapa Jauh Kita Dapat Melakukan Perbaikan Program Tingkat Fungsi Praktis?. Xiang dkk. arXiv. [kertas] [repo]
[2024/03] MAGIS: Kerangka Kerja Multi-Agen Berbasis LLM untuk Penyelesaian Masalah GitHub. Tao dkk. arXiv. [kertas]
[2024/03] AGENTFL: Menskalakan Lokalisasi Kesalahan berbasis LLM ke Konteks Tingkat Proyek. Qin dkk. arXiv. [kertas]
[2024/03] Menggabungkan Agen Penyempurnaan dan Berbasis LLM untuk Audit Kontrak Cerdas Intuitif dengan Justifikasi. Ma dkk. arXiv. [kertas] [repo]
[2024/03] Ketika Pembuatan Kode Berbasis LLM Memenuhi Proses Pengembangan Perangkat Lunak. Lin dkk. arXiv. [kertas] [repo]
[2024/03] ACFIX: Memandu LLM dengan Praktik RBAC Umum yang Ditambang untuk Perbaikan Kerentanan Kontrol Akses yang Sadar Konteks dalam Kontrak Cerdas. Zhang dkk. arXiv. [kertas]
[2024/02] CodeAgent: Agen Kolaboratif untuk Rekayasa Perangkat Lunak. Tang dkk. arXiv. [kertas] [repo]
[2024/02] Pengembangan Berbasis Uji untuk Pembuatan Kode. Mathews dkk. arXiv. [kertas] [repo]
[2024/02] CodePori: Model Skala Besar untuk Pengembangan Perangkat Lunak Otonom dengan Menggunakan Multi-Agen. Rasheed dkk. arXiv. [kertas]
[2024/01] XUAT-Copilot: Sistem Kolaborasi Multi-Agen untuk Pengujian Penerimaan Pengguna Otomatis dengan Model Bahasa Besar. Wang dkk. arXiv. [kertas]
[2023/12] AgentCoder: Pembuatan Kode Berbasis Multi-Agen dengan Pengujian dan Optimasi Iteratif. Huang dkk. arXiv. [kertas]
[2023/11] Agen Otonom dalam Pengembangan Perangkat Lunak: Makalah Visi Rasheed dkk. arXiv. [kertas]
[2023/11] Pengujian GUI Seluler Berbasis Niat dengan Agen Model Bahasa Besar Otonom . Yoon dkk. ICST. [kertas] [repo]
[2023/10] Deteksi Kerentanan Kontrak Cerdas Bertenaga Model Bahasa Besar: Perspektif Baru. Hu dkk. TPS-ISA. [kertas] [repo]
[2023/10] Analisis Kode Statis di Era AI: Eksplorasi Mendalam Konsep, Fungsi, dan Potensi Analisis Kode Cerdas. Penggemar dkk. arXiv. [kertas]
[2023/10] Fuzzing Kompiler Kotak Putih Diberdayakan oleh Model Bahasa Besar. Yang dkk. arXiv. [kertas] [repo]
[2023/10] AXNav: Memutar Ulang Tes Aksesibilitas dari Bahasa Alami. Taeb dkk. CHI. [kertas]
[2023/08] AutoGen: Mengaktifkan Aplikasi LLM Generasi Berikutnya melalui Percakapan Multi-Agen. Wu dkk. arXiv. [kertas] [repo]
[2023/08] METAGPT: PEMROGRAMAN META UNTUK KERANGKA KOLABORATIF MULTI-AGEN. Hong dkk. ICLR. [kertas] [repo]
[2023/07] Agen Komunikatif untuk Pengembangan Perangkat Lunak. Qian dkk. ACL. [kertas] [repo]
[2023/06] APAKAH PERBAIKAN DIRI SEBAGAI BULLET PERAK UNTUK PEMBUATAN KODE?. Olausson dkk. ICLR. [kertas] [repo]
[2023/06] KOLABORASI MULTI-AGEN: MEMANFAATKAN KEKUATAN AGEN LLM CERDAS. Talebirad dkk. arXiv. [kertas]
[2023/05] Pengeditan Mandiri: Editor Kode Sadar Kesalahan untuk Pembuatan Kode . Zhang dkk. ACL. [kertas]
[2023/03] CAMEL: Agen Komunikatif untuk Eksplorasi “Pikiran” Masyarakat Model Bahasa Besar. Li dkk. sarafIPS. [kertas] [repo]
Peran Asisten
[2024/08] KEBERAGAMAN MEMBERDAYAKAN KECERDASAN: KEAHLIAN INTEGRASI AGEN TEKNIK PERANGKAT LUNAK Zhang dkk. arXiv. [kertas]
[2024/08] SpecRover: Ekstraksi Maksud Kode melalui LLMs Ruan et al. arXiv. [kertas] [repo]
[2024/06] MASAI: Arsitektur Modular untuk Agen AI Rekayasa Perangkat Lunak. Arora dkk. arXiv. [kertas]
[2024/05] MapCoder: Pembuatan Kode Multi-Agen untuk Pemecahan Masalah Kompetitif. Islam dkk. ACL. [kertas] [repo]
[2024/03] MAGIS: Kerangka Kerja Multi-Agen Berbasis LLM untuk Penyelesaian Masalah GitHub. Tao dkk. arXiv. [kertas]
[2024/03] CodeS: Bahasa Alami ke Repositori Kode melalui Sketsa Multi-Lapisan. Zan dkk. arXiv. [kertas] [repo]
[2024/03] Menggabungkan Agen Penyempurnaan dan Berbasis LLM untuk Audit Kontrak Cerdas Intuitif dengan Justifikasi. Ma dkk. arXiv. [kertas] [repo]
[2023/10] Analisis Kode Statis di Era AI: Eksplorasi Mendalam Konsep, Fungsi, dan Potensi Analisis Kode Cerdas. Penggemar dkk. arXiv. [kertas]
Struktur Berlapis
[2024/08] KEBERAGAMAN MEMBERDAYAKAN KECERDASAN: KEAHLIAN INTEGRASI AGEN TEKNIK PERANGKAT LUNAK Zhang dkk. arXiv. [kertas]
[2024/08] SpecRover: Ekstraksi Maksud Kode melalui LLMs Ruan et al. arXiv. [kertas] [repo]
[2024/06] Bereksperimen dengan Pengembangan Perangkat Lunak Multi-Agen: Menuju Platform Terpadu Sami dkk. arXiv. [kertas]
[2024/06] Menskalakan Kolaborasi Multi-Agen Berbasis Model Bahasa Besar Qian dkk. arXiv. [kertas] [repo]
[2024/06] Pengembangan Perangkat Lunak Multi-Agen melalui Kolaborasi Lintas Tim. Du dkk. arXiv. [kertas] [repo]
[2024/06] AgileCoder: Agen Kolaboratif Dinamis untuk Pengembangan Perangkat Lunak berdasarkan Metodologi Agile. Nguyen dkk. arXiv. [kertas] [repo]
[2024/05] MapCoder: Pembuatan Kode Multi-Agen untuk Pemecahan Masalah Kompetitif. Islam dkk. ACL. [kertas] [repo]
[2024/05] MARE: Kerangka Kolaborasi Multi-Agen untuk Rekayasa Persyaratan. Jin dkk. arXiv. [kertas]
[2024/04] AutoCodeRover: Peningkatan Program Otonom. Zhang dkk. ISSTA. [kertas] [repo]
[2024/04] Seberapa Jauh Kita Dapat Melakukan Perbaikan Program Tingkat Fungsi Praktis?. Xiang dkk. arXiv. [kertas] [repo]
[2024/03] CodeS: Bahasa Alami ke Repositori Kode melalui Sketsa Multi-Lapisan. Zan dkk. arXiv. [kertas] [repo]
[2024/03] Ketika Pembuatan Kode Berbasis LLM Memenuhi Proses Pengembangan Perangkat Lunak. Lin dkk. arXiv. [kertas] [repo]
[2024/03] AGENTFL: Menskalakan Lokalisasi Kesalahan berbasis LLM ke Konteks Tingkat Proyek. Qin dkk. arXiv. [kertas]
[2024/02] Saat Analisis Aliran Data Memenuhi Model Bahasa Besar. Wang dkk. arXiv. [kertas]
[2024/02] CodeAgent: Agen Kolaboratif untuk Rekayasa Perangkat Lunak. Tang dkk. arXiv. [kertas] [repo]
[2024/02] Hanya Lebih Banyak Agen yang Anda Butuhkan. Li dkk. arXiv. [kertas]
[2024/01] Bereksperimen Praktek Pemrograman Baru dengan LLM. Zhang dkk. arXiv. [kertas] [repo]
[2023/11] Agen Otonom dalam Pengembangan Perangkat Lunak: Makalah Visi Rasheed dkk. arXiv. [kertas]
[2023/10] Analisis Kode Statis di Era AI: Eksplorasi Mendalam Konsep, Fungsi, dan Potensi Analisis Kode Cerdas. Penggemar dkk. arXiv. [kertas]
[2023/10] Deteksi Kerentanan Kontrak Cerdas Bertenaga Model Bahasa Besar: Perspektif Baru. Hu dkk. TPS-ISA. [kertas] [repo]
[2023/10] Fuzzing Kompiler Kotak Putih Diberdayakan oleh Model Bahasa Besar. Yang dkk. arXiv. [kertas] [repo]
[2023/10] Jaringan Agen LLM Dinamis: Kerangka Kolaborasi Agen LLM dengan Optimasi Tim Agen. Liu dkk. arXiv. [kertas] [repo]
[2023/08] METAGPT: PEMROGRAMAN META UNTUK KERANGKA KOLABORATIF MULTI-AGEN. Hong dkk. ICLR. [kertas] [repo]
[2023/08] Alur: Blok Bangunan Penalaran dan Kolaborasi AI. Josifoski dkk. arXiv. [kertas] [repo]
[2023/07] Agen Komunikatif untuk Pengembangan Perangkat Lunak. Qian dkk. ACL. [kertas] [repo]
[2023/05] Pengeditan Mandiri: Editor Kode Sadar Kesalahan untuk Pembuatan Kode . Zhang dkk. ACL. kertas
[2023/04] LLM kode rendah: Pemrograman Visual melalui LLM. Cai dkk. arXiv. [kertas] [repo]
Struktur Melingkar
[2024/05] AutoCoder: Meningkatkan Model Bahasa Kode Besar dengan AIEV-INSTRUCT. Lei dkk. arXiv. [kertas] [repo]
[2024/04] Pendekatan Debugging Terpadu melalui Sinergi Multi-Agen Berbasis LLM. Lee dkk. arXiv. [kertas] [repo]
[2024/03] ACFIX: Memandu LLM dengan Praktik RBAC Umum yang Ditambang untuk Perbaikan Kerentanan Kontrol Akses yang Sadar Konteks dalam Kontrak Cerdas. Zhang dkk. arXiv. [kertas]
[2024/03] Konsensus Multiperan melalui Diskusi LLM untuk Deteksi Kerentanan. Mao dkk. QRS. [kertas]
[2024/03] Menggabungkan Agen Penyempurnaan dan Berbasis LLM untuk Audit Kontrak Cerdas Intuitif dengan Justifikasi. Ma dkk. arXiv. [kertas] [repo]
[2024/02] Pengembangan Berbasis Uji untuk Pembuatan Kode. Mathews dkk. arXiv. [kertas] [repo]
[2024/02] CodePori: Model Skala Besar untuk Pengembangan Perangkat Lunak Otonom dengan Menggunakan Multi-Agen. Rasheed dkk. arXiv. [kertas]
[2023/12] Pembelajaran Bersama Eksperiensial dari Agen Pengembang Perangkat Lunak. Qian dkk. ACL. [kertas] [repo]
[2023/12] AgentCoder: Pembuatan Kode Berbasis Multi-Agen dengan Pengujian dan Optimasi Iteratif. Huang dkk. arXiv. [kertas]
[2023/11] INTERVENOR: Mendorong Kemampuan Pengkodean Model Bahasa Besar dengan Rantai Perbaikan Interaktif. Wang dkk. ACL. [kertas] [repo]
[2023/11] Pengujian GUI Seluler Berbasis Niat dengan Agen Model Bahasa Besar Otonom . Yoon dkk. ICST. [kertas] [repo]
[2023/10] AXNav: Memutar Ulang Tes Aksesibilitas dari Bahasa Alami. Taeb dkk. CHI. [kertas]
[2023/06] APAKAH PERBAIKAN DIRI SEBAGAI BULLET PERAK UNTUK PEMBUATAN KODE?. Olausson dkk. ICLR. [kertas] [repo]
[2023/03] CAMEL: Agen Komunikatif untuk Eksplorasi “Pikiran” Masyarakat Model Bahasa Besar. Li dkk. sarafIPS. [kertas] [repo]
[2023/03] Refleksi: Agen Bahasa dengan Pembelajaran Penguatan Verbal. Shinn dkk. sarafIPS. [kertas] [repo]
Struktur Seperti Pohon
[2024/06] Menskalakan Kolaborasi Multi-Agen Berbasis Model Bahasa Besar Qian dkk. arXiv. [kertas] [repo]
[2024/06] MASAI: Arsitektur Modular untuk Agen AI Rekayasa Perangkat Lunak. Arora dkk. arXiv. [kertas]
[2024/04] Agen yang Terorganisir Sendiri: Kerangka Kerja Multi-Agen LLM menuju Pembuatan dan Pengoptimalan Kode Berskala Sangat Besar. Ishibashi dkk. arXiv. [kertas] [repo]
Struktur Seperti Bintang
[2024/06] Menskalakan Kolaborasi Multi-Agen Berbasis Model Bahasa Besar Qian dkk. arXiv. [kertas] [repo]
[2024/03] AutoDev: Pengembangan Otomatis Berbasis AI . Tufano dkk. arXiv [kertas]
[2024/01] XUAT-Copilot: Sistem Kolaborasi Multi-Agen untuk Pengujian Penerimaan Pengguna Otomatis dengan Model Bahasa Besar. Wang dkk. arXiv. [kertas]
[2023/10] RCAgent: Analisis Akar Penyebab Cloud oleh Agen Otonom dengan Model Bahasa Besar yang Ditambah Alat. Wang dkk. arXiv. [kertas]
[2023/08] AutoGen: Mengaktifkan Aplikasi LLM Generasi Berikutnya melalui Percakapan Multi-Agen. Wu dkk. arXiv. [kertas] [repo]
Struktur Jaring
[2024/06] Menskalakan Kolaborasi Multi-Agen Berbasis Model Bahasa Besar Qian dkk. arXiv. [kertas] [repo]
[2024/04] 3DGen: Pembuatan Parser Format Biner yang Terbukti Benar dengan Bantuan AI . Fakhory dkk. arXiv [kertas]
[2024/01] Bereksperimen Praktek Pemrograman Baru dengan LLM. Zhang dkk. arXiv. [kertas] [repo]
[2024/01] LLM4PLC: Memanfaatkan Model Bahasa Besar untuk Pemrograman PLC yang Dapat Diverifikasi dalam Sistem Kontrol Industri. Fakih dkk. ICSE. [kertas] [repo]
[2023/10] Analisis Kode Statis di Era AI: Eksplorasi Mendalam Konsep, Fungsi, dan Potensi Analisis Kode Cerdas. Penggemar dkk. arXiv. [kertas]
[2023/04] LLM kode rendah: Pemrograman Visual melalui LLM. Cai dkk. arXiv. [kertas] [repo]
[2024/05] MARE: Kerangka Kolaborasi Multi-Agen untuk Rekayasa Persyaratan. Jin dkk. arXiv. [kertas]
[2024/02] Tindakan Kode yang Dapat Dieksekusi Menghasilkan Agen LLM yang Lebih Baik. Wang dkk. ICML. [kertas] [repo]
[2024/01] Bereksperimen Praktek Pemrograman Baru dengan LLM. Zhang dkk. arXiv. [kertas] [repo]
[2023/10] ClarifyGPT: Memberdayakan Pembuatan Kode berbasis LLM dengan Klarifikasi Niat. Mu dkk. arXiv. [kertas] [repo]
[2023/06] Prompt Sapper: Infrastruktur Rekayasa Perangkat Lunak yang Diberdayakan LLM untuk Layanan Asli AI. Xing dkk. arXiv. [kertas]
[2024/03] CodeS: Bahasa Alami ke Repositori Kode melalui Sketsa Multi-Lapisan. Zan dkk. arXiv. [kertas] [repo]
[2024/01] LLM4PLC: Memanfaatkan Model Bahasa Besar untuk Pemrograman PLC yang Dapat Diverifikasi dalam Sistem Kontrol Industri. Fakih dkk. ICSE. [kertas] [repo]
[2023/09] MINT: MENGEVALUASI LLMS DALAM INTERAKSI MULTI-TURN DENGAN ALAT DAN UMPAN BALIK BAHASA. Wang dkk. ICLR. [kertas] [repo]
[2023/08] Alur: Blok Bangunan Penalaran dan Kolaborasi AI. Josifoski dkk. arXiv. [kertas] [repo]
[2023/08] AutoGen: Mengaktifkan Aplikasi LLM Generasi Berikutnya melalui Percakapan Multi-Agen. Wu dkk. arXiv. [kertas] [repo]
[2024/01] Bereksperimen Praktek Pemrograman Baru dengan LLM. Zhang dkk. arXiv. [kertas] [repo]
[2023/08] Gentopia: Platform Kolaboratif untuk LLM yang Ditambah Alat. Xu dkk. EMNLP. [kertas] [repo]
[2023/06] Prompt Sapper: Infrastruktur Rekayasa Perangkat Lunak yang Diberdayakan LLM untuk Layanan Asli AI. Xing dkk. arXiv. [kertas]
[2023/03] SENI: Penalaran multi-langkah otomatis dan penggunaan alat untuk model bahasa besar. Paranjape dkk. arXiv. [kertas] [repo]
@misc{Agent4SE, title={Agen Berbasis Model Bahasa Besar untuk Rekayasa Perangkat Lunak: Survei}, author={Junwei Liu dan Kaixin Wang dan Yixuan Chen dan Xin Peng dan Zhenpeng Chen dan Lingming Zhang dan Yiling Lou}, year={2024}, eprint={2409.02977}, archivePrefix={arXiv}, primaryClass={cs.SE} , url={https://arxiv.org/abs/2409.02977}, }
Junwei Liu @To-D
Kaixin Wang @wkx228
Yixuan Chen @FloridaSpidee
Jangan ragu untuk mengajukan pertanyaan atau memberi kami beberapa saran melalui:
Junwei Liu: [email protected]