ความก้าวหน้าล่าสุดในโมเดลภาษาขนาดใหญ่ (LLM) ได้กำหนดกระบวนทัศน์ใหม่ของตัวแทน AI เช่น ตัวแทนที่ใช้ LLM เมื่อเปรียบเทียบกับ LLM แบบสแตนด์อโลน ตัวแทนที่ใช้ LLM จะขยายความคล่องตัวและความเชี่ยวชาญของ LLM ได้อย่างมาก โดยการเพิ่ม LLM ด้วยความสามารถในการรับรู้และใช้ประโยชน์จากทรัพยากรและเครื่องมือภายนอก จนถึงปัจจุบัน มีการใช้ตัวแทนที่ใช้ LLM และแสดงให้เห็นถึงประสิทธิภาพที่โดดเด่นในด้านวิศวกรรมซอฟต์แวร์ (SE) การทำงานร่วมกันระหว่างตัวแทนหลายรายและการมีปฏิสัมพันธ์ของมนุษย์นำมาซึ่งความหวังเพิ่มเติมในการแก้ไขปัญหา SE ในโลกแห่งความเป็นจริงที่ซับซ้อน ในงานนี้ เรานำเสนอแบบสำรวจที่ครอบคลุมและเป็นระบบเกี่ยวกับตัวแทนที่ใช้ LLM สำหรับ SE เรารวบรวมเอกสาร 106 ฉบับและจัดหมวดหมู่จากสองมุมมอง ได้แก่ มุมมอง SE และมุมมองของตัวแทน นอกจากนี้เรายังหารือเกี่ยวกับความท้าทายที่เปิดกว้างและทิศทางในอนาคตในขอบเขตที่สำคัญนี้
- เราได้สรุปความคืบหน้าของ Agent4SE อย่างเป็นระบบจากมุมมองของทั้งงาน วิศวกรรมซอฟต์แวร์ และ สถาปัตยกรรมตัวแทน
- ลิงค์กระดาษ: ตัวแทนตามโมเดลภาษาขนาดใหญ่สำหรับวิศวกรรมซอฟต์แวร์: แบบสำรวจ
สาขาการวิจัยนี้มีการพัฒนาอย่างรวดเร็ว ติดดาวพื้นที่เก็บข้อมูลนี้เพื่อติดตามการอัปเดต!
[2024/09/04] เราเผยแพร่เวอร์ชันแรกของแบบสำรวจของเราใน arXiv
ข่าว
มุมมองของ SE
การแปลข้อผิดพลาด
ซ่อมโปรแกรม
การดีบักแบบรวม
การทดสอบหน่วย
การทดสอบระบบ
การตรวจจับข้อผิดพลาดแบบคงที่
รีวิวโค้ด
วิศวกรรมความต้องการ
การสร้างรหัส
การยืนยัน
การตรวจสอบรหัสแบบคงที่
การทดสอบ
การดีบัก
ปล่อย
การพัฒนาซอฟต์แวร์แบบครบวงจร
การบำรุงรักษาซอฟต์แวร์แบบครบวงจร
มุมมองของตัวแทน
ขั้นตอนการวางแผน
เฟสความต้องการ
ขั้นตอนการพัฒนา
ขั้นตอนการประเมิน
บทบาทตัวแทน
กลไกการทำงานร่วมกัน
การวางแผน
หน่วยความจำ
การรับรู้
การกระทำ
กรอบงานตัวแทน
ระบบหลายตัวแทน
การทำงานร่วมกันระหว่างมนุษย์และตัวแทน
การอ้างอิง
ผู้ดูแล
ติดต่อเรา
ประวัติดารา
[2024/05] MARE: กรอบความร่วมมือหลายตัวแทนสำหรับวิศวกรรมความต้องการ จิน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/04] Elicitron: กรอบงานการจำลองที่ใช้ตัวแทน LLM สำหรับการกระตุ้นความต้องการการออกแบบ อาเทอิ และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/01] SpecGen: การสร้างข้อมูลจำเพาะของโปรแกรมอย่างเป็นทางการโดยอัตโนมัติผ่านโมเดลภาษาขนาดใหญ่ แม่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[10/2023] วิศวกรรมความต้องการที่ก้าวหน้าผ่าน Generative AI: การประเมินบทบาทของ LLM อโรรา และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/11] การเขียนโปรแกรมที่ขับเคลื่อนด้วยการวางแผน: เวิร์กโฟลว์การเขียนโปรแกรมโมเดลภาษาขนาดใหญ่ Lei และคณะ arXiv [กระดาษ]
[2024/11] ห่วงโซ่ของการเขียนโปรแกรม: เสริมพลังให้กับโมเดลภาษาขนาดใหญ่สำหรับการสร้างโค้ดเชิงพื้นที่ Hou et al. arXiv [กระดาษ]
[10/2024] Sandbox ภาษาการเขียนโปรแกรมหลายภาษาสำหรับ LLM Dou และคณะ arXiv [กระดาษ]
[2024/10] SceneGenAgent: การสร้างฉากอุตสาหกรรมที่แม่นยำด้วย Coding Agent Xia และคณะ arXiv [กระดาษ] [repo]
[10/2024] MCCoder: ปรับปรุงการควบคุมการเคลื่อนไหวด้วยการสร้างโค้ด LLM-Assisted และการตรวจสอบที่เข้มงวด Li และคณะ arXiv [กระดาษ] [repo]
[10/2024] Agents4PLC: การสร้างและการตรวจสอบรหัส PLC แบบวงปิดอัตโนมัติในระบบควบคุมอุตสาหกรรมโดยใช้ตัวแทนที่ใช้ LLM Liu และคณะ arXiv [กระดาษ] [repo]
[10/2024] การปรับปรุงประสิทธิภาพของโปรแกรมแบบขนานผ่านการสร้างโค้ดที่ขับเคลื่อนด้วย DSL ด้วยเครื่องมือเพิ่มประสิทธิภาพ LLM Wei et al. อาร์เอ็กซ์ [กระดาษ]
[10/2024] AgentBank: สู่ตัวแทน LLM ทั่วไปผ่านการปรับแต่งแบบละเอียดใน เพลงวิถีการโต้ตอบมากกว่า 50,000 รายการ และคณะ อาร์เอ็กซ์ [กระดาษ]
[10/2024] RLEF: GROUNDING CODE LLMS ในการตอบรับการดำเนินการพร้อมการเรียนรู้การเสริมกำลัง Gehring และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/10] ดีกว่าครูของคุณ: ตัวแทน LLM ที่เรียนรู้จากข้อเสนอแนะ AI ที่มีสิทธิ์พิเศษ Choudhury และคณะ อาร์เอ็กซ์ [กระดาษ]
[10/2024] AMR-Evol: วิวัฒนาการการตอบสนองแบบโมดูลาร์แบบปรับเปลี่ยนได้ทำให้เกิดการกลั่นกรองความรู้ที่ดีขึ้นสำหรับโมเดลภาษาขนาดใหญ่ในการสร้างโค้ด Luo และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[10/2024] RGD: ดีบักเกอร์ตัวแทนที่ใช้ Multi-LLM ผ่านการแนะนำการปรับแต่งและการสร้าง Jin และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/09] AutoSafeCoder: กรอบงานหลายตัวแทนสำหรับการรักษาความปลอดภัยการสร้างโค้ด LLM ผ่านการวิเคราะห์แบบคงที่และการทดสอบ Fuzz Nunez และคณะ arXiv [กระดาษ] [repo]
[2024/09] กรอบการเขียนโปรแกรมคู่สำหรับการสร้างโค้ดผ่านการสำรวจหลายแผนและการปรับแต่งที่ขับเคลื่อนด้วยคำติชม Zhang และคณะ arXiv [กระดาษ] [repo]
[2024/08] การกรองแกลบ: การใช้คำติชมการดำเนินการสำหรับการจัดอันดับผู้สมัครรหัสที่สร้างขึ้น Sun และคณะ arXiv [กระดาษ]
[2024/08] CODEXGRAPH: การเชื่อมโยงโมเดลภาษาขนาดใหญ่และที่เก็บโค้ดผ่านฐานข้อมูลกราฟโค้ด Liu และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/07] OPENHANDS: แพลตฟอร์มแบบเปิดสำหรับนักพัฒนาซอฟต์แวร์ AI ในฐานะตัวแทนทั่วไป Wang และคณะ arXiv [กระดาษ] [repo]
[2024/05] การสร้างโค้ดระดับคลาสจากภาษาธรรมชาติโดยใช้การใช้เหตุผลแบบวนซ้ำและเพิ่มประสิทธิภาพด้วยเครื่องมือบนพื้นที่เก็บข้อมูล เดชปันเด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/05] MapCoder: การสร้างโค้ดหลายตัวแทนเพื่อการแก้ปัญหาเชิงแข่งขัน อิสลามและคณะ เอซีแอล. [กระดาษ] [repo]
[2024/05] AutoCoder: การปรับปรุงโมเดลภาษาขนาดใหญ่ของโค้ดด้วย AIEV-INSTRUCT เล่ยและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/04] 3DGen: การสร้างพาร์เซอร์รูปแบบไบนารีที่ถูกต้องที่พิสูจน์ได้โดยใช้ AI ฟาคูรี และคณะ arXiv [กระดาษ]
[2024/04] ตัวแทนที่จัดระเบียบด้วยตนเอง: กรอบงาน LLM Multi-Agent สู่การสร้างและการเพิ่มประสิทธิภาพโค้ดขนาดใหญ่พิเศษ อิชิบาชิ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] AutoDev: การพัฒนาที่ขับเคลื่อนด้วย AI อัตโนมัติ ทูฟาโน และคณะ arXiv [กระดาษ]
[2024/03] CoCoST: การสร้างโค้ดที่ซับซ้อนอัตโนมัติพร้อมการค้นหาออนไลน์และการทดสอบความถูกต้อง เขาและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] RAT: การเรียกค้นความคิดเสริมทำให้เกิดการใช้เหตุผลตามบริบทในการสร้างโลกทัศน์อันยาวไกล วังและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] การดำเนินการโค้ดที่ปฏิบัติการได้ช่วยดึงตัวแทน LLM ที่ดีขึ้น วังและคณะ ไอซีเอ็มแอล. [กระดาษ] [repo]
[2024/02] ตัวแทนเพิ่มเติมคือสิ่งที่คุณต้องการ หลี่และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/02] การพัฒนาที่ขับเคลื่อนด้วยการทดสอบสำหรับการสร้างโค้ด แมทธิวส์และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] LDB: ดีบักเกอร์โมเดลภาษาขนาดใหญ่ผ่านการตรวจสอบการดำเนินการรันไทม์ทีละขั้นตอน จงและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/01] CodeAgent: การปรับปรุงการสร้างโค้ดด้วยระบบเอเจนต์ที่รวมเครื่องมือสำหรับความท้าทายในการเขียนโค้ดระดับ Repo ในโลกแห่งความเป็นจริง จางและคณะ เอซีแอล. [กระดาษ]
[2024/01] การสอน Code LLM เพื่อใช้เครื่องมือเติมข้อความอัตโนมัติในการสร้างโค้ดระดับพื้นที่เก็บข้อมูล วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/01] การสร้างโค้ดด้วย AlphaCodium: จากวิศวกรรมแบบพร้อมท์ไปจนถึงวิศวกรรมการไหล ริดนิค และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/12] AgentCoder: การสร้างโค้ดแบบหลายตัวแทนพร้อมการทดสอบซ้ำและการเพิ่มประสิทธิภาพ หวงและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/12] LLM4TDD: วิธีปฏิบัติที่ดีที่สุดสำหรับการพัฒนาที่ขับเคลื่อนด้วยการทดสอบโดยใช้แบบจำลองภาษาขนาดใหญ่ ปิยะ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/11] ผู้แทรกแซง: กระตุ้นความสามารถในการเขียนโค้ดของโมเดลภาษาขนาดใหญ่ด้วยห่วงโซ่การซ่อมแซมแบบโต้ตอบ วังและคณะ เอซีแอล. [กระดาษ] [repo]
[10/2023] Dynamic LLM-Agent Network: กรอบการทำงานร่วมกันของ LLM-agent พร้อมการเพิ่มประสิทธิภาพทีมตัวแทน หลิวและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/10] สัตว์จำพวกลิง: การประสานภาษาธรรมชาติและรหัสสำหรับตัวแทนภาษา ซูและคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[10/2023] ClarifyGPT: เสริมพลังการสร้างโค้ดบน LLM ด้วย Intention Clarification หมู่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/10] CODECHAIN: สู่การสร้างรหัสโมดูลาร์ผ่านห่วงโซ่การแก้ไขตนเองด้วยโมดูลย่อยที่เป็นตัวแทน เลอและคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[10/2023] การค้นหาแผนผังตัวแทนภาษารวมการใช้เหตุผล การแสดง และการวางแผนไว้ในโมเดลภาษา โจวและคณะ ไอซีเอ็มแอล. [กระดาษ] [repo]
[2023/09] MINT: การประเมิน LLMS ในการโต้ตอบแบบหลายเทิร์นด้วยเครื่องมือและการตอบรับทางภาษา วังและคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/09] ความเข้าใจการเขียนโปรแกรมที่ขับเคลื่อนด้วยกรณีทดสอบในโมเดลภาษาขนาดใหญ่เพื่อการสร้างโค้ดที่ดีขึ้น เทียน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/09] CodePlan: การเขียนโค้ดระดับพื้นที่เก็บข้อมูลโดยใช้ LLM และการวางแผน บายรี และคณะ เอฟเอสอี. [กระดาษ] [repo]
[2023/09] จากการใช้ในทางที่ผิดไปสู่การเรียนรู้: การปรับปรุงการสร้างโค้ดด้วยการเชื่อมโยง AI ที่ขับเคลื่อนด้วยความรู้ เรน และคณะ เอเอสอี. [กระดาษ]
[2023/09] Parsel?: การใช้เหตุผลเชิงอัลกอริทึมด้วยแบบจำลองภาษาโดยการเขียนการสลายตัว เซลิกแมน และคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
[2023/08] AutoGen: การเปิดใช้งานแอปพลิเคชัน LLM รุ่นถัดไปผ่านการสนทนาแบบหลายตัวแทน วู และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] Gentopia: แพลตฟอร์มการทำงานร่วมกันสำหรับ Tool-Augmented LLM ซูและคณะ เอ็มแอลพี. [กระดาษ] [repo]
[2023/08] Flows: การสร้างบล็อคของการใช้เหตุผลและการทำงานร่วมกันของ AI โจซิโฟสกี้ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] CodeCoT: การแก้ปัญหาข้อผิดพลาดทางไวยากรณ์ของโค้ดในการให้เหตุผล CoT สำหรับการสร้างโค้ด หวงและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/06] SELFEVOLVE: กรอบวิวัฒนาการโค้ดผ่านโมเดลภาษาขนาดใหญ่ เจียงและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/06] InterCode: การกำหนดมาตรฐานและการเปรียบเทียบการเข้ารหัสเชิงโต้ตอบพร้อมคำติชมการดำเนินการ ยางและคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
[2023/06] การซ่อมแซมด้วยตนเองเป็นกระสุนเงินสำหรับการสร้างรหัสหรือไม่ โอเลาส์สัน และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/05] ToolCoder: สอนโมเดลการสร้างโค้ดให้ใช้เครื่องมือค้นหา API จางและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/05] แก้ไขด้วยตนเอง: Fault-Aware Code Editor สำหรับการสร้างโค้ด จางและคณะ เอซีแอล. [กระดาษ]
[2023/04] การสอนโมเดลภาษาขนาดใหญ่เพื่อแก้ไขข้อบกพร่องด้วยตนเอง เฉินและคณะ ไอซีแอลอาร์ [กระดาษ]
[2023/04] การเขียนโปรแกรมอัตโนมัติเต็มรูปแบบด้วยโมเดลภาษาขนาดใหญ่ ลิเวนต์เซฟ และคณะ เก็กโก. [กระดาษ]
[2023/03] CAMEL: ตัวแทนการสื่อสารสำหรับการสำรวจ "จิตใจ" ของสังคมต้นแบบภาษาขนาดใหญ่ หลี่และคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
[2023/03] การสะท้อนกลับ: ตัวแทนภาษาพร้อมการเรียนรู้การเสริมกำลังทางวาจา ชินน์ และคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
[2023/03] ปรับแต่งตนเอง: ปรับแต่งซ้ำพร้อมแสดงความคิดเห็นตนเอง มาดาน และคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
[10/2024] การสร้างการพิสูจน์อัตโนมัติสำหรับรหัสสนิมผ่านการพัฒนาตนเอง Chen และคณะ arXiv [กระดาษ]
[2024/09] AutoVerus: การสร้างการพิสูจน์อัตโนมัติสำหรับรหัสสนิม Yang และคณะ arXiv [กระดาษ]
[10/2024] การใช้ประโยชน์จากโมเดลภาษาที่ได้รับการปรับแต่งเพื่อการตรวจสอบสัญญาอัจฉริยะที่มีประสิทธิภาพและแม่นยำ Wei และคณะ arXiv [กระดาษ] [repo]
[10/2024] LLM-SmartAudit: การตรวจจับช่องโหว่ของ Smart Contract ขั้นสูง Wei และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/05] การวิเคราะห์แบบคงที่ที่ได้รับความช่วยเหลือจาก LLM สำหรับการตรวจจับช่องโหว่ด้านความปลอดภัย หลี่และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/05] PropertyGPT: การตรวจสอบอย่างเป็นทางการของสัญญาอัจฉริยะที่ขับเคลื่อนด้วย LLM ผ่านการสร้างอสังหาริมทรัพย์แบบดึงข้อมูลเสริม หลิวและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] ฉันทามติหลายบทบาทผ่านการสนทนา LLM สำหรับการตรวจจับช่องโหว่ เหมาและคณะ QRS. [กระดาษ]
[2024/03] การผสมผสานการปรับแต่งอย่างละเอียดและตัวแทนที่ใช้ LLM สำหรับการตรวจสอบสัญญาอัจฉริยะที่ใช้งานง่ายพร้อมการให้เหตุผล แม่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] เมื่อการวิเคราะห์โฟลว์ข้อมูลพบกับโมเดลภาษาขนาดใหญ่ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/01] LLM4Vuln: กรอบการประเมินแบบครบวงจรสำหรับการแยกส่วนและเพิ่มประสิทธิภาพการให้เหตุผลเกี่ยวกับช่องโหว่ของ LLM ซัน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/12] E&V: การแจ้งโมเดลภาษาขนาดใหญ่ให้ทำการวิเคราะห์แบบคงที่โดยการดำเนินการและการตรวจสอบรหัสเทียม เฮาและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/10] การตรวจจับช่องโหว่สัญญาอัจฉริยะที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่: มุมมองใหม่ หูและคณะ ทีพีเอส-ISA. [กระดาษ] [repo]
[10/2023] การวิเคราะห์โค้ดแบบคงที่ในยุค AI: การสำรวจเชิงลึกเกี่ยวกับแนวคิด ฟังก์ชัน และศักยภาพของการวิเคราะห์โค้ดอัจฉริยะ แฟน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/08] การปรับปรุงการวิเคราะห์แบบคงที่สำหรับการตรวจจับจุดบกพร่องเชิงปฏิบัติ: แนวทางบูรณาการ LLM หลี่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/03] ART: การใช้เหตุผลหลายขั้นตอนอัตโนมัติและการใช้เครื่องมือสำหรับโมเดลภาษาขนาดใหญ่ ปารันจาเป และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[10/2024] ตัวแทนในฐานะผู้พิพากษา: ประเมินตัวแทนกับตัวแทน Zhuge และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/09] Divide-and-Conquer: การแก้ไขโค้ดอัตโนมัติผ่าน Localization-and-Revision Wang และคณะ พลอากาศเอกทรานส์ ซอฟท์แวร์ อังกฤษ วิธีการ [กระดาษ]
[2024/04] การตรวจสอบโค้ดที่ขับเคลื่อนด้วย AI พร้อม LLM: ผลลัพธ์เบื้องต้น ราชีด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/02] CodeAgent: ตัวแทนการทำงานร่วมกันสำหรับวิศวกรรมซอฟต์แวร์ ถังและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[10/2023] การวิเคราะห์โค้ดแบบคงที่ในยุค AI: การสำรวจเชิงลึกเกี่ยวกับแนวคิด ฟังก์ชัน และศักยภาพของการวิเคราะห์โค้ดอัจฉริยะ แฟน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/09] แกนหลัก: การแก้ไขปัญหาคุณภาพของรหัสโดยใช้ LLM วัดวา และคณะ เอฟเอสอี. [กระดาษ] [repo]
[2024/11] ReAccept: วิวัฒนาการร่วมอัตโนมัติของการผลิตและรหัสการทดสอบตามการตรวจสอบแบบไดนามิกและโมเดลภาษาขนาดใหญ่ Chi et al. arXiv [กระดาษ] [repo]
[2024/09] Python Symbolic Execution พร้อมการสร้างโค้ดที่ขับเคลื่อนด้วย LLM Wang และคณะ arXiv [กระดาษ]
[2024/06] Mokav: การทดสอบความแตกต่างที่ขับเคลื่อนด้วยการดำเนินการด้วย LLM เอเตมาดี และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/04] การปรับปรุงการสร้างการทดสอบที่ใช้ LLM สำหรับสาขาที่ปกปิดยากผ่านการวิเคราะห์โปรแกรม ยางและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] AutoDev: การพัฒนาที่ขับเคลื่อนด้วย AI อัตโนมัติ ทูฟาโน และคณะ arXiv [กระดาษ]
[2024/03] COVERUP: การสร้างการทดสอบที่ใช้ LLM ตามความครอบคลุม พิซโซโน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] การสร้างการทดสอบที่มีประสิทธิภาพโดยใช้แบบจำลองภาษาขนาดใหญ่ที่ได้รับการฝึกอบรมล่วงหน้าและการทดสอบการกลายพันธุ์ ดาเคล และคณะ ข้อมูล ซอฟท์แวร์ เทคโนโลยี - [กระดาษ] [repo]
[2023/05] ไม่มีการทดสอบด้วยตนเองอีกต่อไปแล้วใช่ไหม การประเมินและปรับปรุง ChatGPT สำหรับการสร้างการทดสอบหน่วย หยวน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/05] ChatUniTest: กรอบงานสำหรับการสร้างการทดสอบแบบ LLM เฉินและคณะ เอฟเอสอี. [กระดาษ] [repo]
[2023/02] การประเมินเชิงประจักษ์ของการใช้แบบจำลองภาษาขนาดใหญ่สำหรับการสร้างการทดสอบหน่วยอัตโนมัติ เชฟเฟอร์ และคณะ IEEE ทรานส์ ซอฟต์แวร์ภาษาอังกฤษ... [กระดาษ] [repo]
[2024/11] ระบบปรับปรุงกราฟความรู้โค้ดสำหรับไดรเวอร์ Fuzz ที่ใช้ LLM รุ่น Xu และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/07] การทดสอบ GUI บนมือถืออัตโนมัติที่ขับเคลื่อนด้วยวิสัยทัศน์ผ่านโมเดลภาษาขนาดใหญ่หลายรูปแบบ หลิวและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/04] ตัวแทน LLM สามารถใช้ประโยชน์จากช่องโหว่ในหนึ่งวันได้โดยอัตโนมัติ ฝาง และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/02] คุณสามารถพักผ่อนได้แล้ว: การอนุมานข้อกำหนดอัตโนมัติและการทดสอบกล่องดำของ RESTful API ด้วยโมเดลภาษาขนาดใหญ่ Decrop และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/01] XUAT-Copilot: ระบบการทำงานร่วมกันหลายตัวแทนสำหรับการทดสอบการยอมรับของผู้ใช้อัตโนมัติด้วยโมเดลภาษาขนาดใหญ่ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/01] KernelGPT: ปรับปรุง Kernel Fuzzing ผ่านโมเดลภาษาขนาดใหญ่ ยางและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/11] การทดสอบ GUI บนมือถือที่ขับเคลื่อนด้วยความตั้งใจด้วยตัวแทนโมเดลภาษาขนาดใหญ่อัตโนมัติ ยุน และคณะ ไอซีเอสที. [กระดาษ] [repo]
[10/2023] ทำให้ LLM เป็นผู้เชี่ยวชาญด้านการทดสอบ: นำการโต้ตอบที่เหมือนมนุษย์มาสู่การทดสอบ GUI บนมือถือผ่านการตัดสินใจที่คำนึงถึงฟังก์ชันการทำงาน หลิวและคณะ ไอซีเอสอี. [กระดาษ]
[10/2023] AXNav: เล่นการทดสอบการเข้าถึงซ้ำจากภาษาธรรมชาติ แท๊บ และคณะ ชิ [กระดาษ]
[2023/10] Fuzzing Compiler White-box เสริมพลังโดยโมเดลภาษาขนาดใหญ่ ยางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[10/2023] การทดสอบขีดจำกัด: การสร้างการป้อนข้อความที่ผิดปกติสำหรับการตรวจจับข้อขัดข้องของแอปบนมือถือด้วยโมเดลภาษาขนาดใหญ่ หลิวและคณะ ไอซีเอสอี. [กระดาษ] [repo]
[2023/08] PENTESTGPT: เครื่องมือทดสอบการเจาะทะลุอัตโนมัติที่สนับสนุน LLM เติ้งและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] Fuzz4All: Universal Fuzzing พร้อมโมเดลภาษาขนาดใหญ่ เซี่ยและคณะ ไอซีเอสอี. [กระดาษ] [repo]
[2023/07] การแยกจุดบกพร่องของคอมไพเลอร์โดยการสร้างโปรแกรมพยานที่มีประสิทธิภาพด้วยโมเดลภาษาขนาดใหญ่ ตู่และคณะ IEEE ทรานส์ ซอฟต์แวร์ภาษาอังกฤษ [กระดาษ] [repo]
[2023/06] การแจ้งคือสิ่งที่คุณต้องการ: เล่นซ้ำข้อผิดพลาดของ Android อัตโนมัติพร้อมโมเดลภาษาขนาดใหญ่ เฟิง และคณะ ไอซีเอสอี. [กระดาษ] [repo]
[2024/11] FlexFL: การแปลข้อผิดพลาดที่ยืดหยุ่นและมีประสิทธิภาพด้วยโมเดลภาษาขนาดใหญ่แบบโอเพ่นซอร์ส Xu และคณะ arXiv [กระดาษ]
[2024/09] การปรับปรุงการแปลข้อผิดพลาดผ่านการวิเคราะห์โค้ดที่สั่งด้วยตัวแทน LLM และ Rafi แบบสะท้อนตัวเอง และคณะ arXiv [กระดาษ]
[2024/03] AGENTFL: ปรับขนาดการแปลข้อผิดพลาดตาม LLM เป็นบริบทระดับโครงการ ฉินและคณะ อาร์เอ็กซ์ [กระดาษ]
[10/2023] RCAgent: การวิเคราะห์สาเหตุของคลาวด์โดยตัวแทนอิสระพร้อมโมเดลภาษาขนาดใหญ่ที่เสริมด้วยเครื่องมือ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/08] การประเมินเชิงปริมาณและเชิงคุณภาพของการแปลข้อผิดพลาดที่อธิบายได้โดยใช้ LLM คัง และคณะ เอฟเอสอี. [กระดาษ]
[2024/07] OPENHANDS: แพลตฟอร์มแบบเปิดสำหรับนักพัฒนาซอฟต์แวร์ AI ในฐานะตัวแทนทั่วไป Wang และคณะ arXiv [กระดาษ] [repo]
[2024/10] การค้นหาตามความหมายสำหรับการซ่อมแซมโปรแกรมที่มีประสิทธิภาพด้วยโมเดลภาษาขนาดใหญ่ Thanh และคณะ arXiv [กระดาษ]
[2024/09] การซ่อมแซมระบบประสาทของการทดสอบความไม่แน่นอน เฉินและคณะ อิสสตา. [กระดาษ]
[2024/04] เราจะไปได้ไกลแค่ไหนกับการซ่อมแซมโปรแกรมระดับฟังก์ชั่นที่ใช้งานได้จริง?. เซียง และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] RepairAgent: ตัวแทนอัตโนมัติที่ใช้ LLM สำหรับการซ่อมแซมโปรแกรม บูเซเนีย และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] ACFIX: แนวทาง LLM ด้วยแนวทางปฏิบัติ RBAC ทั่วไปที่ขุดขึ้นมาสำหรับการซ่อมแซมช่องโหว่ในการควบคุมการเข้าถึงตามบริบทในสัญญาอัจฉริยะ จางและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/02] CigaR: การซ่อมแซมโปรแกรมที่คุ้มค่าด้วย LLM ฮิดเวกิ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/04] การดีบักอัตโนมัติที่อธิบายได้ผ่านการดีบักทางวิทยาศาสตร์ที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่ คัง และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/04] สนทนาต่อไป: แก้ไขข้อบกพร่อง 162 รายการจาก 337 รายการ ในราคา 0.42 ดอลลาร์ต่อรายการโดยใช้ ChatGPT เซี่ยและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/01] การซ่อมแซมโปรแกรมสนทนาอัตโนมัติ เซี่ยและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/04] แนวทางการแก้ไขจุดบกพร่องแบบรวมผ่านการทำงานร่วมกันหลายตัวแทนที่ใช้ LLM ลีและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] LDB: ดีบักเกอร์โมเดลภาษาขนาดใหญ่ผ่านการตรวจสอบการดำเนินการรันไทม์ทีละขั้นตอน จงและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/08] GoNoGo: ระบบหลายตัวแทนที่ใช้ LLM ที่มีประสิทธิภาพสำหรับการปรับปรุงการตัดสินใจเปิดตัวซอฟต์แวร์ยานยนต์ Khoee และคณะ arXiv [กระดาษ]
[2024/09] การสร้างการจับคู่โค้ด Java กับ ChatGPT Zhao และคณะ วิทยาการคอมพิวเตอร์เชิงทฤษฎี [กระดาษ]
[2024/07] เสริมศักยภาพการพัฒนาซอฟต์แวร์ Generative แบบ Agile ผ่านการทำงานเป็นทีม Human-AI Zhang และคณะ TOSEM [กระดาษ] [repo]
[2024/06] การทดลองกับการพัฒนาซอฟต์แวร์หลายตัวแทน: สู่แพลตฟอร์มแบบครบวงจร Sami และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/06] การปรับขนาดการทำงานร่วมกันของตัวแทนหลายภาษาตามแบบจำลองขนาดใหญ่ Qian และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] การพัฒนาซอฟต์แวร์หลายตัวแทนผ่านการทำงานร่วมกันข้ามทีม ดู่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] AgileCoder: ตัวแทนการทำงานร่วมกันแบบไดนามิกสำหรับการพัฒนาซอฟต์แวร์ตามระเบียบวิธี Agile เหงียนและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/05] การปรับปรุงประสบการณ์ซ้ำของตัวแทนการพัฒนาซอฟต์แวร์ เคียนและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] เมื่อการสร้างโค้ดบน LLM ตรงตามกระบวนการพัฒนาซอฟต์แวร์ ลิน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] CodeS: ภาษาธรรมชาติสู่พื้นที่เก็บข้อมูลโค้ดผ่าน Multi-Layer Sketch ซาน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] CodePori: แบบจำลองขนาดใหญ่สำหรับการพัฒนาซอฟต์แวร์อัตโนมัติโดยใช้ Multi-Agent ราชีด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/01] การทดลองฝึกการเขียนโปรแกรมใหม่กับ LLM จางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/01] LLM4PLC: การใช้แบบจำลองภาษาขนาดใหญ่สำหรับการเขียนโปรแกรม PLC ที่ตรวจสอบได้ในระบบควบคุมอุตสาหกรรม ฟากิห์ และคณะ ไอซีเอสอี. [กระดาษ] [repo]
[2023/12] การเรียนรู้ร่วมเชิงประสบการณ์ของตัวแทนการพัฒนาซอฟต์แวร์ เคียนและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/11] Autonomous Agent ในการพัฒนาซอฟต์แวร์: A Vision Paper Rasheed และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/09] AutoAgents: กรอบงานสำหรับการสร้างตัวแทนอัตโนมัติ เฉินและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] AgentVerse: อำนวยความสะดวกในการทำงานร่วมกันหลายตัวแทนและการสำรวจพฤติกรรมฉุกเฉิน เฉินและคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/08] METAGPT: การเขียนโปรแกรม META สำหรับกรอบความร่วมมือหลายตัวแทน ฮอง และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/07] ตัวแทนการสื่อสารเพื่อการพัฒนาซอฟต์แวร์. เคียนและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/06] การทำงานร่วมกันหลายตัวแทน: การควบคุมพลังของตัวแทน LLM ที่ชาญฉลาด ทาเลบิรัด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/06] Prompt Sapper: โครงสร้างพื้นฐานวิศวกรรมซอฟต์แวร์ที่เสริมศักยภาพ LLM สำหรับบริการ AI-Native ซิง และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/04] การสร้างโค้ดการทำงานร่วมกันด้วยตนเองผ่าน ChatGPT ดง และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/04] LLM แบบ Low-code: การเขียนโปรแกรมด้วยภาพผ่าน LLM Cai และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/11] LLM ในฐานะผู้เรียนอย่างต่อเนื่อง: การปรับปรุงการทำซ้ำรหัสที่บกพร่องในปัญหาซอฟต์แวร์ Lin และคณะ arXiv [กระดาษ]
[2567/11] ตัวแทนพัฒนาซอฟต์แวร์แบบ Human-In-the-Loop เถิกศักดิ์สิริ และคณะ arXiv [กระดาษ]
[2024/11] Lingma SWE-GPT: โมเดลภาษาที่เน้นกระบวนการพัฒนาแบบเปิดสำหรับการปรับปรุงซอฟต์แวร์อัตโนมัติ และคณะ arXiv [กระดาษ] [repo]
[10/2024] RepoGraph: การเพิ่มประสิทธิภาพวิศวกรรมซอฟต์แวร์ AI ด้วยกราฟโค้ดระดับพื้นที่เก็บข้อมูล Ouyang และคณะ arXiv [กระดาษ] [repo]
[2024/09] MarsCode Agent: การแก้ไขข้อบกพร่องอัตโนมัติแบบ AI ดั้งเดิม Liu และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/08] CODEXGRAPH: การเชื่อมโยงโมเดลภาษาขนาดใหญ่และที่เก็บโค้ดผ่านฐานข้อมูลกราฟโค้ด Liu และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/08] ความหลากหลายส่งเสริมความฉลาด: ความเชี่ยวชาญในการบูรณาการของตัวแทนวิศวกรรมซอฟต์แวร์ Zhang และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/08] SpecRover: การแยกเจตนาโค้ดผ่าน LLMs Ruan และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/07] OPENHANDS: แพลตฟอร์มแบบเปิดสำหรับนักพัฒนาซอฟต์แวร์ AI ในฐานะตัวแทนทั่วไป Wang และคณะ arXiv [กระดาษ] [repo]
[2024/07] ไร้ตัวแทน: ไขข้อสงสัยให้กับตัวแทนวิศวกรรมซอฟต์แวร์ที่ใช้ LLM เซี่ยและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] จะเข้าใจพื้นที่เก็บข้อมูลซอฟต์แวร์ทั้งหมดได้อย่างไร. แม่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] CODER: การแก้ไขปัญหาด้วยหลายตัวแทนและกราฟงาน เฉินและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] MASAI: สถาปัตยกรรมโมดูลาร์สำหรับตัวแทน AI วิศวกรรมซอฟต์แวร์ อโรรา และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/05] SWE-AGENT: อินเทอร์เฟซระหว่างตัวแทนและคอมพิวเตอร์ช่วยให้วิศวกรรมซอฟต์แวร์อัตโนมัติทำงานได้ ยางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/04] AutoCodeRover: การปรับปรุงโปรแกรมอัตโนมัติ จางและคณะ อิสสตา. [กระดาษ] [repo]
[2024/03] MAGIS: กรอบงาน Multi-Agent ที่ใช้ LLM สำหรับการแก้ปัญหา GitHub เต่าและคณะ อาร์เอ็กซ์ [กระดาษ]
เกณฑ์มาตรฐาน
[10/2024/2024] SWE-Bench+: เกณฑ์มาตรฐานการเข้ารหัสที่ได้รับการปรับปรุงสำหรับ LLM Aleithan และคณะ อาร์เอ็กซ์ [กระดาษ]
[10/2024] SWE-bench Multimodal: ระบบ AI มีลักษณะทั่วไปกับโดเมนซอฟต์แวร์ภาพหรือไม่ ยางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/08] SWE-bench-java: ปัญหา GitHub ในการแก้ไขเกณฑ์มาตรฐานสำหรับ Java Zan และคณะ arXiv [กระดาษ] [repo]
[2024/07] ไร้ตัวแทน: ไขข้อสงสัยให้กับตัวแทนวิศวกรรมซอฟต์แวร์ที่ใช้ LLM เซี่ยและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[10/2023] Swe-bench: โมเดลภาษาสามารถแก้ไขปัญหา GitHub ในโลกแห่งความเป็นจริงได้หรือไม่ จิเมเนซ และคณะ ICLR [กระดาษ] [repo]
การวางแผนแบบเลี้ยวเดียว
[2024/06] AgileCoder: ตัวแทนการทำงานร่วมกันแบบไดนามิกสำหรับการพัฒนาซอฟต์แวร์ตามระเบียบวิธี Agile เหงียนและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] การพัฒนาซอฟต์แวร์หลายตัวแทนผ่านการทำงานร่วมกันข้ามทีม ดู่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/05] MapCoder: การสร้างโค้ดหลายตัวแทนเพื่อการแก้ปัญหาเชิงแข่งขัน อิสลามและคณะ เอซีแอล. [กระดาษ] [repo]
[2024/03] MAGIS: กรอบงาน Multi-Agent ที่ใช้ LLM สำหรับการแก้ปัญหา GitHub เต่าและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] CodeS: ภาษาธรรมชาติสู่พื้นที่เก็บข้อมูลโค้ดผ่าน Multi-Layer Sketch ซาน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] CoCoST: การสร้างโค้ดที่ซับซ้อนอัตโนมัติพร้อมการค้นหาออนไลน์และการทดสอบความถูกต้อง เขาและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/02] CodePori: แบบจำลองขนาดใหญ่สำหรับการพัฒนาซอฟต์แวร์อัตโนมัติโดยใช้ Multi-Agent ราชีด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/01] CodeAgent: การปรับปรุงการสร้างโค้ดด้วยระบบเอเจนต์ที่รวมเครื่องมือสำหรับความท้าทายในการเขียนโค้ดระดับ Repo ในโลกแห่งความเป็นจริง จางและคณะ เอซีแอล. [กระดาษ]
[2024/01] LLM4PLC: การใช้แบบจำลองภาษาขนาดใหญ่สำหรับการเขียนโปรแกรม PLC ที่ตรวจสอบได้ในระบบควบคุมอุตสาหกรรม ฟากิห์ และคณะ ไอซีเอสอี. [กระดาษ] [repo]
[2024/01] การทดลองฝึกการเขียนโปรแกรมใหม่กับ LLM จางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/11] Autonomous Agent ในการพัฒนาซอฟต์แวร์: A Vision Paper Rasheed และคณะ อาร์เอ็กซ์ [กระดาษ]
[10/2023] การวิเคราะห์โค้ดแบบคงที่ในยุค AI: การสำรวจเชิงลึกเกี่ยวกับแนวคิด ฟังก์ชัน และศักยภาพของการวิเคราะห์โค้ดอัจฉริยะ แฟน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/09] Parsel?: การใช้เหตุผลเชิงอัลกอริทึมด้วยแบบจำลองภาษาโดยการเขียนการสลายตัว เซลิกแมน และคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
[2023/08] PENTESTGPT: เครื่องมือทดสอบการเจาะทะลุอัตโนมัติที่สนับสนุน LLM เติ้งและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] Flows: การสร้างบล็อคของการใช้เหตุผลและการทำงานร่วมกันของ AI โจซิโฟสกี้ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] METAGPT: การเขียนโปรแกรม META สำหรับกรอบความร่วมมือหลายตัวแทน ฮอง และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/07] ตัวแทนการสื่อสารเพื่อการพัฒนาซอฟต์แวร์. เคียนและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/04] การสร้างโค้ดการทำงานร่วมกันด้วยตนเองผ่าน ChatGPT ดง และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/04] LLM แบบ Low-code: การเขียนโปรแกรมด้วยภาพผ่าน LLM Cai และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
การวางแผนหลายรอบ
[2024/03] RAT: การเรียกค้นความคิดเสริมทำให้เกิดการใช้เหตุผลตามบริบทในการสร้างโลกทัศน์อันยาวไกล วังและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
เหมือนมีปฏิกิริยา
[2024/06] MASAI: สถาปัตยกรรมโมดูลาร์สำหรับตัวแทน AI วิศวกรรมซอฟต์แวร์ อโรรา และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/02] การดำเนินการโค้ดที่ปฏิบัติการได้ช่วยดึงตัวแทน LLM ที่ดีขึ้น วังและคณะ ไอซีเอ็มแอล. [กระดาษ] [repo]
[2024/01] CodeAgent: การปรับปรุงการสร้างโค้ดด้วยระบบเอเจนต์ที่รวมเครื่องมือสำหรับความท้าทายในการเขียนโค้ดระดับ Repo ในโลกแห่งความเป็นจริง จางและคณะ เอซีแอล. [กระดาษ]
[2024/01] XUAT-Copilot: ระบบการทำงานร่วมกันหลายตัวแทนสำหรับการทดสอบการยอมรับของผู้ใช้อัตโนมัติด้วยโมเดลภาษาขนาดใหญ่ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/11] การทดสอบ GUI บนมือถือที่ขับเคลื่อนด้วยความตั้งใจด้วยตัวแทนโมเดลภาษาขนาดใหญ่อัตโนมัติ ยุน และคณะ ไอซีเอสที. [กระดาษ] [repo]
[10/2023] RCAgent: การวิเคราะห์สาเหตุของคลาวด์โดยตัวแทนอิสระพร้อมโมเดลภาษาขนาดใหญ่ที่เสริมด้วยเครื่องมือ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[10/2023] การค้นหาแผนผังตัวแทนภาษารวมการใช้เหตุผล การแสดง และการวางแผนไว้ในโมเดลภาษา โจวและคณะ ไอซีเอ็มแอล. [กระดาษ] [repo]
[10/2023] AXNav: เล่นการทดสอบการเข้าถึงซ้ำจากภาษาธรรมชาติ แท๊บ และคณะ ชิ [กระดาษ]
[2023/09] CodePlan: การเขียนโค้ดระดับพื้นที่เก็บข้อมูลโดยใช้ LLM และการวางแผน บายรี และคณะ เอฟเอสอี. [กระดาษ] [repo]
เป็นชั้นๆ
[2024/04] ตัวแทนที่จัดระเบียบด้วยตนเอง: กรอบงาน LLM Multi-Agent สู่การสร้างและการเพิ่มประสิทธิภาพโค้ดขนาดใหญ่พิเศษ อิชิบาชิ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
หน่วยความจำระยะยาว
[2024/06] การปรับขนาดการทำงานร่วมกันของตัวแทนหลายภาษาตามแบบจำลองขนาดใหญ่ Qian และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] การพัฒนาซอฟต์แวร์หลายตัวแทนผ่านการทำงานร่วมกันข้ามทีม ดู่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/05] การปรับปรุงประสบการณ์ซ้ำของตัวแทนการพัฒนาซอฟต์แวร์ เคียนและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/12] การเรียนรู้ร่วมเชิงประสบการณ์ของตัวแทนการพัฒนาซอฟต์แวร์ เคียนและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/11] การทดสอบ GUI บนมือถือที่ขับเคลื่อนด้วยความตั้งใจด้วยตัวแทนโมเดลภาษาขนาดใหญ่อัตโนมัติ ยุน และคณะ ไอซีเอสที. [กระดาษ] [repo]
[2023/09] AutoAgents: กรอบงานสำหรับการสร้างตัวแทนอัตโนมัติ เฉินและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] METAGPT: การเขียนโปรแกรม META สำหรับกรอบความร่วมมือหลายตัวแทน ฮอง และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/07] ตัวแทนการสื่อสารเพื่อการพัฒนาซอฟต์แวร์. เคียนและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/03] การสะท้อนกลับ: ตัวแทนภาษาพร้อมการเรียนรู้การเสริมกำลังทางวาจา ชินน์ และคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
หน่วยความจำระยะสั้น
[2024/07] การทดสอบ GUI บนมือถืออัตโนมัติที่ขับเคลื่อนด้วยวิสัยทัศน์ผ่านโมเดลภาษาขนาดใหญ่หลายรูปแบบ หลิวและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] การปรับขนาดการทำงานร่วมกันของตัวแทนหลายภาษาตามแบบจำลองขนาดใหญ่ Qian และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] การพัฒนาซอฟต์แวร์หลายตัวแทนผ่านการทำงานร่วมกันข้ามทีม ดู่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] AgileCoder: ตัวแทนการทำงานร่วมกันแบบไดนามิกสำหรับการพัฒนาซอฟต์แวร์ตามระเบียบวิธี Agile เหงียนและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/04] ตัวแทนที่จัดระเบียบด้วยตนเอง: กรอบงาน LLM Multi-Agent สู่การสร้างและการเพิ่มประสิทธิภาพโค้ดขนาดใหญ่พิเศษ อิชิบาชิ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] MAGIS: กรอบงาน Multi-Agent ที่ใช้ LLM สำหรับการแก้ปัญหา GitHub เต่าและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/01] XUAT-Copilot: ระบบการทำงานร่วมกันหลายตัวแทนสำหรับการทดสอบการยอมรับของผู้ใช้อัตโนมัติด้วยโมเดลภาษาขนาดใหญ่ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/12] E&V: การแจ้งโมเดลภาษาขนาดใหญ่ให้ทำการวิเคราะห์แบบคงที่โดยการดำเนินการและการตรวจสอบรหัสเทียม เฮาและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/11] การทดสอบ GUI บนมือถือที่ขับเคลื่อนด้วยความตั้งใจด้วยตัวแทนโมเดลภาษาขนาดใหญ่อัตโนมัติ ยุน และคณะ ไอซีเอสที. [กระดาษ] [repo]
[10/2023] RCAgent: การวิเคราะห์สาเหตุของคลาวด์โดยตัวแทนอิสระพร้อมโมเดลภาษาขนาดใหญ่ที่เสริมด้วยเครื่องมือ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[10/2023] การวิเคราะห์โค้ดแบบคงที่ในยุค AI: การสำรวจเชิงลึกเกี่ยวกับแนวคิด ฟังก์ชัน และศักยภาพของการวิเคราะห์โค้ดอัจฉริยะ แฟน และคณะ อาร์เอ็กซ์ [กระดาษ]
[10/2023] ทำให้ LLM เป็นผู้เชี่ยวชาญด้านการทดสอบ: นำการโต้ตอบที่เหมือนมนุษย์มาสู่การทดสอบ GUI บนมือถือผ่านการตัดสินใจที่คำนึงถึงฟังก์ชันการทำงาน หลิวและคณะ ไอซีเอสอี. [กระดาษ]
[2023/09] CodePlan: การเขียนโค้ดระดับพื้นที่เก็บข้อมูลโดยใช้ LLM และการวางแผน บายรี และคณะ เอฟเอสอี. [กระดาษ] [repo]
[2023/09] AutoAgents: กรอบงานสำหรับการสร้างตัวแทนอัตโนมัติ เฉินและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] METAGPT: การเขียนโปรแกรม META สำหรับกรอบความร่วมมือหลายตัวแทน ฮอง และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/07] ตัวแทนการสื่อสารเพื่อการพัฒนาซอฟต์แวร์. เคียนและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/03] การสะท้อนกลับ: ตัวแทนภาษาพร้อมการเรียนรู้การเสริมกำลังทางวาจา ชินน์ และคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
หน่วยความจำที่ใช้ร่วมกัน: หน่วยความจำระยะสั้นชนิดพิเศษ
[2024/06] AgileCoder: ตัวแทนการทำงานร่วมกันแบบไดนามิกสำหรับการพัฒนาซอฟต์แวร์ตามระเบียบวิธี Agile เหงียนและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/05] MARE: กรอบความร่วมมือหลายตัวแทนสำหรับวิศวกรรมความต้องการ จิน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] เมื่อการสร้างโค้ดบน LLM ตรงตามกระบวนการพัฒนาซอฟต์แวร์ ลิน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] AGENTFL: ปรับขนาดการแปลข้อผิดพลาดตาม LLM เป็นบริบทระดับโครงการ ฉินและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/08] METAGPT: การเขียนโปรแกรม META สำหรับกรอบความร่วมมือหลายตัวแทน ฮอง และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/04] การสร้างโค้ดการทำงานร่วมกันด้วยตนเองผ่าน ChatGPT ดง และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
การป้อนข้อมูลด้วยภาพ
[10/2024] SWE-bench Multimodal: ระบบ AI มีลักษณะทั่วไปกับโดเมนซอฟต์แวร์ภาพหรือไม่ ยางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/07] การทดสอบ GUI บนมือถืออัตโนมัติที่ขับเคลื่อนด้วยวิสัยทัศน์ผ่านโมเดลภาษาขนาดใหญ่หลายรูปแบบ หลิวและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] การทดลองกับการพัฒนาซอฟต์แวร์หลายตัวแทน: สู่แพลตฟอร์มแบบครบวงจร Sami และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/01] XUAT-Copilot: ระบบการทำงานร่วมกันหลายตัวแทนสำหรับการทดสอบการยอมรับของผู้ใช้อัตโนมัติด้วยโมเดลภาษาขนาดใหญ่ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[10/2023] AXNav: เล่นการทดสอบการเข้าถึงซ้ำจากภาษาธรรมชาติ แท๊บ และคณะ ชิ [กระดาษ]
[10/2023] การทดสอบขีดจำกัด: การสร้างการป้อนข้อความที่ผิดปกติสำหรับการตรวจจับข้อขัดข้องของแอปบนมือถือด้วยโมเดลภาษาขนาดใหญ่ หลิวและคณะ ไอซีเอสอี. [กระดาษ] [repo]
[2023/08] METAGPT: การเขียนโปรแกรม META สำหรับกรอบความร่วมมือหลายตัวแทน ฮอง และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
เครื่องมือค้นหา
[2024/05] การสร้างโค้ดระดับคลาสจากภาษาธรรมชาติโดยใช้การใช้เหตุผลแบบวนซ้ำและเพิ่มประสิทธิภาพด้วยเครื่องมือบนพื้นที่เก็บข้อมูล เดชปันเด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/04] ตัวแทน LLM สามารถใช้ประโยชน์จากช่องโหว่ในหนึ่งวันได้โดยอัตโนมัติ ฝาง และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] AutoDev: การพัฒนาที่ขับเคลื่อนด้วย AI อัตโนมัติ ทูฟาโน และคณะ arXiv [กระดาษ]
[2024/03] RepairAgent: ตัวแทนอัตโนมัติที่ใช้ LLM สำหรับการซ่อมแซมโปรแกรม บูเซเนีย และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] CoCoST: การสร้างโค้ดที่ซับซ้อนอัตโนมัติพร้อมการค้นหาออนไลน์และการทดสอบความถูกต้อง เขาและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] RAT: การเรียกค้นความคิดเสริมทำให้เกิดการใช้เหตุผลตามบริบทในการสร้างโลกทัศน์อันยาวไกล วังและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] CodePori: แบบจำลองขนาดใหญ่สำหรับการพัฒนาซอฟต์แวร์อัตโนมัติโดยใช้ Multi-Agent ราชีด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/01] LLM4Vuln: กรอบการประเมินแบบครบวงจรสำหรับการแยกส่วนและเพิ่มประสิทธิภาพการให้เหตุผลเกี่ยวกับช่องโหว่ของ LLM ซัน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/01] CodeAgent: การปรับปรุงการสร้างโค้ดด้วยระบบเอเจนต์ที่รวมเครื่องมือสำหรับความท้าทายในการเขียนโค้ดระดับ Repo ในโลกแห่งความเป็นจริง จางและคณะ เอซีแอล. [กระดาษ]
[2023/12] E&V: การแจ้งโมเดลภาษาขนาดใหญ่ให้ทำการวิเคราะห์แบบคงที่โดยการดำเนินการและการตรวจสอบรหัสเทียม เฮาและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/12] การเรียนรู้ร่วมเชิงประสบการณ์ของตัวแทนการพัฒนาซอฟต์แวร์ เคียนและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/11] การทดสอบ GUI บนมือถือที่ขับเคลื่อนด้วยความตั้งใจด้วยตัวแทนโมเดลภาษาขนาดใหญ่อัตโนมัติ ยุน และคณะ ไอซีเอสที. [กระดาษ] [repo]
[2023/10] สัตว์จำพวกลิง: การประสานภาษาธรรมชาติและรหัสสำหรับตัวแทนภาษา ซูและคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[10/2023] RCAgent: การวิเคราะห์สาเหตุของคลาวด์โดยตัวแทนอิสระพร้อมโมเดลภาษาขนาดใหญ่ที่เสริมด้วยเครื่องมือ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[10/2023] การวิเคราะห์โค้ดแบบคงที่ในยุค AI: การสำรวจเชิงลึกเกี่ยวกับแนวคิด ฟังก์ชัน และศักยภาพของการวิเคราะห์โค้ดอัจฉริยะ แฟน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/08] METAGPT: การเขียนโปรแกรม META สำหรับกรอบความร่วมมือหลายตัวแทน ฮอง และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/08] PENTESTGPT: เครื่องมือทดสอบการเจาะทะลุอัตโนมัติที่สนับสนุน LLM เติ้งและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] AgentVerse: อำนวยความสะดวกในการทำงานร่วมกันหลายตัวแทนและการสำรวจพฤติกรรมฉุกเฉิน เฉินและคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/08] Gentopia: แพลตฟอร์มการทำงานร่วมกันสำหรับ Tool-Augmented LLM ซูและคณะ เอ็มแอลพี. [กระดาษ] [repo]
[2023/08] AutoGen: การเปิดใช้งานแอปพลิเคชัน LLM รุ่นถัดไปผ่านการสนทนาแบบหลายตัวแทน วู และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/05] ToolCoder: สอนโมเดลการสร้างโค้ดให้ใช้เครื่องมือค้นหา API จางและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/03] ART: การใช้เหตุผลหลายขั้นตอนอัตโนมัติและการใช้เครื่องมือสำหรับโมเดลภาษาขนาดใหญ่ ปารันจาเป และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
การทำงานของไฟล์
[2024/08] SpecRover: การแยกเจตนาโค้ดผ่าน LLMs Ruan และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] MASAI: สถาปัตยกรรมโมดูลาร์สำหรับตัวแทน AI วิศวกรรมซอฟต์แวร์ อโรรา และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/05] การวิเคราะห์แบบคงที่ที่ได้รับความช่วยเหลือจาก LLM สำหรับการตรวจจับช่องโหว่ด้านความปลอดภัย หลี่และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/05] SWE-AGENT: อินเทอร์เฟซระหว่างตัวแทนและคอมพิวเตอร์ช่วยให้วิศวกรรมซอฟต์แวร์อัตโนมัติทำงานได้ ยางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/04] ตัวแทน LLM สามารถใช้ประโยชน์จากช่องโหว่ในหนึ่งวันได้โดยอัตโนมัติ ฝาง และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] RepairAgent: ตัวแทนอัตโนมัติที่ใช้ LLM สำหรับการซ่อมแซมโปรแกรม บูเซเนีย และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] AutoDev: การพัฒนาที่ขับเคลื่อนด้วย AI อัตโนมัติ ทูฟาโน และคณะ arXiv [กระดาษ]
[2023/04] การดีบักอัตโนมัติที่อธิบายได้ผ่านการดีบักทางวิทยาศาสตร์ที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่ คัง และคณะ อาร์เอ็กซ์ [กระดาษ]
การทำงานของ GUI
[2024/07] การทดสอบ GUI บนมือถืออัตโนมัติที่ขับเคลื่อนด้วยวิสัยทัศน์ผ่านโมเดลภาษาขนาดใหญ่หลายรูปแบบ หลิวและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/01] XUAT-Copilot: ระบบการทำงานร่วมกันหลายตัวแทนสำหรับการทดสอบการยอมรับของผู้ใช้อัตโนมัติด้วยโมเดลภาษาขนาดใหญ่ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[10/2023] ทำให้ LLM เป็นผู้เชี่ยวชาญด้านการทดสอบ: นำการโต้ตอบที่เหมือนมนุษย์มาสู่การทดสอบ GUI บนมือถือผ่านการตัดสินใจที่คำนึงถึงฟังก์ชันการทำงาน หลิวและคณะ ไอซีเอสอี. [กระดาษ]
[10/2023] AXNav: เล่นการทดสอบการเข้าถึงซ้ำจากภาษาธรรมชาติ แท๊บ และคณะ ชิ [กระดาษ]
[10/2023] การทดสอบขีดจำกัด: การสร้างการป้อนข้อความที่ผิดปกติสำหรับการตรวจจับข้อขัดข้องของแอปบนมือถือด้วยโมเดลภาษาขนาดใหญ่ หลิวและคณะ ไอซีเอสอี. [กระดาษ] [repo]
[2023/06] การแจ้งคือสิ่งที่คุณต้องการ: เล่นซ้ำข้อผิดพลาดของ Android อัตโนมัติพร้อมโมเดลภาษาขนาดใหญ่ เฟิง และคณะ ไอซีเอสอี. [กระดาษ] [repo]
การวิเคราะห์โปรแกรมแบบคงที่
[2024/06] การพัฒนาซอฟต์แวร์หลายตัวแทนผ่านการทำงานร่วมกันข้ามทีม ดู่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] AgileCoder: ตัวแทนการทำงานร่วมกันแบบไดนามิกสำหรับการพัฒนาซอฟต์แวร์ตามระเบียบวิธี Agile เหงียนและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] MASAI: สถาปัตยกรรมโมดูลาร์สำหรับตัวแทน AI วิศวกรรมซอฟต์แวร์ อโรรา และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/05] การสร้างโค้ดระดับคลาสจากภาษาธรรมชาติโดยใช้การใช้เหตุผลแบบวนซ้ำและเพิ่มประสิทธิภาพด้วยเครื่องมือบนพื้นที่เก็บข้อมูล เดชปันเด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/05] การวิเคราะห์แบบคงที่ที่ได้รับความช่วยเหลือจาก LLM สำหรับการตรวจจับช่องโหว่ด้านความปลอดภัย หลี่และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/04] AutoCodeRover: การปรับปรุงโปรแกรมอัตโนมัติ จางและคณะ อิสสตา. [กระดาษ] [repo]
[2024/04] การปรับปรุงการสร้างการทดสอบที่ใช้ LLM สำหรับสาขาที่ปกปิดยากผ่านการวิเคราะห์โปรแกรม ยางและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/04] 3DGen: การสร้างพาร์เซอร์รูปแบบไบนารีที่ถูกต้องที่พิสูจน์ได้โดยใช้ AI ฟาคูรี และคณะ arXiv [กระดาษ]
[2024/03] AutoDev: การพัฒนาที่ขับเคลื่อนด้วย AI อัตโนมัติ ทูฟาโน และคณะ arXiv [กระดาษ]
[2024/03] RepairAgent: ตัวแทนอัตโนมัติที่ใช้ LLM สำหรับการซ่อมแซมโปรแกรม บูเซเนีย และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] COVERUP: การสร้างการทดสอบที่ใช้ LLM ตามความครอบคลุม พิซโซโน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] ACFIX: แนวทาง LLM ด้วยแนวทางปฏิบัติ RBAC ทั่วไปที่ขุดขึ้นมาสำหรับการซ่อมแซมช่องโหว่ในการควบคุมการเข้าถึงตามบริบทในสัญญาอัจฉริยะ จางและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] AGENTFL: ปรับขนาดการแปลข้อผิดพลาดตาม LLM เป็นบริบทระดับโครงการ ฉินและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/02] เมื่อการวิเคราะห์โฟลว์ข้อมูลพบกับโมเดลภาษาขนาดใหญ่ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/02] LDB: ดีบักเกอร์โมเดลภาษาขนาดใหญ่ผ่านการตรวจสอบการดำเนินการรันไทม์ทีละขั้นตอน จงและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/01] การสอน Code LLM เพื่อใช้เครื่องมือเติมข้อความอัตโนมัติในการสร้างโค้ดระดับพื้นที่เก็บข้อมูล วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/01] CodeAgent: การปรับปรุงการสร้างโค้ดด้วยระบบเอเจนต์ที่รวมเครื่องมือสำหรับความท้าทายในการเขียนโค้ดระดับ Repo ในโลกแห่งความเป็นจริง จางและคณะ เอซีแอล. [กระดาษ]
[2024/01] LLM4PLC: การใช้แบบจำลองภาษาขนาดใหญ่สำหรับการเขียนโปรแกรม PLC ที่ตรวจสอบได้ในระบบควบคุมอุตสาหกรรม ฟากิห์ และคณะ ไอซีเอสอี. [กระดาษ] [repo]
[2023/12] E&V: การแจ้งโมเดลภาษาขนาดใหญ่ให้ทำการวิเคราะห์แบบคงที่โดยการดำเนินการและการตรวจสอบรหัสเทียม เฮาและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/09] CodePlan: การเขียนโค้ดระดับพื้นที่เก็บข้อมูลโดยใช้ LLM และการวางแผน บายรี และคณะ เอฟเอสอี. [กระดาษ] [repo]
[2023/08] CodeCoT: การแก้ปัญหาข้อผิดพลาดทางไวยากรณ์ของโค้ดในการให้เหตุผล CoT สำหรับการสร้างโค้ด หวงและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/07] การแยกจุดบกพร่องของคอมไพเลอร์โดยการสร้างโปรแกรมพยานที่มีประสิทธิภาพด้วยโมเดลภาษาขนาดใหญ่ ตู่และคณะ IEEE ทรานส์ ซอฟต์แวร์ภาษาอังกฤษ... [กระดาษ] [repo]
[2023/06] การแจ้งคือสิ่งที่คุณต้องการ: เล่นซ้ำข้อผิดพลาดของ Android อัตโนมัติพร้อมโมเดลภาษาขนาดใหญ่ เฟิง และคณะ ไอซีเอสอี. [กระดาษ] [repo]
การวิเคราะห์แบบไดนามิก
[2024/04] การปรับปรุงการสร้างการทดสอบที่ใช้ LLM สำหรับสาขาที่ปกปิดยากผ่านการวิเคราะห์โปรแกรม ยางและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] COVERUP: การสร้างการทดสอบที่ใช้ LLM ตามความครอบคลุม พิซโซโน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] AGENTFL: ปรับขนาดการแปลข้อผิดพลาดตาม LLM เป็นบริบทระดับโครงการ ฉินและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/02] LDB: ดีบักเกอร์โมเดลภาษาขนาดใหญ่ผ่านการตรวจสอบการดำเนินการรันไทม์ทีละขั้นตอน จงและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/07] การแยกจุดบกพร่องของคอมไพเลอร์โดยการสร้างโปรแกรมพยานที่มีประสิทธิภาพด้วยโมเดลภาษาขนาดใหญ่ ตู่และคณะ IEEE ทรานส์ ซอฟต์แวร์ภาษาอังกฤษ... [กระดาษ] [repo]
[2023/04] การดีบักอัตโนมัติที่อธิบายได้ผ่านการดีบักทางวิทยาศาสตร์ที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่ คัง และคณะ อาร์เอ็กซ์ [กระดาษ]
เครื่องมือทดสอบ
[2024/09] การซ่อมแซมระบบประสาทของการทดสอบความไม่แน่นอน เฉินและคณะ อิสสตา. [กระดาษ]
[2024/08] SpecRover: การแยกเจตนาโค้ดผ่าน LLMs Ruan และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] AgileCoder: ตัวแทนการทำงานร่วมกันแบบไดนามิกสำหรับการพัฒนาซอฟต์แวร์ตามระเบียบวิธี Agile เหงียนและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] MASAI: สถาปัตยกรรมโมดูลาร์สำหรับตัวแทน AI วิศวกรรมซอฟต์แวร์ อโรรา และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/05] AutoCoder: การปรับปรุงโมเดลภาษาขนาดใหญ่ของโค้ดด้วย AIEV-INSTRUCT เล่ยและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/05] MapCoder: การสร้างโค้ดหลายตัวแทนเพื่อการแก้ปัญหาเชิงแข่งขัน อิสลามและคณะ เอซีแอล. [กระดาษ] [repo]
[2024/04] ตัวแทนที่จัดระเบียบด้วยตนเอง: กรอบงาน LLM Multi-Agent สู่การสร้างและการเพิ่มประสิทธิภาพโค้ดขนาดใหญ่พิเศษ อิชิบาชิ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/04] แนวทางการแก้ไขจุดบกพร่องแบบรวมผ่านการทำงานร่วมกันหลายตัวแทนที่ใช้ LLM ลีและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/04] ตัวแทน LLM สามารถใช้ประโยชน์จากช่องโหว่ในหนึ่งวันได้โดยอัตโนมัติ ฝาง และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/04] การปรับปรุงการสร้างการทดสอบที่ใช้ LLM สำหรับสาขาที่ปกปิดยากผ่านการวิเคราะห์โปรแกรม ยางและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/04] 3DGen: การสร้างพาร์เซอร์รูปแบบไบนารีที่ถูกต้องที่พิสูจน์ได้โดยใช้ AI ฟาคูรี และคณะ arXiv [กระดาษ]
[2024/04] AutoCodeRover: การปรับปรุงโปรแกรมอัตโนมัติ จางและคณะ อิสสตา. [กระดาษ] [repo]
[2024/03] AutoDev: การพัฒนาที่ขับเคลื่อนด้วย AI อัตโนมัติ ทูฟาโน และคณะ arXiv [กระดาษ]
[2024/03] เมื่อการสร้างโค้ดบน LLM ตรงตามกระบวนการพัฒนาซอฟต์แวร์ ลิน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] RepairAgent: ตัวแทนอัตโนมัติที่ใช้ LLM สำหรับการซ่อมแซมโปรแกรม บูเซเนีย และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] CoCoST: การสร้างโค้ดที่ซับซ้อนอัตโนมัติพร้อมการค้นหาออนไลน์และการทดสอบความถูกต้อง เขาและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/02] การดำเนินการโค้ดที่ปฏิบัติการได้ช่วยดึงตัวแทน LLM ที่ดีขึ้น วังและคณะ ไอซีเอ็มแอล. [กระดาษ] [repo]
[2024/02] การพัฒนาที่ขับเคลื่อนด้วยการทดสอบสำหรับการสร้างโค้ด แมทธิวส์และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/01] การสร้างโค้ดด้วย AlphaCodium: จากวิศวกรรมแบบพร้อมท์ไปจนถึงวิศวกรรมการไหล ริดนิค และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/01] การทดลองฝึกการเขียนโปรแกรมใหม่กับ LLM จางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/01] CodeAgent: การปรับปรุงการสร้างโค้ดด้วยระบบเอเจนต์ที่รวมเครื่องมือสำหรับความท้าทายในการเขียนโค้ดระดับ Repo ในโลกแห่งความเป็นจริง จางและคณะ เอซีแอล. [กระดาษ]
[2023/12] AgentCoder: การสร้างโค้ดแบบหลายตัวแทนพร้อมการทดสอบซ้ำและการเพิ่มประสิทธิภาพ หวงและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/12] LLM4TDD: วิธีปฏิบัติที่ดีที่สุดสำหรับการพัฒนาที่ขับเคลื่อนด้วยการทดสอบโดยใช้แบบจำลองภาษาขนาดใหญ่ ปิยะ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/11] ผู้แทรกแซง: กระตุ้นความสามารถในการเขียนโค้ดของโมเดลภาษาขนาดใหญ่ด้วยห่วงโซ่การซ่อมแซมแบบโต้ตอบ วังและคณะ เอซีแอล. [กระดาษ] [repo]
[10/2023] ClarifyGPT: เสริมพลังการสร้างโค้ดบน LLM ด้วย Intention Clarification หมู่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/10] สัตว์จำพวกลิง: การประสานภาษาธรรมชาติและรหัสสำหรับตัวแทนภาษา ซูและคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/10] Fuzzing Compiler White-box เสริมพลังโดยโมเดลภาษาขนาดใหญ่ ยางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/09] ความเข้าใจการเขียนโปรแกรมที่ขับเคลื่อนด้วยกรณีทดสอบในโมเดลภาษาขนาดใหญ่เพื่อการสร้างโค้ดที่ดีขึ้น เทียน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/09] MINT: การประเมิน LLMS ในการโต้ตอบแบบหลายเทิร์นด้วยเครื่องมือและการตอบรับทางภาษา วังและคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/08] METAGPT: การเขียนโปรแกรม META สำหรับกรอบความร่วมมือหลายตัวแทน ฮอง และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/08] การสร้างการทดสอบที่มีประสิทธิภาพโดยใช้แบบจำลองภาษาขนาดใหญ่ที่ได้รับการฝึกอบรมล่วงหน้าและการทดสอบการกลายพันธุ์ ดาเคล และคณะ ข้อมูล ซอฟท์แวร์ เทคโนโลยี - [กระดาษ] [repo]
[2023/08] AgentVerse: อำนวยความสะดวกในการทำงานร่วมกันหลายตัวแทนและการสำรวจพฤติกรรมฉุกเฉิน เฉินและคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/08] AutoGen: การเปิดใช้งานแอปพลิเคชัน LLM รุ่นถัดไปผ่านการสนทนาแบบหลายตัวแทน วู และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] Flows: การสร้างบล็อคของการใช้เหตุผลและการทำงานร่วมกันของ AI โจซิโฟสกี้ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/06] SELFEVOLVE: กรอบวิวัฒนาการโค้ดผ่านโมเดลภาษาขนาดใหญ่ เจียงและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/06] InterCode: การกำหนดมาตรฐานและการเปรียบเทียบการเข้ารหัสเชิงโต้ตอบพร้อมคำติชมการดำเนินการ ยางและคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
[2023/06] การซ่อมแซมด้วยตนเองเป็นกระสุนเงินสำหรับการสร้างรหัสหรือไม่ โอเลาส์สัน และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/05] ไม่มีการทดสอบด้วยตนเองอีกต่อไปแล้วใช่ไหม การประเมินและปรับปรุง ChatGPT สำหรับการสร้างการทดสอบหน่วย หยวน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/04] การเขียนโปรแกรมอัตโนมัติเต็มรูปแบบด้วยโมเดลภาษาขนาดใหญ่ ลิเวนต์เซฟ และคณะ เก็กโก. [กระดาษ]
[2023/04] การดีบักอัตโนมัติที่อธิบายได้ผ่านการดีบักทางวิทยาศาสตร์ที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่ คัง และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/03] ART: การใช้เหตุผลหลายขั้นตอนอัตโนมัติและการใช้เครื่องมือสำหรับโมเดลภาษาขนาดใหญ่ ปารันจาเป และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/03] การสะท้อนกลับ: ตัวแทนภาษาพร้อมการเรียนรู้การเสริมกำลังทางวาจา ชินน์ และคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
[2023/02] การประเมินเชิงประจักษ์ของการใช้แบบจำลองภาษาขนาดใหญ่สำหรับการสร้างการทดสอบหน่วยอัตโนมัติ เชฟเฟอร์ และคณะ IEEE ทรานส์ ซอฟต์แวร์ภาษาอังกฤษ... [กระดาษ] [repo]
[2023/01] การซ่อมแซมโปรแกรมสนทนาอัตโนมัติ เซี่ยและคณะ อาร์เอ็กซ์ [กระดาษ]
เครื่องมือการแปลตำแหน่งข้อผิดพลาด
[2024/04] AutoCodeRover: การปรับปรุงโปรแกรมอัตโนมัติ จางและคณะ อิสสตา. [กระดาษ] [repo]
[2024/03] RepairAgent: ตัวแทนอัตโนมัติที่ใช้ LLM สำหรับการซ่อมแซมโปรแกรม บูเซเนีย และคณะ อาร์เอ็กซ์ [กระดาษ]
บทบาทผู้จัดการ
[2024/06] AgileCoder: ตัวแทนการทำงานร่วมกันแบบไดนามิกสำหรับการพัฒนาซอฟต์แวร์ตามระเบียบวิธี Agile เหงียนและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/05] การปรับปรุงประสบการณ์ซ้ำของตัวแทนการพัฒนาซอฟต์แวร์ เคียนและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/05] MapCoder: การสร้างโค้ดหลายตัวแทนเพื่อการแก้ปัญหาเชิงแข่งขัน อิสลามและคณะ เอซีแอล. [กระดาษ] [repo]
[2024/04] ตัวแทนที่จัดระเบียบด้วยตนเอง: กรอบงาน LLM Multi-Agent สู่การสร้างและการเพิ่มประสิทธิภาพโค้ดขนาดใหญ่พิเศษ อิชิบาชิ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/04] 3DGen: การสร้างพาร์เซอร์รูปแบบไบนารีที่ถูกต้องที่พิสูจน์ได้โดยใช้ AI ฟาคูรี และคณะ arXiv [กระดาษ]
[2024/03] MAGIS: กรอบงาน Multi-Agent ที่ใช้ LLM สำหรับการแก้ปัญหา GitHub เต่าและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] เมื่อการสร้างโค้ดบน LLM ตรงตามกระบวนการพัฒนาซอฟต์แวร์ ลิน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] CodeAgent: ตัวแทนการทำงานร่วมกันสำหรับวิศวกรรมซอฟต์แวร์ ถังและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] CodePori: แบบจำลองขนาดใหญ่สำหรับการพัฒนาซอฟต์แวร์อัตโนมัติโดยใช้ Multi-Agent ราชีด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/12] การเรียนรู้ร่วมเชิงประสบการณ์ของตัวแทนการพัฒนาซอฟต์แวร์ เคียนและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/11] Autonomous Agent ในการพัฒนาซอฟต์แวร์: A Vision Paper Rasheed และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/11] การทดสอบ GUI บนมือถือที่ขับเคลื่อนด้วยความตั้งใจด้วยตัวแทนโมเดลภาษาขนาดใหญ่อัตโนมัติ ยุน และคณะ ไอซีเอสที. [กระดาษ] [repo]
[10/2023] AXNav: เล่นการทดสอบการเข้าถึงซ้ำจากภาษาธรรมชาติ แท๊บ และคณะ ชิ [กระดาษ]
[10/2023] RCAgent: การวิเคราะห์สาเหตุของคลาวด์โดยตัวแทนอิสระพร้อมโมเดลภาษาขนาดใหญ่ที่เสริมด้วยเครื่องมือ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/09] AutoAgents: กรอบงานสำหรับการสร้างตัวแทนอัตโนมัติ เฉินและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] METAGPT: การเขียนโปรแกรม META สำหรับกรอบความร่วมมือหลายตัวแทน ฮอง และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/04] LLM แบบ Low-code: การเขียนโปรแกรมด้วยภาพผ่าน LLM Cai และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/03] CAMEL: ตัวแทนการสื่อสารสำหรับการสำรวจ "จิตใจ" ของสังคมต้นแบบภาษาขนาดใหญ่ หลี่และคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
บทบาทการวิเคราะห์ความต้องการ
[2024/06] การทดลองกับการพัฒนาซอฟต์แวร์หลายตัวแทน: สู่แพลตฟอร์มแบบครบวงจร Sami และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/06] AgileCoder: ตัวแทนการทำงานร่วมกันแบบไดนามิกสำหรับการพัฒนาซอฟต์แวร์ตามระเบียบวิธี Agile เหงียนและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/05] MARE: กรอบความร่วมมือหลายตัวแทนสำหรับวิศวกรรมความต้องการ จิน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/04] Elicitron: กรอบงานการจำลองที่ใช้ตัวแทน LLM สำหรับการกระตุ้นความต้องการการออกแบบ อาเทอิ และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] เมื่อการสร้างโค้ดบน LLM ตรงตามกระบวนการพัฒนาซอฟต์แวร์ ลิน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/01] การทดลองฝึกการเขียนโปรแกรมใหม่กับ LLM จางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/11] Autonomous Agent ในการพัฒนาซอฟต์แวร์: A Vision Paper Rasheed และคณะ อาร์เอ็กซ์ [กระดาษ]
[10/2023] การวิเคราะห์โค้ดแบบคงที่ในยุค AI: การสำรวจเชิงลึกเกี่ยวกับแนวคิด ฟังก์ชัน และศักยภาพของการวิเคราะห์โค้ดอัจฉริยะ แฟน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/08] METAGPT: การเขียนโปรแกรม META สำหรับกรอบความร่วมมือหลายตัวแทน ฮอง และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/06] การทำงานร่วมกันหลายตัวแทน: การควบคุมพลังของตัวแทน LLM ที่ชาญฉลาด ทาเลบิรัด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/04] การสร้างโค้ดการทำงานร่วมกันด้วยตนเองผ่าน ChatGPT ดง และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/03] CAMEL: ตัวแทนการสื่อสารสำหรับการสำรวจ "จิตใจ" ของสังคมต้นแบบภาษาขนาดใหญ่ หลี่และคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
บทบาทนักออกแบบ
[2024/06] การทดลองกับการพัฒนาซอฟต์แวร์หลายตัวแทน: สู่แพลตฟอร์มแบบครบวงจร Sami และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] เมื่อการสร้างโค้ดบน LLM ตรงตามกระบวนการพัฒนาซอฟต์แวร์ ลิน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/01] การทดลองฝึกการเขียนโปรแกรมใหม่กับ LLM จางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/11] Autonomous Agent ในการพัฒนาซอฟต์แวร์: A Vision Paper Rasheed และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/08] METAGPT: การเขียนโปรแกรม META สำหรับกรอบความร่วมมือหลายตัวแทน ฮอง และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/08] AgentVerse: อำนวยความสะดวกในการทำงานร่วมกันหลายตัวแทนและการสำรวจพฤติกรรมฉุกเฉิน เฉินและคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/07] ตัวแทนการสื่อสารเพื่อการพัฒนาซอฟต์แวร์. เคียนและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/06] การทำงานร่วมกันหลายตัวแทน: การควบคุมพลังของตัวแทน LLM ที่ชาญฉลาด ทาเลบิรัด และคณะ อาร์เอ็กซ์ [กระดาษ]
บทบาทของนักพัฒนา
[2024/06] การทดลองกับการพัฒนาซอฟต์แวร์หลายตัวแทน: สู่แพลตฟอร์มแบบครบวงจร Sami และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/06] AgileCoder: ตัวแทนการทำงานร่วมกันแบบไดนามิกสำหรับการพัฒนาซอฟต์แวร์ตามระเบียบวิธี Agile เหงียนและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/05] AutoCoder: การปรับปรุงโมเดลภาษาขนาดใหญ่ของโค้ดด้วย AIEV-INSTRUCT เล่ยและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/05] MapCoder: การสร้างโค้ดหลายตัวแทนเพื่อการแก้ปัญหาเชิงแข่งขัน อิสลามและคณะ เอซีแอล. [กระดาษ] [repo]
[2024/04] ตัวแทนที่จัดระเบียบด้วยตนเอง: กรอบงาน LLM Multi-Agent สู่การสร้างและการเพิ่มประสิทธิภาพโค้ดขนาดใหญ่พิเศษ อิชิบาชิ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/04] 3DGen: การสร้างพาร์เซอร์รูปแบบไบนารีที่ถูกต้องที่พิสูจน์ได้โดยใช้ AI ฟาคูรี และคณะ arXiv [กระดาษ]
[2024/03] CodeS: ภาษาธรรมชาติสู่พื้นที่เก็บข้อมูลโค้ดผ่าน Multi-Layer Sketch ซาน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] MAGIS: กรอบงาน Multi-Agent ที่ใช้ LLM สำหรับการแก้ปัญหา GitHub เต่าและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] เมื่อการสร้างโค้ดบน LLM ตรงตามกระบวนการพัฒนาซอฟต์แวร์ ลิน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] การพัฒนาที่ขับเคลื่อนด้วยการทดสอบสำหรับการสร้างโค้ด แมทธิวส์และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] CodePori: แบบจำลองขนาดใหญ่สำหรับการพัฒนาซอฟต์แวร์อัตโนมัติโดยใช้ Multi-Agent ราชีด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/01] การทดลองฝึกการเขียนโปรแกรมใหม่กับ LLM จางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/12] AgentCoder: การสร้างโค้ดแบบหลายตัวแทนพร้อมการทดสอบซ้ำและการเพิ่มประสิทธิภาพ หวงและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/11] Autonomous Agent ในการพัฒนาซอฟต์แวร์: A Vision Paper Rasheed และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/11] ผู้แทรกแซง: กระตุ้นความสามารถในการเขียนโค้ดของโมเดลภาษาขนาดใหญ่ด้วยห่วงโซ่การซ่อมแซมแบบโต้ตอบ วังและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/08] AutoGen: การเปิดใช้งานแอปพลิเคชัน LLM รุ่นถัดไปผ่านการสนทนาแบบหลายตัวแทน วู และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] METAGPT: การเขียนโปรแกรม META สำหรับกรอบความร่วมมือหลายตัวแทน ฮอง และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/08] AgentVerse: อำนวยความสะดวกในการทำงานร่วมกันหลายตัวแทนและการสำรวจพฤติกรรมฉุกเฉิน เฉินและคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/07] ตัวแทนการสื่อสารเพื่อการพัฒนาซอฟต์แวร์. เคียนและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/06] การซ่อมแซมด้วยตนเองเป็นกระสุนเงินสำหรับการสร้างรหัสหรือไม่ โอเลาส์สัน และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/06] การทำงานร่วมกันหลายตัวแทน: การควบคุมพลังของตัวแทน LLM ที่ชาญฉลาด ทาเลบิรัด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/05] แก้ไขด้วยตนเอง: Fault-Aware Code Editor สำหรับการสร้างโค้ด จางและคณะ เอซีแอล. [กระดาษ]
[2023/04] การสร้างโค้ดการทำงานร่วมกันด้วยตนเองผ่าน ChatGPT ดง และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/03] CAMEL: ตัวแทนการสื่อสารสำหรับการสำรวจ "จิตใจ" ของสังคมต้นแบบภาษาขนาดใหญ่ หลี่และคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
บทบาทการประกันคุณภาพซอฟต์แวร์
[2024/08] SpecRover: การแยกเจตนาโค้ดผ่าน LLMs Ruan และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/07] การทดสอบ GUI บนมือถืออัตโนมัติที่ขับเคลื่อนด้วยวิสัยทัศน์ผ่านโมเดลภาษาขนาดใหญ่หลายรูปแบบ หลิวและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] การทดลองกับการพัฒนาซอฟต์แวร์หลายตัวแทน: สู่แพลตฟอร์มแบบครบวงจร Sami และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/06] การพัฒนาซอฟต์แวร์หลายตัวแทนผ่านการทำงานร่วมกันข้ามทีม ดู่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] AgileCoder: ตัวแทนการทำงานร่วมกันแบบไดนามิกสำหรับการพัฒนาซอฟต์แวร์ตามระเบียบวิธี Agile เหงียนและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] MASAI: สถาปัตยกรรมโมดูลาร์สำหรับตัวแทน AI วิศวกรรมซอฟต์แวร์ อโรรา และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/05] AutoCoder: การปรับปรุงโมเดลภาษาขนาดใหญ่ของโค้ดด้วย AIEV-INSTRUCT เล่ยและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/05] MapCoder: การสร้างโค้ดหลายตัวแทนเพื่อการแก้ปัญหาเชิงแข่งขัน อิสลามและคณะ เอซีแอล. [กระดาษ] [repo]
[2024/04] การตรวจสอบโค้ดที่ขับเคลื่อนด้วย AI พร้อม LLM: ผลลัพธ์เบื้องต้น ราชีด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/04] 3DGen: การสร้างพาร์เซอร์รูปแบบไบนารีที่ถูกต้องที่พิสูจน์ได้โดยใช้ AI ฟาคูรี และคณะ arXiv [กระดาษ]
[2024/04] แนวทางการแก้ไขจุดบกพร่องแบบรวมผ่านการทำงานร่วมกันหลายตัวแทนที่ใช้ LLM ลีและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/04] เราจะไปได้ไกลแค่ไหนกับการซ่อมแซมโปรแกรมระดับฟังก์ชั่นที่ใช้งานได้จริง?. เซียง และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] MAGIS: กรอบงาน Multi-Agent ที่ใช้ LLM สำหรับการแก้ปัญหา GitHub เต่าและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] AGENTFL: ปรับขนาดการแปลข้อผิดพลาดตาม LLM เป็นบริบทระดับโครงการ ฉินและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] การผสมผสานการปรับแต่งอย่างละเอียดและตัวแทนที่ใช้ LLM สำหรับการตรวจสอบสัญญาอัจฉริยะที่ใช้งานง่ายพร้อมการให้เหตุผล แม่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] เมื่อการสร้างโค้ดบน LLM ตรงตามกระบวนการพัฒนาซอฟต์แวร์ ลิน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] ACFIX: แนวทาง LLM ด้วยแนวทางปฏิบัติ RBAC ทั่วไปที่ขุดขึ้นมาสำหรับการซ่อมแซมช่องโหว่ในการควบคุมการเข้าถึงตามบริบทในสัญญาอัจฉริยะ จางและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/02] CodeAgent: ตัวแทนการทำงานร่วมกันสำหรับวิศวกรรมซอฟต์แวร์ ถังและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] การพัฒนาที่ขับเคลื่อนด้วยการทดสอบสำหรับการสร้างโค้ด แมทธิวส์และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] CodePori: แบบจำลองขนาดใหญ่สำหรับการพัฒนาซอฟต์แวร์อัตโนมัติโดยใช้ Multi-Agent ราชีด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/01] XUAT-Copilot: ระบบการทำงานร่วมกันหลายตัวแทนสำหรับการทดสอบการยอมรับของผู้ใช้อัตโนมัติด้วยโมเดลภาษาขนาดใหญ่ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/12] AgentCoder: การสร้างโค้ดแบบหลายตัวแทนพร้อมการทดสอบซ้ำและการเพิ่มประสิทธิภาพ หวงและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/11] Autonomous Agent ในการพัฒนาซอฟต์แวร์: A Vision Paper Rasheed และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/11] การทดสอบ GUI บนมือถือที่ขับเคลื่อนด้วยความตั้งใจด้วยตัวแทนโมเดลภาษาขนาดใหญ่อัตโนมัติ ยุน และคณะ ไอซีเอสที. [กระดาษ] [repo]
[2023/10] การตรวจจับช่องโหว่สัญญาอัจฉริยะที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่: มุมมองใหม่ หูและคณะ ทีพีเอส-ISA. [กระดาษ] [repo]
[10/2023] การวิเคราะห์โค้ดแบบคงที่ในยุค AI: การสำรวจเชิงลึกเกี่ยวกับแนวคิด ฟังก์ชัน และศักยภาพของการวิเคราะห์โค้ดอัจฉริยะ แฟน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/10] Fuzzing Compiler White-box เสริมพลังโดยโมเดลภาษาขนาดใหญ่ ยางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[10/2023] AXNav: เล่นการทดสอบการเข้าถึงซ้ำจากภาษาธรรมชาติ แท๊บ และคณะ ชิ [กระดาษ]
[2023/08] AutoGen: การเปิดใช้งานแอปพลิเคชัน LLM รุ่นถัดไปผ่านการสนทนาแบบหลายตัวแทน วู และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] METAGPT: การเขียนโปรแกรม META สำหรับกรอบความร่วมมือหลายตัวแทน ฮอง และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/07] ตัวแทนการสื่อสารเพื่อการพัฒนาซอฟต์แวร์. เคียนและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/06] การซ่อมแซมด้วยตนเองเป็นกระสุนเงินสำหรับการสร้างรหัสหรือไม่ โอเลาส์สัน และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/06] การทำงานร่วมกันหลายตัวแทน: การควบคุมพลังของตัวแทน LLM ที่ชาญฉลาด ทาเลบิรัด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/05] แก้ไขด้วยตนเอง: Fault-Aware Code Editor สำหรับการสร้างโค้ด จางและคณะ เอซีแอล. [กระดาษ]
[2023/03] CAMEL: ตัวแทนการสื่อสารสำหรับการสำรวจ "จิตใจ" ของสังคมต้นแบบภาษาขนาดใหญ่ หลี่และคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
บทบาทผู้ช่วย
[2024/08] ความหลากหลายส่งเสริมความฉลาด: ความเชี่ยวชาญในการบูรณาการของตัวแทนวิศวกรรมซอฟต์แวร์ Zhang และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/08] SpecRover: การแยกเจตนาโค้ดผ่าน LLMs Ruan และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] MASAI: สถาปัตยกรรมโมดูลาร์สำหรับตัวแทน AI วิศวกรรมซอฟต์แวร์ อโรรา และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/05] MapCoder: การสร้างโค้ดหลายตัวแทนเพื่อการแก้ปัญหาเชิงแข่งขัน อิสลามและคณะ เอซีแอล. [กระดาษ] [repo]
[2024/03] MAGIS: กรอบงาน Multi-Agent ที่ใช้ LLM สำหรับการแก้ปัญหา GitHub เต่าและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] CodeS: ภาษาธรรมชาติสู่พื้นที่เก็บข้อมูลโค้ดผ่าน Multi-Layer Sketch ซาน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] การผสมผสานการปรับแต่งอย่างละเอียดและตัวแทนที่ใช้ LLM สำหรับการตรวจสอบสัญญาอัจฉริยะที่ใช้งานง่ายพร้อมการให้เหตุผล แม่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[10/2023] การวิเคราะห์โค้ดแบบคงที่ในยุค AI: การสำรวจเชิงลึกเกี่ยวกับแนวคิด ฟังก์ชัน และศักยภาพของการวิเคราะห์โค้ดอัจฉริยะ แฟน และคณะ อาร์เอ็กซ์ [กระดาษ]
โครงสร้างแบบชั้น
[2024/08] ความหลากหลายส่งเสริมความฉลาด: ความเชี่ยวชาญในการบูรณาการของตัวแทนวิศวกรรมซอฟต์แวร์ Zhang และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/08] SpecRover: การแยกเจตนาโค้ดผ่าน LLMs Ruan และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] การทดลองกับการพัฒนาซอฟต์แวร์หลายตัวแทน: สู่แพลตฟอร์มแบบครบวงจร Sami และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/06] การปรับขนาดการทำงานร่วมกันของตัวแทนหลายภาษาตามแบบจำลองขนาดใหญ่ Qian และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] การพัฒนาซอฟต์แวร์หลายตัวแทนผ่านการทำงานร่วมกันข้ามทีม ดู่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] AgileCoder: ตัวแทนการทำงานร่วมกันแบบไดนามิกสำหรับการพัฒนาซอฟต์แวร์ตามระเบียบวิธี Agile เหงียนและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/05] MapCoder: การสร้างโค้ดหลายตัวแทนเพื่อการแก้ปัญหาเชิงแข่งขัน อิสลามและคณะ เอซีแอล. [กระดาษ] [repo]
[2024/05] MARE: กรอบความร่วมมือหลายตัวแทนสำหรับวิศวกรรมความต้องการ จิน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/04] AutoCodeRover: การปรับปรุงโปรแกรมอัตโนมัติ จางและคณะ อิสสตา. [กระดาษ] [repo]
[2024/04] เราจะไปได้ไกลแค่ไหนกับการซ่อมแซมโปรแกรมระดับฟังก์ชั่นที่ใช้งานได้จริง?. เซียง และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] CodeS: ภาษาธรรมชาติสู่พื้นที่เก็บข้อมูลโค้ดผ่าน Multi-Layer Sketch ซาน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] เมื่อการสร้างโค้ดบน LLM ตรงตามกระบวนการพัฒนาซอฟต์แวร์ ลิน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] AGENTFL: ปรับขนาดการแปลข้อผิดพลาดตาม LLM เป็นบริบทระดับโครงการ ฉินและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/02] เมื่อการวิเคราะห์โฟลว์ข้อมูลพบกับโมเดลภาษาขนาดใหญ่ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/02] CodeAgent: ตัวแทนการทำงานร่วมกันสำหรับวิศวกรรมซอฟต์แวร์ ถังและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] ตัวแทนเพิ่มเติมคือสิ่งที่คุณต้องการ หลี่และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/01] การทดลองฝึกการเขียนโปรแกรมใหม่กับ LLM จางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/11] Autonomous Agent ในการพัฒนาซอฟต์แวร์: A Vision Paper Rasheed และคณะ อาร์เอ็กซ์ [กระดาษ]
[10/2023] การวิเคราะห์โค้ดแบบคงที่ในยุค AI: การสำรวจเชิงลึกเกี่ยวกับแนวคิด ฟังก์ชัน และศักยภาพของการวิเคราะห์โค้ดอัจฉริยะ แฟน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/10] การตรวจจับช่องโหว่สัญญาอัจฉริยะที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่: มุมมองใหม่ หูและคณะ ทีพีเอส-ISA. [กระดาษ] [repo]
[2023/10] Fuzzing Compiler White-box เสริมพลังโดยโมเดลภาษาขนาดใหญ่ ยางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[10/2023] Dynamic LLM-Agent Network: กรอบการทำงานร่วมกันของ LLM-agent พร้อมการเพิ่มประสิทธิภาพทีมตัวแทน หลิวและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] METAGPT: การเขียนโปรแกรม META สำหรับกรอบความร่วมมือหลายตัวแทน ฮอง และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/08] Flows: การสร้างบล็อคของการใช้เหตุผลและการทำงานร่วมกันของ AI โจซิโฟสกี้ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/07] ตัวแทนการสื่อสารเพื่อการพัฒนาซอฟต์แวร์. เคียนและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/05] แก้ไขด้วยตนเอง: Fault-Aware Code Editor สำหรับการสร้างโค้ด จางและคณะ เอซีแอล. กระดาษ
[2023/04] LLM แบบ Low-code: การเขียนโปรแกรมด้วยภาพผ่าน LLM Cai และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
โครงสร้างแบบวงกลม
[2024/05] AutoCoder: การปรับปรุงโมเดลภาษาขนาดใหญ่ของโค้ดด้วย AIEV-INSTRUCT เล่ยและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/04] แนวทางการแก้ไขจุดบกพร่องแบบรวมผ่านการทำงานร่วมกันหลายตัวแทนที่ใช้ LLM ลีและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] ACFIX: แนวทาง LLM ด้วยแนวทางปฏิบัติ RBAC ทั่วไปที่ขุดขึ้นมาสำหรับการซ่อมแซมช่องโหว่ในการควบคุมการเข้าถึงตามบริบทในสัญญาอัจฉริยะ จางและคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] ฉันทามติหลายบทบาทผ่านการสนทนา LLM สำหรับการตรวจจับช่องโหว่ เหมาและคณะ QRS. [กระดาษ]
[2024/03] การผสมผสานการปรับแต่งอย่างละเอียดและตัวแทนที่ใช้ LLM สำหรับการตรวจสอบสัญญาอัจฉริยะที่ใช้งานง่ายพร้อมการให้เหตุผล แม่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] การพัฒนาที่ขับเคลื่อนด้วยการทดสอบสำหรับการสร้างโค้ด แมทธิวส์และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/02] CodePori: แบบจำลองขนาดใหญ่สำหรับการพัฒนาซอฟต์แวร์อัตโนมัติโดยใช้ Multi-Agent ราชีด และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/12] การเรียนรู้ร่วมเชิงประสบการณ์ของตัวแทนการพัฒนาซอฟต์แวร์ เคียนและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/12] AgentCoder: การสร้างโค้ดแบบหลายตัวแทนพร้อมการทดสอบซ้ำและการเพิ่มประสิทธิภาพ หวงและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/11] ผู้แทรกแซง: กระตุ้นความสามารถในการเขียนโค้ดของโมเดลภาษาขนาดใหญ่ด้วยห่วงโซ่การซ่อมแซมแบบโต้ตอบ วังและคณะ เอซีแอล. [กระดาษ] [repo]
[2023/11] การทดสอบ GUI บนมือถือที่ขับเคลื่อนด้วยความตั้งใจด้วยตัวแทนโมเดลภาษาขนาดใหญ่อัตโนมัติ ยุน และคณะ ไอซีเอสที. [กระดาษ] [repo]
[10/2023] AXNav: เล่นการทดสอบการเข้าถึงซ้ำจากภาษาธรรมชาติ แท๊บ และคณะ ชิ [กระดาษ]
[2023/06] การซ่อมแซมด้วยตนเองเป็นกระสุนเงินสำหรับการสร้างรหัสหรือไม่ โอเลาส์สัน และคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/03] CAMEL: ตัวแทนการสื่อสารสำหรับการสำรวจ "จิตใจ" ของสังคมต้นแบบภาษาขนาดใหญ่ หลี่และคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
[2023/03] การสะท้อนกลับ: ตัวแทนภาษาพร้อมการเรียนรู้การเสริมกำลังทางวาจา ชินน์ และคณะ ประสาทไอพีเอส. [กระดาษ] [repo]
โครงสร้างคล้ายต้นไม้
[2024/06] การปรับขนาดการทำงานร่วมกันของตัวแทนหลายภาษาตามแบบจำลองขนาดใหญ่ Qian และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/06] MASAI: สถาปัตยกรรมโมดูลาร์สำหรับตัวแทน AI วิศวกรรมซอฟต์แวร์ อโรรา และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/04] ตัวแทนที่จัดระเบียบด้วยตนเอง: กรอบงาน LLM Multi-Agent สู่การสร้างและการเพิ่มประสิทธิภาพโค้ดขนาดใหญ่พิเศษ อิชิบาชิ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
โครงสร้างคล้ายดาว
[2024/06] การปรับขนาดการทำงานร่วมกันของตัวแทนหลายภาษาตามแบบจำลองขนาดใหญ่ Qian และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/03] AutoDev: การพัฒนาที่ขับเคลื่อนด้วย AI อัตโนมัติ ทูฟาโน และคณะ arXiv [กระดาษ]
[2024/01] XUAT-Copilot: ระบบการทำงานร่วมกันหลายตัวแทนสำหรับการทดสอบการยอมรับของผู้ใช้อัตโนมัติด้วยโมเดลภาษาขนาดใหญ่ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[10/2023] RCAgent: การวิเคราะห์สาเหตุของคลาวด์โดยตัวแทนอิสระพร้อมโมเดลภาษาขนาดใหญ่ที่เสริมด้วยเครื่องมือ วังและคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/08] AutoGen: การเปิดใช้งานแอปพลิเคชัน LLM รุ่นถัดไปผ่านการสนทนาแบบหลายตัวแทน วู และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
โครงสร้างตาข่าย
[2024/06] การปรับขนาดการทำงานร่วมกันของตัวแทนหลายภาษาตามแบบจำลองขนาดใหญ่ Qian และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/04] 3DGen: การสร้างพาร์เซอร์รูปแบบไบนารีที่ถูกต้องที่พิสูจน์ได้โดยใช้ AI ฟาคูรี และคณะ arXiv [กระดาษ]
[2024/01] การทดลองฝึกการเขียนโปรแกรมใหม่กับ LLM จางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/01] LLM4PLC: การใช้แบบจำลองภาษาขนาดใหญ่สำหรับการเขียนโปรแกรม PLC ที่ตรวจสอบได้ในระบบควบคุมอุตสาหกรรม ฟากิห์ และคณะ ไอซีเอสอี. [กระดาษ] [repo]
[10/2023] การวิเคราะห์โค้ดแบบคงที่ในยุค AI: การสำรวจเชิงลึกเกี่ยวกับแนวคิด ฟังก์ชัน และศักยภาพของการวิเคราะห์โค้ดอัจฉริยะ แฟน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/04] LLM แบบ Low-code: การเขียนโปรแกรมด้วยภาพผ่าน LLM Cai และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/05] MARE: กรอบความร่วมมือหลายตัวแทนสำหรับวิศวกรรมความต้องการ จิน และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/02] การดำเนินการโค้ดที่ปฏิบัติการได้ช่วยดึงตัวแทน LLM ที่ดีขึ้น วังและคณะ ไอซีเอ็มแอล. [กระดาษ] [repo]
[2024/01] การทดลองฝึกการเขียนโปรแกรมใหม่กับ LLM จางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[10/2023] ClarifyGPT: เสริมพลังการสร้างโค้ดบน LLM ด้วย Intention Clarification หมู่และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/06] Prompt Sapper: โครงสร้างพื้นฐานวิศวกรรมซอฟต์แวร์ที่เสริมศักยภาพ LLM สำหรับบริการ AI-Native ซิง และคณะ อาร์เอ็กซ์ [กระดาษ]
[2024/03] CodeS: ภาษาธรรมชาติสู่พื้นที่เก็บข้อมูลโค้ดผ่าน Multi-Layer Sketch ซาน และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/01] LLM4PLC: การใช้แบบจำลองภาษาขนาดใหญ่สำหรับการเขียนโปรแกรม PLC ที่ตรวจสอบได้ในระบบควบคุมอุตสาหกรรม ฟากิห์ และคณะ ไอซีเอสอี. [กระดาษ] [repo]
[2023/09] MINT: การประเมิน LLMS ในการโต้ตอบแบบหลายเทิร์นด้วยเครื่องมือและการตอบรับทางภาษา วังและคณะ ไอซีแอลอาร์ [กระดาษ] [repo]
[2023/08] Flows: การสร้างบล็อคของการใช้เหตุผลและการทำงานร่วมกันของ AI โจซิโฟสกี้ และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] AutoGen: การเปิดใช้งานแอปพลิเคชัน LLM รุ่นถัดไปผ่านการสนทนาแบบหลายตัวแทน วู และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2024/01] การทดลองฝึกการเขียนโปรแกรมใหม่กับ LLM จางและคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
[2023/08] Gentopia: แพลตฟอร์มการทำงานร่วมกันสำหรับ Tool-Augmented LLM ซูและคณะ เอ็มแอลพี. [กระดาษ] [repo]
[2023/06] Prompt Sapper: โครงสร้างพื้นฐานวิศวกรรมซอฟต์แวร์ที่เสริมศักยภาพ LLM สำหรับบริการ AI-Native ซิง และคณะ อาร์เอ็กซ์ [กระดาษ]
[2023/03] ART: การใช้เหตุผลหลายขั้นตอนอัตโนมัติและการใช้เครื่องมือสำหรับโมเดลภาษาขนาดใหญ่ ปารันจาเป และคณะ อาร์เอ็กซ์ [กระดาษ] [repo]
@misc{Agent4SE, title={ตัวแทนตามโมเดลภาษาขนาดใหญ่สำหรับวิศวกรรมซอฟต์แวร์: แบบสำรวจ}, author={Junwei Liu และ Kaixin Wang และ Yixuan Chen และ Xin Peng และ Zhenpeng Chen และ Lingming Zhang และ Yiling Lou}, ปี={2024}, eprint={2409.02977}, archivePrefix={arXiv}, primaryClass={cs.SE} , url={https://arxiv.org/abs/2409.02977}, -
จุนเว่ย หลิว @To-D
ไคซิน หวัง @wkx228
ยี่ซวน เฉิน @FloridaSpidee
อย่าลังเลที่จะถามคำถามหรือให้คำแนะนำแก่เราผ่านทาง:
จุนเว่ย หลิว: [email protected]