تنزيل Agent4SE Paper List - تنزيل كود مصدر Agent4SE Paper List

الوكلاء المعتمدون على نماذج اللغة الكبيرة لهندسة البرمجيات: دراسة استقصائية

لقد شكل التقدم الأخير في نماذج اللغات الكبيرة (LLMs) نموذجًا جديدًا لوكلاء الذكاء الاصطناعي، أي الوكلاء المعتمدين على LLM. بالمقارنة مع LLMs المستقلة، فإن الوكلاء المعتمدين على LLM يوسعون بشكل كبير تنوع وخبرة LLMs من خلال تعزيز LLMs بقدرات إدراك واستخدام الموارد والأدوات الخارجية. حتى الآن، تم تطبيق الوكلاء المعتمدين على LLM وأظهروا فعالية ملحوظة في هندسة البرمجيات (SE). إن التآزر بين الوكلاء المتعددين والتفاعل البشري يجلب المزيد من الأمل في معالجة مشكلات SE المعقدة في العالم الحقيقي. في هذا العمل، نقدم دراسة استقصائية شاملة ومنهجية عن الوكلاء المعتمدين على LLM لـ SE. قمنا بجمع 106 ورقة بحثية وصنفناها من منظورين، أي وجهة نظر SE ووجهة نظر الوكيل. بالإضافة إلى ذلك، نناقش التحديات المفتوحة والتوجهات المستقبلية في هذا المجال الحيوي.

؟ قمنا بتلخيص التقدم الذي أحرزه Agent4SE بشكل منهجي من منظور مهام هندسة البرمجيات وبنية الوكيل .

؟ رابط الورقة: الوكلاء المعتمدون على نماذج اللغة الكبيرة لهندسة البرمجيات: دراسة استقصائية

صورة-20240921134539206

قم بتمييز هذا المستودع بنجمة

هذا المجال البحثي يتطور بسرعة؛ قم بتمييز هذا المستودع بنجمة لمواكبة التحديثات!

أخبار

[2024/09/04] أصدرنا الإصدار الأول من استطلاعنا على arXiv.

جدول المحتويات

أخبار
وجهات نظر SE

توطين الخطأ
إصلاح البرنامج
تصحيح الأخطاء الموحد
اختبار الوحدة
اختبار النظام
كشف الأخطاء الثابتة
مراجعة الكود
هندسة المتطلبات
توليد الكود
تَحَقّق
فحص الكود الثابت
اختبار
تصحيح الأخطاء
يطلق
تطوير البرمجيات من النهاية إلى النهاية
صيانة البرامج الشاملة

وجهات نظر الوكيل

مرحلة التخطيط
مرحلة المتطلبات
مرحلة التطوير
مرحلة التقييم
أدوار الوكيل
آلية التعاون
تخطيط
ذاكرة
تصور
فعل
إطار الوكيل
نظام متعدد الوكلاء
التعاون بين الإنسان والوكيل

الاقتباس
المشرفون
اتصل بنا
تاريخ النجوم

وجهات نظر SE

SE_tasks

هندسة المتطلبات

[2024/05] MARE: إطار التعاون متعدد الوكلاء لهندسة المتطلبات. جين وآخرون. arXiv. [ورق]
[2024/04] Elicitron: إطار محاكاة قائم على وكيل LLM لاستنباط متطلبات التصميم. عطائي وآخرون. arXiv. [ورق]
[2024/01] SpecGen: الإنشاء الآلي لمواصفات البرنامج الرسمية عبر نماذج اللغات الكبيرة. ما وآخرون. arXiv. [ورقة] [الريبو]
[2023/10] تطوير هندسة المتطلبات من خلال الذكاء الاصطناعي التوليدي: تقييم دور ماجستير إدارة الأعمال. أرورا وآخرون. arXiv. [ورق]

توليد الكود

[2024/11] البرمجة المبنية على التخطيط: سير عمل برمجة نموذج لغة كبير Lei et al. أركايف [ورقة]
[2024/11] سلسلة البرمجة: تمكين النماذج اللغوية الكبيرة لتوليد الكود الجغرافي المكاني Hou et al. أركايف [ورقة]
[2024/10] صندوق حماية لغات البرمجة المتعددة لـ LLMs Dou et al. أركايف [ورقة]
[2024/10] SceneGenAgent: إنشاء مشهد صناعي دقيق باستخدام وكيل الترميز Xia et al. أرخايف [ورقة] [الريبو]
[2024/10] MCCoder: تبسيط التحكم في الحركة من خلال إنشاء الأكواد بمساعدة LLM والتحقق الصارم Li et al. أرخايف [ورقة] [الريبو]
[2024/10] Agents4PLC: أتمتة إنشاء أكواد PLC ذات الحلقة المغلقة والتحقق منها في أنظمة التحكم الصناعية باستخدام الوكلاء المعتمدين على LLM Liu et al. أرخايف [ورقة] [الريبو]
[2024/10] تحسين أداء البرنامج الموازي من خلال إنشاء الأكواد المستندة إلى DSL مع LLM Optimizers Wei et al. arXiv. [ورق]
[2024/10] AgentBank: نحو وكلاء LLM معممين من خلال الضبط الدقيق لأكثر من 50000+ مسارات تفاعلية Song et al. arXiv. [ورق]
[2024/10] RLEF: GROUNDING CODE LLMS في تعليقات التنفيذ مع التعلم المعزز Gehring et al. arXiv. [ورق]
[2024/10] أفضل من معلمك: وكلاء LLM الذين يتعلمون من تعليقات الذكاء الاصطناعي المميزة Choudhury et al. arXiv. [ورق]
[2024/10] AMR-Evol: تطور الاستجابة المعيارية التكيفية يؤدي إلى استخلاص أفضل للمعرفة لنماذج اللغات الكبيرة في إنشاء الأكواد البرمجية Luo et al. arXiv. [ورقة] [الريبو]
[2024/10] RGD: مصحح أخطاء الوكيل المستند إلى LLM المتعدد عبر التحسين وتوجيه الإنشاء Jin et al. arXiv. [ورق]
[2024/09] AutoSafeCoder: إطار عمل متعدد الوكلاء لتأمين إنشاء كود LLM من خلال التحليل الثابت واختبار الزغب Nunez et al. أرخايف [ورقة] [الريبو]
[2024/09] إطار عمل البرمجة الزوجية لإنشاء الأكواد البرمجية من خلال الاستكشاف متعدد الخطط والتحسين القائم على التعليقات Zhang et al. أرخايف [ورقة] [الريبو]
[2024/08] غربلة القشر: حول استخدام تعليقات التنفيذ لتصنيف المرشحين للكود الذي تم إنشاؤه Sun et al. أركايف [ورقة]
[2024/08] CODEXGRAPH: سد الفجوة بين نماذج اللغات الكبيرة ومستودعات الأكواد عبر قواعد بيانات الرسم البياني للرموز Liu et al. arXiv. [ورقة] [الريبو]
[2024/07] الأيدي المفتوحة: منصة مفتوحة لمطوري برامج الذكاء الاصطناعي كوكلاء عموميين Wang et al. أرخايف [ورقة] [الريبو]
[2024/05] إنشاء الأكواد البرمجية على مستوى الفصل الدراسي من اللغة الطبيعية باستخدام الاستدلال التكراري المعزز بالأدوات عبر المستودع. ديشباندي وآخرون. arXiv. [ورق]
[2024/05] MapCoder: إنشاء أكواد برمجية متعددة الوكلاء لحل المشكلات بشكل تنافسي. الإسلام وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2024/05] AutoCoder: تحسين نموذج اللغة الكبير للكود باستخدام AIEV-INSTRUCT. لي وآخرون. arXiv. [ورقة] [الريبو]
[2024/04] 3DGen: الجيل بمساعدة الذكاء الاصطناعي لموزعي التنسيق الثنائي الصحيحين . فاخوري وآخرون. أركايف [ورقة]
[2024/04] الوكلاء المنظمون ذاتيًا: إطار عمل متعدد الوكلاء LLM نحو إنشاء الأكواد البرمجية على نطاق واسع للغاية وتحسينها. إيشيباشي وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] التطوير التلقائي: التطوير الآلي القائم على الذكاء الاصطناعي . توفانو وآخرون. أركايف [ورقة]
[2024/03] CoCoST: إنشاء أكواد برمجية معقدة تلقائيًا مع البحث عبر الإنترنت واختبار الصحة. هو وآخرون. arXiv. [ورق]
[2024/03] الفئران: استرجاع الأفكار المعززة تثير التفكير المدرك للسياق في جيل الأفق الطويل . وانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] إجراءات التعليمات البرمجية القابلة للتنفيذ تثير وكلاء LLM أفضل. وانغ وآخرون. آي سي إم إل. [ورقة] [الريبو]
[2024/02] كل ما تحتاجه هو المزيد من الوكلاء. لي وآخرون. arXiv. [ورق]
[2024/02] التطوير القائم على الاختبار لإنشاء الأكواد البرمجية. ماثيوز وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] LDB: مصحح أخطاء نموذج لغة كبير من خلال التحقق من تنفيذ وقت التشغيل خطوة بخطوة. تشونغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/01] CodeAgent: تعزيز إنشاء التعليمات البرمجية باستخدام أنظمة الوكلاء المدمجة بالأدوات لمواجهة تحديات الترميز على مستوى إعادة الشراء في العالم الحقيقي. تشانغ وآخرون. الرباط الصليبي الأمامي. [ورق]
[2024/01] تدريس Code LLMs لاستخدام أدوات الإكمال التلقائي في إنشاء الأكواد البرمجية على مستوى المستودع. وانغ وآخرون. arXiv. [ورق]
[2024/01] إنشاء الكود باستخدام AlphaCodium: من الهندسة السريعة إلى هندسة التدفق. ريدنيك وآخرون. arXiv. [ورقة] [الريبو]
[2023/12] AgentCoder: إنشاء أكواد برمجية قائمة على عوامل متعددة مع اختبار وتحسين متكررين. هوانغ وآخرون. arXiv. [ورق]
[2023/12] LLM4TDD: أفضل الممارسات للتطوير القائم على الاختبار باستخدام نماذج اللغة الكبيرة. بيا وآخرون. arXiv. [ورقة] [الريبو]
[2023/11] المتدخل: تحفيز قدرة البرمجة لنماذج اللغات الكبيرة من خلال سلسلة الإصلاح التفاعلية. وانغ وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/10] شبكة الوكلاء الديناميكية LLM: إطار عمل تعاون بين وكلاء LLM مع تحسين فريق الوكلاء. ليو وآخرون. arXiv. [ورقة] [الريبو]
[2023/10] الليمور: مواءمة اللغة الطبيعية والرمز لوكلاء اللغة. شو وآخرون. ICLR. [ورقة] [الريبو]
[2023/10] ClarifyGPT: تمكين إنشاء الأكواد البرمجية المستندة إلى LLM مع توضيح النية. مو وآخرون. arXiv. [ورقة] [الريبو]
[2023/10] سلسلة الكود: نحو إنشاء أكواد برمجية معيارية من خلال سلسلة من المراجعات الذاتية مع الوحدات الفرعية التمثيلية. لو وآخرون. ICLR. [ورقة] [الريبو]
[2023/10] البحث عن شجرة وكيل اللغة يوحد التفكير والتصرف والتخطيط في نماذج اللغة. تشو وآخرون. آي سي إم إل. [ورقة] [الريبو]
[2023/09] MINT: تقييم LLMS في التفاعل متعدد الأدوار باستخدام الأدوات وردود الفعل اللغوية. وانغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/09] فهم البرمجة المستندة إلى حالة الاختبار في نماذج اللغات الكبيرة لإنشاء أكواد برمجية أفضل. تيان وآخرون. arXiv. [ورق]
[2023/09] CodePlan: الترميز على مستوى المستودع باستخدام LLMs والتخطيط. بايري وآخرون. FSE. [ورقة] [الريبو]
[2023/09] من سوء الاستخدام إلى الإتقان: تعزيز إنشاء التعليمات البرمجية من خلال تسلسل الذكاء الاصطناعي المبني على المعرفة. رن وآخرون. بورصة عمان. [ورق]
[2023/09] بارسل؟: الاستدلال الخوارزمي مع النماذج اللغوية من خلال تركيب التحليلات. زيليكمان وآخرون. نوريبس. [ورقة] [الريبو]
[2023/08] AutoGen: تمكين تطبيقات LLM من الجيل التالي عبر محادثة متعددة الوكلاء. وو وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] Gentopia: منصة تعاونية لمجالس إدارة الحقوق المعززة بالأدوات. شو وآخرون. EMNLP. [ورقة] [الريبو]
[2023/08] التدفقات: العناصر الأساسية للاستدلال والتعاون في مجال الذكاء الاصطناعي. جوزيفوسكي وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] CodeCoT: معالجة أخطاء بناء جملة التعليمات البرمجية في منطق CoT لإنشاء التعليمات البرمجية. هوانغ وآخرون. arXiv. [ورق]
[2023/06] التطور الذاتي: إطار عمل لتطور التعليمات البرمجية عبر نماذج اللغات الكبيرة. جيانغ وآخرون. arXiv. [ورق]
[2023/06] InterCode: توحيد معايير الترميز التفاعلي وملاحظات التنفيذ. يانغ وآخرون. نوريبس. [ورقة] [الريبو]
[2023/06] هل الإصلاح الذاتي بمثابة رصاصة فضية لإنشاء الأكواد؟. أولاسون وآخرون. ICLR. [ورقة] [الريبو]
[2023/05] ToolCoder: تعليم نماذج إنشاء الأكواد البرمجية لاستخدام أدوات بحث API. تشانغ وآخرون. arXiv. [ورق]
[2023/05] التحرير الذاتي: محرر الأكواد البرمجية المدرك للخطأ لإنشاء الأكواد . تشانغ وآخرون. الرباط الصليبي الأمامي. [ورق]
[2023/04] تدريس نماذج اللغات الكبيرة للتصحيح الذاتي. تشن وآخرون. ICLR. [ورق]
[2023/04] برمجة مستقلة بالكامل مع نماذج لغات كبيرة. ليفينتسيف وآخرون. جيكو. [ورق]
[2023/03] CAMEL: وكلاء التواصل لاستكشاف "العقل" لمجتمع نماذج اللغة الكبيرة. لي وآخرون. نوريبس. [ورقة] [الريبو]
[2023/03] التأمل: وكلاء اللغة مع تعلم التعزيز اللفظي. شين وآخرون. نوريبس. [ورقة] [الريبو]
[2023/03] الصقل الذاتي: التحسين التكراري مع الملاحظات الذاتية. مادان وآخرون. نوريبس. [ورقة] [الريبو]

تَحَقّق

[2024/10] إنشاء دليل آلي لرمز الصدأ عبر التطور الذاتي Chen et al. أركايف [ورقة]
[2024/09] AutoVerus: إنشاء دليل آلي لرمز الصدأ Yang et al. أركايف [ورقة]

فحص الكود الثابت

كشف الأخطاء الثابتة

[2024/10] الاستفادة من نماذج اللغة المضبوطة بدقة لتدقيق العقود الذكية بكفاءة ودقة Wei et al. أرخايف [ورقة] [الريبو]
[2024/10] LLM-SmartAudit: الكشف عن ثغرات العقود الذكية المتقدمة Wei et al. arXiv. [ورقة] [الريبو]
[2024/05] التحليل الثابت بمساعدة LLM لاكتشاف الثغرات الأمنية. لي وآخرون. arXiv. [ورق]
[2024/05] PropertyGPT: التحقق الرسمي من العقود الذكية القائم على LLM من خلال إنشاء الممتلكات المعززة للاسترجاع. ليو وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] إجماع متعدد الأدوار من خلال مناقشات ماجستير إدارة الأعمال لاكتشاف الثغرات الأمنية. ماو وآخرون. QRS. [ورق]
[2024/03] الجمع بين الضبط الدقيق والوكلاء المعتمدين على LLM من أجل تدقيق العقود الذكية البديهية مع المبررات. ما وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] عندما يلتقي تحليل تدفق البيانات بنماذج اللغات الكبيرة. وانغ وآخرون. arXiv. [ورق]
[2024/01] LLM4Vuln: إطار تقييم موحد لفصل وتعزيز أسباب الضعف لدى LLM. صن وآخرون. arXiv. [ورقة] [الريبو]
[2023/12] E&V: مطالبة النماذج اللغوية الكبيرة بإجراء تحليل ثابت عن طريق تنفيذ التعليمات البرمجية الزائفة والتحقق منها. هاو وآخرون. arXiv. [ورق]
[2023/10] اكتشاف ثغرات العقد الذكي المستند إلى نموذج اللغة الكبيرة: وجهات نظر جديدة. هو وآخرون. TPS-ISA. [ورقة] [الريبو]
[2023/10] تحليل الكود الثابت في عصر الذكاء الاصطناعي: استكشاف متعمق لمفهوم ووظيفة وإمكانات تحليل الكود الذكي. مروحة وآخرون. arXiv. [ورق]
[2023/08] تعزيز التحليل الثابت للكشف العملي عن الأخطاء: نهج متكامل مع LLM. لي وآخرون. arXiv. [ورقة] [الريبو]
[2023/03] الفن: التفكير التلقائي متعدد الخطوات واستخدام الأدوات لنماذج اللغات الكبيرة. بارانجابي وآخرون. arXiv. [ورقة] [الريبو]

مراجعة الكود

[2024/10] الوكيل بصفته القاضي: تقييم الوكلاء مع الوكلاء Zhuge et al. arXiv. [ورقة] [الريبو]
[2024/09] فرق تسد: أتمتة مراجعات التعليمات البرمجية عبر الترجمة والمراجعة Wang et al. ايه سي ام ترانس. سوفت دبليو. م. المنهجية. [ورق]
[2024/04] مراجعة التعليمات البرمجية المدعومة بالذكاء الاصطناعي مع ماجستير إدارة الأعمال: النتائج المبكرة. رشيد وآخرون. arXiv. [ورق]
[2024/02] CodeAgent: وكلاء متعاونون لهندسة البرمجيات. تانغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/10] تحليل الكود الثابت في عصر الذكاء الاصطناعي: استكشاف متعمق لمفهوم ووظيفة وإمكانات تحليل الكود الذكي. مروحة وآخرون. arXiv. [ورق]
[2023/09] الأساسية: حل مشكلات جودة التعليمات البرمجية باستخدام LLMs. وادوا وآخرون. FSE. [ورقة] [الريبو]

اختبار

اختبار الوحدة

[2024/11] إعادة القبول: التطور المشترك الآلي للإنتاج وكود الاختبار بناءً على التحقق الديناميكي ونماذج اللغات الكبيرة Chi et al. أرخايف [ورقة] [الريبو]
[2024/09] التنفيذ الرمزي لبايثون مع إنشاء الأكواد المدعوم من LLM Wang et al. أركايف [ورقة]
[2024/06] موكاف: الاختبار التفاضلي القائم على التنفيذ مع LLMs. الاعتمادي وآخرون. arXiv. [ورقة] [الريبو]
[2024/04] تعزيز إنشاء الاختبارات المستندة إلى LLM للفروع التي يصعب تغطيتها من خلال تحليل البرنامج. يانغ وآخرون. arXiv. [ورق]
[2024/03] التطوير التلقائي: التطوير الآلي القائم على الذكاء الاصطناعي . توفانو وآخرون. أركايف [ورقة]
[2024/03] التغطية: إنشاء اختبار قائم على LLM موجه بالتغطية. بيزورنو وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] إنشاء اختبار فعال باستخدام نماذج اللغة الكبيرة المدربة مسبقًا واختبار الطفرات. دخيل وآخرون. المشاة. سوفت دبليو. تكنول. . [ورقة] [الريبو]
[2023/05] لا مزيد من الاختبارات اليدوية؟ تقييم وتحسين ChatGPT لإنشاء اختبار الوحدة. يوان وآخرون. arXiv. [ورقة] [الريبو]
[2023/05] ChatUniTest: إطار عمل لإنشاء الاختبارات المستندة إلى LLM. تشن وآخرون. FSE. [ورقة] [الريبو]
[2023/02] تقييم تجريبي لاستخدام نماذج اللغة الكبيرة لإنشاء اختبار الوحدة الآلي. شيفر وآخرون. IEEE ترانس. هندسة البرمجيات.. [ورقة] [الريبو]

اختبار النظام

[2024/11] نظام محسّن للرسم البياني للمعرفة البرمجية لجيل برامج تشغيل Fuzz القائم على LLM Xu et al. arXiv. [ورق]
[2024/07] اختبار واجهة المستخدم الرسومية المتنقلة الآلي القائم على الرؤية عبر نموذج اللغة الكبير متعدد الوسائط. ليو وآخرون. arXiv. [ورقة] [الريبو]
[2024/04] يمكن لوكلاء LLM استغلال نقاط الضعف ليوم واحد بشكل مستقل. فانغ وآخرون. arXiv. [ورق]
[2024/02] يمكنك أن تستريح الآن: استنتاج المواصفات الآلي واختبار الصندوق الأسود لواجهات برمجة التطبيقات RESTful مع نماذج اللغات الكبيرة. ديكروب وآخرون. arXiv. [ورقة] [الريبو]
[2024/01] XUAT-Copilot: نظام تعاوني متعدد الوكلاء لاختبار قبول المستخدم الآلي باستخدام نموذج لغة كبير. وانغ وآخرون. arXiv. [ورق]
[2024/01] KernelGPT: تحسين Kernel Fuzzing عبر نماذج اللغات الكبيرة. يانغ وآخرون. arXiv. [ورق]
[2023/11] اختبار واجهة المستخدم الرسومية المتنقلة المستندة إلى النوايا باستخدام وكلاء نماذج اللغة الكبيرة المستقلين . يون وآخرون. ICST. [ورقة] [الريبو]
[2023/10] اجعل LLM خبيرًا في الاختبار: جلب التفاعل الشبيه بالإنسان إلى اختبار واجهة المستخدم الرسومية على الهاتف المحمول من خلال قرارات مدركة للوظائف. ليو وآخرون. ICSE. [ورق]
[2023/10] AXNav: إعادة تشغيل اختبارات إمكانية الوصول من اللغة الطبيعية. الطيب وآخرون. تشي. [ورق]
[2023/10] برنامج التحويل البرمجي ذو الصندوق الأبيض مدعوم بنماذج اللغات الكبيرة. يانغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/10] اختبار الحدود: إنشاء مدخلات نصية غير عادية لاكتشاف أعطال تطبيقات الهاتف المحمول باستخدام نموذج لغة كبير. ليو وآخرون. ICSE. [ورقة] [الريبو]
[2023/08] PENTESTGPT: أداة اختبار الاختراق التلقائي التي تدعم LLM. دينغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] Fuzz4All: Fuzzing العالمي مع نماذج اللغات الكبيرة. شيا وآخرون. ICSE. [ورقة] [الريبو]
[2023/07] عزل أخطاء المترجم من خلال إنشاء برامج شاهدة فعالة بنماذج لغوية كبيرة. تو وآخرون. IEEE ترانس. هندسة البرمجيات [ورقة] [الريبو]
[2023/06] كل ما تحتاج إليه هو المطالبة: إعادة التشغيل الآلي لأخطاء Android باستخدام نماذج اللغات الكبيرة. فنغ وآخرون. ICSE. [ورقة] [الريبو]

تصحيح الأخطاء

توطين الخطأ

[2024/11] FlexFL: توطين الأخطاء بشكل مرن وفعال باستخدام نماذج لغات كبيرة مفتوحة المصدر Xu et al. أركايف [ورقة]
[2024/09] تعزيز توطين الأخطاء من خلال تحليل التعليمات البرمجية المطلوبة مع وكلاء LLM والتأمل الذاتي Rafi et al. أركايف [ورقة]
[2024/03] AGENTFL: توسيع نطاق توطين الأخطاء القائم على LLM إلى سياق مستوى المشروع. تشين وآخرون. arXiv. [ورق]
[2023/10] RCAgent: تحليل السبب الجذري للسحابة بواسطة وكلاء مستقلين باستخدام نماذج اللغات الكبيرة المعززة بالأدوات. وانغ وآخرون. arXiv. [ورق]
[2023/08] تقييم كمي ونوعي لتوطين الأخطاء القابلة للتفسير المستندة إلى LLM . كانغ وآخرون. FSE. [ورق]

إصلاح البرنامج

[2024/07] الأيدي المفتوحة: منصة مفتوحة لمطوري برامج الذكاء الاصطناعي كوكلاء عموميين Wang et al. أرخايف [ورقة] [الريبو]
[2024/10] البحث الموجه الدلالي لإصلاح البرامج بكفاءة باستخدام نماذج اللغة الكبيرة Thanh et al. أركايف [ورقة]
[2024/09] الإصلاح الرمزي العصبي لتقشر الاختبار . تشن وآخرون. ISSTA. [ورق]
[2024/04] إلى أي مدى يمكننا الذهاب مع إصلاح البرنامج العملي على مستوى الوظيفة؟. شيانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] RepairAgent: وكيل مستقل قائم على LLM لإصلاح البرامج. بوزنية وآخرون. arXiv. [ورق]
[2024/03] ACFIX: توجيه طلاب LLM باستخدام ممارسات RBAC الشائعة لإصلاح ثغرات التحكم في الوصول في العقود الذكية وفقًا للسياق. تشانغ وآخرون. arXiv. [ورق]
[2024/02] CigaR: برنامج إصلاح فعال من حيث التكلفة مع LLMs. هيدفيجي وآخرون. arXiv. [ورقة] [الريبو]
[2023/04] تصحيح الأخطاء الآلي القابل للتفسير عبر التصحيح العلمي المستند إلى نموذج اللغة الكبير. كانغ وآخرون. arXiv. [ورق]
[2023/04] استمر في المحادثة: إصلاح 162 خطأ من أصل 337 خطأ مقابل 0.42 دولار لكل منها باستخدام ChatGPT. شيا وآخرون. arXiv. [ورق]
[2023/01] إصلاح برنامج المحادثة الآلي. شيا وآخرون. arXiv. [ورق]

تصحيح الأخطاء الموحد

[2024/04] نهج موحد لتصحيح الأخطاء من خلال التآزر متعدد الوكلاء القائم على LLM. لي وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] LDB: مصحح أخطاء نموذج لغة كبير من خلال التحقق من تنفيذ وقت التشغيل خطوة بخطوة. تشونغ وآخرون. arXiv. [ورقة] [الريبو]

يطلق

[2024/08] GoNoGo: نظام متعدد الوكلاء فعال قائم على LLM لتبسيط اتخاذ القرار بشأن إصدار برامج السيارات Khoee et al. أركايف [ورقة]

تطوير البرمجيات من النهاية إلى النهاية

[2024/09] إنشاء اقتران كود Java مع ChatGPT Zhao et al. علوم الكمبيوتر النظرية [ورقة]
[2024/07] تمكين تطوير البرمجيات التوليدية القائمة على Agile من خلال العمل الجماعي بين الإنسان والذكاء الاصطناعي Zhang et al. توسيم [ورقة] [الريبو]
[2024/06] تجربة تطوير البرمجيات متعددة الوكلاء: نحو منصة موحدة Sami et al. arXiv. [ورق]
[2024/06] توسيع نطاق التعاون متعدد الوكلاء القائم على النماذج الكبيرة Qian et al. arXiv. [ورقة] [الريبو]
[2024/06] تطوير برمجيات متعددة الوكلاء من خلال التعاون بين الفرق. دو وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] AgileCoder: وكلاء تعاونيون ديناميكيون لتطوير البرمجيات استنادًا إلى منهجية Agile. نجوين وآخرون. arXiv. [ورقة] [الريبو]
[2024/05] تحسين الخبرة التكرارية لوكلاء تطوير البرمجيات. تشيان وآخرون. arXiv. [ورق]
[2024/03] عندما يلتقي إنشاء الأكواد البرمجية المستندة إلى LLM بعملية تطوير البرمجيات. لين وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] CodeS: تحويل اللغة الطبيعية إلى مستودع الأكواد عبر رسم متعدد الطبقات. زان وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] CodePori: نموذج واسع النطاق لتطوير البرمجيات المستقلة باستخدام وكلاء متعددين. رشيد وآخرون. arXiv. [ورق]
[2024/01] تجربة ممارسة برمجة جديدة مع LLMs. تشانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/01] LLM4PLC: تسخير نماذج اللغة الكبيرة للبرمجة التي يمكن التحقق منها لـ PLCs في أنظمة التحكم الصناعية. فقيه وآخرون. ICSE. [ورقة] [الريبو]
[2023/12] التعلم التجريبي المشترك لوكلاء تطوير البرمجيات. تشيان وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/11] الوكلاء المستقلون في تطوير البرمجيات: ورقة رؤية رشيد وآخرون. arXiv. [ورق]
[2023/09] الوكلاء التلقائيون: إطار عمل لإنشاء الوكيل تلقائيًا. تشن وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] AgentVerse: تسهيل التعاون متعدد الوكلاء واستكشاف السلوكيات الناشئة. تشن وآخرون. ICLR. [ورقة] [الريبو]
[2023/08] METAGPT: البرمجة التعريفية لإطار عمل تعاوني متعدد الوكلاء. هونغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/07] وكلاء التواصل لتطوير البرمجيات. تشيان وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/06] التعاون بين الوكلاء المتعددين: تسخير قوة وكلاء LLM الأذكياء. طالبيراد وآخرون. arXiv. [ورق]
[2023/06] برنامج Prompt Sapper: البنية التحتية لهندسة البرمجيات المدعومة من LLM لخدمات الذكاء الاصطناعي الأصلية. شينغ وآخرون. arXiv. [ورق]
[2023/04] إنشاء كود التعاون الذاتي عبر ChatGPT. دونغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/04] LLM ذات الكود المنخفض: البرمجة المرئية عبر LLM. كاي وآخرون. arXiv. [ورقة] [الريبو]

صيانة البرامج الشاملة

[2024/11] ماجستير في القانون كمتعلمين مستمرين: تحسين إعادة إنتاج التعليمات البرمجية المعيبة في مشكلات البرامج Lin et al. أركايف [ورقة]
[2024/11] وكلاء تطوير البرمجيات البشريون في الحلقة Takerngsaksiri et al. أركايف [ورقة]
[2024/11] Lingma SWE-GPT: نموذج لغة مفتوح تتمحور حول عملية التطوير لتحسين البرامج الآلية Ma et al. أرخايف [ورقة] [الريبو]
[2024/10] RepoGraph: تعزيز هندسة برمجيات الذكاء الاصطناعي باستخدام الرسم البياني للكود على مستوى المستودع Ouyang et al. أرخايف [ورقة] [الريبو]
[2024/09] وكيل MarsCode: إصلاح الأخطاء الآلي الأصلي بتقنية الذكاء الاصطناعي Liu et al. arXiv. [ورق]
[2024/08] CODEXGRAPH: سد الفجوة بين نماذج اللغات الكبيرة ومستودعات الأكواد عبر قواعد بيانات الرسم البياني للرموز Liu et al. arXiv. [ورقة] [الريبو]
[2024/08] التنوع يُمكّن الذكاء: الخبرة المتكاملة لوكلاء هندسة البرمجيات Zhang et al. arXiv. [ورق]
[2024/08] SpecRover: استخراج نية التعليمات البرمجية عبر LLMs Ruan et al. arXiv. [ورقة] [الريبو]
[2024/07] الأيدي المفتوحة: منصة مفتوحة لمطوري برامج الذكاء الاصطناعي كوكلاء عموميين Wang et al. أرخايف [ورقة] [الريبو]
[2024/07] بدون وكيل: إزالة الغموض عن وكلاء هندسة البرمجيات المعتمدين على LLM. شيا وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] كيف نفهم مستودع البرامج بالكامل؟. ما وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] برنامج الترميز: حل المشكلة باستخدام الرسوم البيانية للوكلاء المتعددين والمهام. تشن وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] MASAI: البنية المعيارية لوكلاء الذكاء الاصطناعي في هندسة البرمجيات. أرورا وآخرون. arXiv. [ورق]
[2024/05] SWE-AGENT: تعمل واجهات الكمبيوتر والوكيل على تمكين هندسة البرمجيات الآلية. يانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/04] AutoCodeRover: تحسين البرنامج المستقل. تشانغ وآخرون. ISSTA. [ورقة] [الريبو]
[2024/03] MAGIS: إطار عمل متعدد الوكلاء قائم على LLM لحل مشكلات GitHub. تاو وآخرون. arXiv. [ورق]

المعيار

[2024/10] SWE-Bench+: معيار الترميز المحسّن لحاملي LLMs Aleithan et al. arXiv. [ورق]
[2024/10] SWE-bench Multimodal: هل يتم تعميم أنظمة الذكاء الاصطناعي على مجالات البرامج المرئية؟ يانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/08] SWE-bench-java: مشكلة GitHub لحل المعيار المعياري لـ Java Zan et al. أرخايف [ورقة] [الريبو]
[2024/07] بدون وكيل: إزالة الغموض عن وكلاء هندسة البرمجيات المعتمدين على LLM. شيا وآخرون. arXiv. [ورقة] [الريبو]
[2023/10] سوي-بينش: هل تستطيع نماذج اللغة حل مشكلات جيثب في العالم الحقيقي؟ جيمينيز وآخرون. ICLR [ورقة] [الريبو]

وجهات نظر الوكيل

إطار الوكيل

تخطيط

التخطيط المنعطف الواحد

[2024/06] AgileCoder: وكلاء تعاونيون ديناميكيون لتطوير البرمجيات استنادًا إلى منهجية Agile. نجوين وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] تطوير برمجيات متعددة الوكلاء من خلال التعاون بين الفرق. دو وآخرون. arXiv. [ورقة] [الريبو]
[2024/05] MapCoder: إنشاء أكواد برمجية متعددة الوكلاء لحل المشكلات بشكل تنافسي. الإسلام وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2024/03] MAGIS: إطار عمل متعدد الوكلاء قائم على LLM لحل مشكلات GitHub. تاو وآخرون. arXiv. [ورق]
[2024/03] CodeS: تحويل اللغة الطبيعية إلى مستودع الأكواد عبر رسم متعدد الطبقات. زان وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] CoCoST: إنشاء أكواد برمجية معقدة تلقائيًا مع البحث عبر الإنترنت واختبار الصحة. هو وآخرون. arXiv. [ورق]
[2024/02] CodePori: نموذج واسع النطاق لتطوير البرمجيات المستقلة باستخدام وكلاء متعددين. رشيد وآخرون. arXiv. [ورق]
[2024/01] CodeAgent: تعزيز إنشاء التعليمات البرمجية باستخدام أنظمة الوكلاء المدمجة بالأدوات لمواجهة تحديات الترميز على مستوى إعادة الشراء في العالم الحقيقي. تشانغ وآخرون. الرباط الصليبي الأمامي. [ورق]
[2024/01] LLM4PLC: تسخير نماذج اللغة الكبيرة للبرمجة التي يمكن التحقق منها لـ PLCs في أنظمة التحكم الصناعية. فقيه وآخرون. ICSE. [ورقة] [الريبو]
[2024/01] تجربة ممارسة برمجة جديدة مع LLMs. تشانغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/11] الوكلاء المستقلون في تطوير البرمجيات: ورقة رؤية رشيد وآخرون. arXiv. [ورق]
[2023/10] تحليل الكود الثابت في عصر الذكاء الاصطناعي: استكشاف متعمق لمفهوم ووظيفة وإمكانات تحليل الكود الذكي. مروحة وآخرون. arXiv. [ورق]
[2023/09] بارسل؟: الاستدلال الخوارزمي مع النماذج اللغوية من خلال تركيب التحليلات. زيليكمان وآخرون. نوريبس. [ورقة] [الريبو]
[2023/08] PENTESTGPT: أداة اختبار الاختراق التلقائي التي تدعم LLM. دينغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] التدفقات: العناصر الأساسية للاستدلال والتعاون في مجال الذكاء الاصطناعي. جوزيفوسكي وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] METAGPT: البرمجة التعريفية لإطار عمل تعاوني متعدد الوكلاء. هونغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/07] وكلاء التواصل لتطوير البرمجيات. تشيان وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/04] إنشاء كود التعاون الذاتي عبر ChatGPT. دونغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/04] LLM ذات الكود المنخفض: البرمجة المرئية عبر LLM. كاي وآخرون. arXiv. [ورقة] [الريبو]

التخطيط متعدد المنعطفات

[2024/03] الفئران: استرجاع الأفكار المعززة تثير التفكير المدرك للسياق في جيل الأفق الطويل . وانغ وآخرون. arXiv. [ورقة] [الريبو]

رد فعل مثل

[2024/06] MASAI: البنية المعيارية لوكلاء الذكاء الاصطناعي في هندسة البرمجيات. أرورا وآخرون. arXiv. [ورق]
[2024/02] إجراءات التعليمات البرمجية القابلة للتنفيذ تثير وكلاء LLM أفضل. وانغ وآخرون. آي سي إم إل. [ورقة] [الريبو]
[2024/01] CodeAgent: تعزيز إنشاء التعليمات البرمجية باستخدام أنظمة الوكلاء المدمجة بالأدوات لمواجهة تحديات الترميز على مستوى إعادة الشراء في العالم الحقيقي. تشانغ وآخرون. الرباط الصليبي الأمامي. [ورق]
[2024/01] XUAT-Copilot: نظام تعاوني متعدد الوكلاء لاختبار قبول المستخدم الآلي باستخدام نموذج لغة كبير. وانغ وآخرون. arXiv. [ورق]
[2023/11] اختبار واجهة المستخدم الرسومية المتنقلة المستندة إلى النوايا باستخدام وكلاء نماذج اللغة الكبيرة المستقلين . يون وآخرون. ICST. [ورقة] [الريبو]
[2023/10] RCAgent: تحليل السبب الجذري للسحابة بواسطة وكلاء مستقلين باستخدام نماذج اللغات الكبيرة المعززة بالأدوات. وانغ وآخرون. arXiv. [ورق]
[2023/10] البحث عن شجرة وكيل اللغة يوحد التفكير والتصرف والتخطيط في نماذج اللغة. تشو وآخرون. آي سي إم إل. [ورقة] [الريبو]
[2023/10] AXNav: إعادة تشغيل اختبارات إمكانية الوصول من اللغة الطبيعية. الطيب وآخرون. تشي. [ورق]
[2023/09] CodePlan: الترميز على مستوى المستودع باستخدام LLMs والتخطيط. بايري وآخرون. FSE. [ورقة] [الريبو]

الطبقات

[2024/04] الوكلاء المنظمون ذاتيًا: إطار عمل متعدد الوكلاء LLM نحو إنشاء الأكواد البرمجية على نطاق واسع للغاية وتحسينها. إيشيباشي وآخرون. arXiv. [ورقة] [الريبو]

ذاكرة

الذاكرة طويلة المدى

[2024/06] توسيع نطاق التعاون متعدد الوكلاء القائم على النماذج الكبيرة Qian et al. arXiv. [ورقة] [الريبو]
[2024/06] تطوير برمجيات متعددة الوكلاء من خلال التعاون بين الفرق. دو وآخرون. arXiv. [ورقة] [الريبو]
[2024/05] تحسين الخبرة التكرارية لوكلاء تطوير البرمجيات. تشيان وآخرون. arXiv. [ورق]
[2023/12] التعلم التجريبي المشترك لوكلاء تطوير البرمجيات. تشيان وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/11] اختبار واجهة المستخدم الرسومية المتنقلة المستندة إلى النوايا باستخدام وكلاء نماذج اللغة الكبيرة المستقلين . يون وآخرون. ICST. [ورقة] [الريبو]
[2023/09] الوكلاء التلقائيون: إطار عمل لإنشاء الوكيل تلقائيًا. تشن وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] METAGPT: البرمجة التعريفية لإطار عمل تعاوني متعدد الوكلاء. هونغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/07] وكلاء التواصل لتطوير البرمجيات. تشيان وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/03] التأمل: وكلاء اللغة مع تعلم التعزيز اللفظي. شين وآخرون. نوريبس. [ورقة] [الريبو]

الذاكرة قصيرة المدى

[2024/07] اختبار واجهة المستخدم الرسومية المتنقلة الآلي القائم على الرؤية عبر نموذج اللغة الكبير متعدد الوسائط. ليو وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] توسيع نطاق التعاون متعدد الوكلاء القائم على النماذج الكبيرة Qian et al. arXiv. [ورقة] [الريبو]
[2024/06] تطوير برمجيات متعددة الوكلاء من خلال التعاون بين الفرق. دو وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] AgileCoder: وكلاء تعاونيون ديناميكيون لتطوير البرمجيات استنادًا إلى منهجية Agile. نجوين وآخرون. arXiv. [ورقة] [الريبو]
[2024/04] الوكلاء المنظمون ذاتيًا: إطار عمل متعدد الوكلاء LLM نحو إنشاء الأكواد البرمجية على نطاق واسع للغاية وتحسينها. إيشيباشي وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] MAGIS: إطار عمل متعدد الوكلاء قائم على LLM لحل مشكلات GitHub. تاو وآخرون. arXiv. [ورق]
[2024/01] XUAT-Copilot: نظام تعاوني متعدد الوكلاء لاختبار قبول المستخدم الآلي باستخدام نموذج لغة كبير. وانغ وآخرون. arXiv. [ورق]
[2023/12] E&V: مطالبة النماذج اللغوية الكبيرة بإجراء تحليل ثابت عن طريق تنفيذ التعليمات البرمجية الزائفة والتحقق منها. هاو وآخرون. arXiv. [ورق]
[2023/11] اختبار واجهة المستخدم الرسومية المتنقلة المستندة إلى النوايا باستخدام وكلاء نماذج اللغة الكبيرة المستقلين . يون وآخرون. ICST. [ورقة] [الريبو]
[2023/10] RCAgent: تحليل السبب الجذري للسحابة بواسطة وكلاء مستقلين باستخدام نماذج اللغات الكبيرة المعززة بالأدوات. وانغ وآخرون. arXiv. [ورق]
[2023/10] تحليل الكود الثابت في عصر الذكاء الاصطناعي: استكشاف متعمق لمفهوم ووظيفة وإمكانات تحليل الكود الذكي. مروحة وآخرون. arXiv. [ورق]
[2023/10] اجعل LLM خبيرًا في الاختبار: جلب التفاعل الشبيه بالإنسان إلى اختبار واجهة المستخدم الرسومية على الهاتف المحمول من خلال قرارات مدركة للوظائف. ليو وآخرون. ICSE. [ورق]
[2023/09] CodePlan: الترميز على مستوى المستودع باستخدام LLMs والتخطيط. بايري وآخرون. FSE. [ورقة] [الريبو]
[2023/09] الوكلاء التلقائيون: إطار عمل لإنشاء الوكيل تلقائيًا. تشن وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] METAGPT: البرمجة التعريفية لإطار عمل تعاوني متعدد الوكلاء. هونغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/07] وكلاء التواصل لتطوير البرمجيات. تشيان وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/03] التأمل: وكلاء اللغة مع تعلم التعزيز اللفظي. شين وآخرون. نوريبس. [ورقة] [الريبو]

الذاكرة المشتركة: نوع خاص من الذاكرة قصيرة المدى

[2024/06] AgileCoder: وكلاء تعاونيون ديناميكيون لتطوير البرمجيات استنادًا إلى منهجية Agile. نجوين وآخرون. arXiv. [ورقة] [الريبو]
[2024/05] MARE: إطار التعاون متعدد الوكلاء لهندسة المتطلبات. جين وآخرون. arXiv. [ورق]
[2024/03] عندما يلتقي إنشاء الأكواد البرمجية المستندة إلى LLM بعملية تطوير البرمجيات. لين وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] AGENTFL: توسيع نطاق توطين الأخطاء القائم على LLM إلى سياق مستوى المشروع. تشين وآخرون. arXiv. [ورق]
[2023/08] METAGPT: البرمجة التعريفية لإطار عمل تعاوني متعدد الوكلاء. هونغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/04] إنشاء كود التعاون الذاتي عبر ChatGPT. دونغ وآخرون. arXiv. [ورقة] [الريبو]

تصور

الإدخال المرئي

[2024/10] SWE-bench Multimodal: هل يتم تعميم أنظمة الذكاء الاصطناعي على مجالات البرامج المرئية؟ يانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/07] اختبار واجهة المستخدم الرسومية المتنقلة الآلي القائم على الرؤية عبر نموذج اللغة الكبير متعدد الوسائط. ليو وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] تجربة تطوير البرمجيات متعددة الوكلاء: نحو منصة موحدة Sami et al. arXiv. [ورق]
[2024/01] XUAT-Copilot: نظام تعاوني متعدد الوكلاء لاختبار قبول المستخدم الآلي باستخدام نموذج لغة كبير. وانغ وآخرون. arXiv. [ورق]
[2023/10] AXNav: إعادة تشغيل اختبارات إمكانية الوصول من اللغة الطبيعية. الطيب وآخرون. تشي. [ورق]
[2023/10] اختبار الحدود: إنشاء مدخلات نصية غير عادية لاكتشاف أعطال تطبيقات الهاتف المحمول باستخدام نموذج لغة كبير. ليو وآخرون. ICSE. [ورقة] [الريبو]
[2023/08] METAGPT: البرمجة التعريفية لإطار عمل تعاوني متعدد الوكلاء. هونغ وآخرون. ICLR. [ورقة] [الريبو]

فعل

أدوات البحث

[2024/05] إنشاء الأكواد البرمجية على مستوى الفصل الدراسي من اللغة الطبيعية باستخدام الاستدلال التكراري المعزز بالأدوات عبر المستودع. ديشباندي وآخرون. arXiv. [ورق]
[2024/04] يمكن لوكلاء LLM استغلال نقاط الضعف ليوم واحد بشكل مستقل. فانغ وآخرون. arXiv. [ورق]
[2024/03] التطوير التلقائي: التطوير الآلي القائم على الذكاء الاصطناعي . توفانو وآخرون. أركايف [ورقة]
[2024/03] RepairAgent: وكيل مستقل قائم على LLM لإصلاح البرامج. بوزنية وآخرون. arXiv. [ورق]
[2024/03] CoCoST: إنشاء أكواد برمجية معقدة تلقائيًا مع البحث عبر الإنترنت واختبار الصحة. هو وآخرون. arXiv. [ورق]
[2024/03] الفئران: استرجاع الأفكار المعززة تثير التفكير المدرك للسياق في جيل الأفق الطويل . وانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] CodePori: نموذج واسع النطاق لتطوير البرمجيات المستقلة باستخدام وكلاء متعددين. رشيد وآخرون. arXiv. [ورق]
[2024/01] LLM4Vuln: إطار تقييم موحد لفصل وتعزيز أسباب الضعف لدى LLM. صن وآخرون. arXiv. [ورقة] [الريبو]
[2024/01] CodeAgent: تعزيز إنشاء التعليمات البرمجية باستخدام أنظمة الوكلاء المدمجة بالأدوات لمواجهة تحديات الترميز على مستوى إعادة الشراء في العالم الحقيقي. تشانغ وآخرون. الرباط الصليبي الأمامي. [ورق]
[2023/12] E&V: مطالبة النماذج اللغوية الكبيرة بإجراء تحليل ثابت عن طريق تنفيذ التعليمات البرمجية الزائفة والتحقق منها. هاو وآخرون. arXiv. [ورق]
[2023/12] التعلم التجريبي المشترك لوكلاء تطوير البرمجيات. تشيان وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/11] اختبار واجهة المستخدم الرسومية المتنقلة المستندة إلى النوايا باستخدام وكلاء نماذج اللغة الكبيرة المستقلين . يون وآخرون. ICST. [ورقة] [الريبو]
[2023/10] الليمور: مواءمة اللغة الطبيعية والرمز لوكلاء اللغة. شو وآخرون. ICLR. [ورقة] [الريبو]
[2023/10] RCAgent: تحليل السبب الجذري للسحابة بواسطة وكلاء مستقلين باستخدام نماذج اللغات الكبيرة المعززة بالأدوات. وانغ وآخرون. arXiv. [ورق]
[2023/10] تحليل الكود الثابت في عصر الذكاء الاصطناعي: استكشاف متعمق لمفهوم ووظيفة وإمكانات تحليل الكود الذكي. مروحة وآخرون. arXiv. [ورق]
[2023/08] METAGPT: البرمجة التعريفية لإطار عمل تعاوني متعدد الوكلاء. هونغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/08] PENTESTGPT: أداة اختبار الاختراق التلقائي التي تدعم LLM. دينغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] AgentVerse: تسهيل التعاون متعدد الوكلاء واستكشاف السلوكيات الناشئة. تشن وآخرون. ICLR. [ورقة] [الريبو]
[2023/08] Gentopia: منصة تعاونية لمجالس إدارة الحقوق المعززة بالأدوات. شو وآخرون. EMNLP. [ورقة] [الريبو]
[2023/08] AutoGen: تمكين تطبيقات LLM من الجيل التالي عبر محادثة متعددة الوكلاء. وو وآخرون. arXiv. [ورقة] [الريبو]
[2023/05] ToolCoder: تعليم نماذج إنشاء الأكواد البرمجية لاستخدام أدوات بحث API. تشانغ وآخرون. arXiv. [ورق]
[2023/03] الفن: التفكير التلقائي متعدد الخطوات واستخدام الأدوات لنماذج اللغات الكبيرة. بارانجابي وآخرون. arXiv. [ورقة] [الريبو]

تشغيل الملف

[2024/08] SpecRover: استخراج نية التعليمات البرمجية عبر LLMs Ruan et al. arXiv. [ورقة] [الريبو]
[2024/06] MASAI: البنية المعيارية لوكلاء الذكاء الاصطناعي في هندسة البرمجيات. أرورا وآخرون. arXiv. [ورق]
[2024/05] التحليل الثابت بمساعدة LLM لاكتشاف الثغرات الأمنية. لي وآخرون. arXiv. [ورق]
[2024/05] SWE-AGENT: تعمل واجهات الكمبيوتر والوكيل على تمكين هندسة البرمجيات الآلية. يانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/04] يمكن لوكلاء LLM استغلال نقاط الضعف ليوم واحد بشكل مستقل. فانغ وآخرون. arXiv. [ورق]
[2024/03] RepairAgent: وكيل مستقل قائم على LLM لإصلاح البرامج. بوزنية وآخرون. arXiv. [ورق]
[2024/03] التطوير التلقائي: التطوير الآلي القائم على الذكاء الاصطناعي . توفانو وآخرون. أركايف [ورقة]
[2023/04] تصحيح الأخطاء الآلي القابل للتفسير عبر التصحيح العلمي المستند إلى نموذج اللغة الكبير. كانغ وآخرون. arXiv. [ورق]

عملية واجهة المستخدم الرسومية

[2024/07] اختبار واجهة المستخدم الرسومية المتنقلة الآلي القائم على الرؤية عبر نموذج اللغة الكبير متعدد الوسائط. ليو وآخرون. arXiv. [ورقة] [الريبو]
[2024/01] XUAT-Copilot: نظام تعاوني متعدد الوكلاء لاختبار قبول المستخدم الآلي باستخدام نموذج لغة كبير. وانغ وآخرون. arXiv. [ورق]
[2023/10] اجعل LLM خبيرًا في الاختبار: جلب التفاعل الشبيه بالإنسان إلى اختبار واجهة المستخدم الرسومية على الهاتف المحمول من خلال قرارات مدركة للوظائف. ليو وآخرون. ICSE. [ورق]
[2023/10] AXNav: إعادة تشغيل اختبارات إمكانية الوصول من اللغة الطبيعية. الطيب وآخرون. تشي. [ورق]
[2023/10] اختبار الحدود: إنشاء مدخلات نصية غير عادية لاكتشاف أعطال تطبيقات الهاتف المحمول باستخدام نموذج لغة كبير. ليو وآخرون. ICSE. [ورقة] [الريبو]
[2023/06] كل ما تحتاج إليه هو المطالبة: إعادة التشغيل الآلي لأخطاء Android باستخدام نماذج اللغات الكبيرة. فنغ وآخرون. ICSE. [ورقة] [الريبو]

تحليل البرنامج الثابت

[2024/06] تطوير برمجيات متعددة الوكلاء من خلال التعاون بين الفرق. دو وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] AgileCoder: وكلاء تعاونيون ديناميكيون لتطوير البرمجيات استنادًا إلى منهجية Agile. نجوين وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] MASAI: البنية المعيارية لوكلاء الذكاء الاصطناعي في هندسة البرمجيات. أرورا وآخرون. arXiv. [ورق]
[2024/05] إنشاء الأكواد البرمجية على مستوى الفصل الدراسي من اللغة الطبيعية باستخدام الاستدلال التكراري المعزز بالأدوات عبر المستودع. ديشباندي وآخرون. arXiv. [ورق]
[2024/05] التحليل الثابت بمساعدة LLM لاكتشاف الثغرات الأمنية. لي وآخرون. arXiv. [ورق]
[2024/04] AutoCodeRover: تحسين البرنامج المستقل. تشانغ وآخرون. ISSTA. [ورقة] [الريبو]
[2024/04] تعزيز إنشاء الاختبارات المستندة إلى LLM للفروع التي يصعب تغطيتها من خلال تحليل البرنامج. يانغ وآخرون. arXiv. [ورق]
[2024/04] 3DGen: الجيل بمساعدة الذكاء الاصطناعي لموزعي التنسيق الثنائي الصحيحين . فاخوري وآخرون. أركايف [ورقة]
[2024/03] التطوير التلقائي: التطوير الآلي القائم على الذكاء الاصطناعي . توفانو وآخرون. أركايف [ورقة]
[2024/03] RepairAgent: وكيل مستقل قائم على LLM لإصلاح البرامج. بوزنية وآخرون. arXiv. [ورق]
[2024/03] التغطية: إنشاء اختبار قائم على LLM موجه بالتغطية. بيزورنو وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] ACFIX: توجيه طلاب LLM باستخدام ممارسات RBAC الشائعة لإصلاح ثغرات التحكم في الوصول في العقود الذكية وفقًا للسياق. تشانغ وآخرون. arXiv. [ورق]
[2024/03] AGENTFL: توسيع نطاق توطين الأخطاء القائم على LLM إلى سياق مستوى المشروع. تشين وآخرون. arXiv. [ورق]
[2024/02] عندما يلتقي تحليل تدفق البيانات بنماذج اللغات الكبيرة. وانغ وآخرون. arXiv. [ورق]
[2024/02] LDB: مصحح أخطاء نموذج لغة كبير من خلال التحقق من تنفيذ وقت التشغيل خطوة بخطوة. تشونغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/01] تدريس Code LLMs لاستخدام أدوات الإكمال التلقائي في إنشاء الأكواد البرمجية على مستوى المستودع. وانغ وآخرون. arXiv. [ورق]
[2024/01] CodeAgent: تعزيز إنشاء التعليمات البرمجية باستخدام أنظمة الوكلاء المدمجة بالأدوات لمواجهة تحديات الترميز على مستوى إعادة الشراء في العالم الحقيقي. تشانغ وآخرون. الرباط الصليبي الأمامي. [ورق]
[2024/01] LLM4PLC: تسخير نماذج اللغة الكبيرة للبرمجة التي يمكن التحقق منها لـ PLCs في أنظمة التحكم الصناعية. فقيه وآخرون. ICSE. [ورقة] [الريبو]
[2023/12] E&V: مطالبة النماذج اللغوية الكبيرة بإجراء تحليل ثابت عن طريق تنفيذ التعليمات البرمجية الزائفة والتحقق منها. هاو وآخرون. arXiv. [ورق]
[2023/09] CodePlan: الترميز على مستوى المستودع باستخدام LLMs والتخطيط. بايري وآخرون. FSE. [ورقة] [الريبو]
[2023/08] CodeCoT: معالجة أخطاء بناء جملة التعليمات البرمجية في منطق CoT لإنشاء التعليمات البرمجية. هوانغ وآخرون. arXiv. [ورق]
[2023/07] عزل أخطاء المترجم من خلال إنشاء برامج شاهدة فعالة بنماذج لغوية كبيرة. تو وآخرون. IEEE ترانس. هندسة البرمجيات.. [ورقة] [الريبو]
[2023/06] كل ما تحتاج إليه هو المطالبة: إعادة التشغيل الآلي لأخطاء Android باستخدام نماذج اللغات الكبيرة. فنغ وآخرون. ICSE. [ورقة] [الريبو]

التحليل الديناميكي

[2024/04] تعزيز إنشاء الاختبارات المستندة إلى LLM للفروع التي يصعب تغطيتها من خلال تحليل البرنامج. يانغ وآخرون. arXiv. [ورق]
[2024/03] التغطية: إنشاء اختبار قائم على LLM موجه بالتغطية. بيزورنو وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] AGENTFL: توسيع نطاق توطين الأخطاء القائم على LLM إلى سياق مستوى المشروع. تشين وآخرون. arXiv. [ورق]
[2024/02] LDB: مصحح أخطاء نموذج لغة كبير من خلال التحقق من تنفيذ وقت التشغيل خطوة بخطوة. تشونغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/07] عزل أخطاء المترجم من خلال إنشاء برامج شاهدة فعالة بنماذج لغوية كبيرة. تو وآخرون. IEEE ترانس. هندسة البرمجيات.. [ورقة] [الريبو]
[2023/04] تصحيح الأخطاء الآلي القابل للتفسير عبر التصحيح العلمي المستند إلى نموذج اللغة الكبير. كانغ وآخرون. arXiv. [ورق]

أدوات الاختبار

[2024/09] الإصلاح الرمزي العصبي لتقشر الاختبار . تشن وآخرون. ISSTA. [ورق]
[2024/08] SpecRover: استخراج نية التعليمات البرمجية عبر LLMs Ruan et al. arXiv. [ورقة] [الريبو]
[2024/06] AgileCoder: وكلاء تعاونيون ديناميكيون لتطوير البرمجيات استنادًا إلى منهجية Agile. نجوين وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] MASAI: البنية المعيارية لوكلاء الذكاء الاصطناعي في هندسة البرمجيات. أرورا وآخرون. arXiv. [ورق]
[2024/05] AutoCoder: تحسين نموذج اللغة الكبير للكود باستخدام AIEV-INSTRUCT. لي وآخرون. arXiv. [ورقة] [الريبو]
[2024/05] MapCoder: إنشاء أكواد برمجية متعددة الوكلاء لحل المشكلات بشكل تنافسي. الإسلام وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2024/04] الوكلاء المنظمون ذاتيًا: إطار عمل متعدد الوكلاء LLM نحو إنشاء الأكواد البرمجية على نطاق واسع للغاية وتحسينها. إيشيباشي وآخرون. arXiv. [ورقة] [الريبو]
[2024/04] نهج موحد لتصحيح الأخطاء من خلال التآزر متعدد الوكلاء القائم على LLM. لي وآخرون. arXiv. [ورقة] [الريبو]
[2024/04] يمكن لوكلاء LLM استغلال نقاط الضعف ليوم واحد بشكل مستقل. فانغ وآخرون. arXiv. [ورق]
[2024/04] تعزيز إنشاء الاختبارات المستندة إلى LLM للفروع التي يصعب تغطيتها من خلال تحليل البرنامج. يانغ وآخرون. arXiv. [ورق]
[2024/04] 3DGen: الجيل بمساعدة الذكاء الاصطناعي لموزعي التنسيق الثنائي الصحيحين . فاخوري وآخرون. أركايف [ورقة]
[2024/04] AutoCodeRover: تحسين البرنامج المستقل. تشانغ وآخرون. ISSTA. [ورقة] [الريبو]
[2024/03] التطوير التلقائي: التطوير الآلي القائم على الذكاء الاصطناعي . توفانو وآخرون. أركايف [ورقة]
[2024/03] عندما يلتقي إنشاء الأكواد البرمجية المستندة إلى LLM بعملية تطوير البرمجيات. لين وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] RepairAgent: وكيل مستقل قائم على LLM لإصلاح البرامج. بوزنية وآخرون. arXiv. [ورق]
[2024/03] CoCoST: إنشاء أكواد برمجية معقدة تلقائيًا مع البحث عبر الإنترنت واختبار الصحة. هو وآخرون. arXiv. [ورق]
[2024/02] إجراءات التعليمات البرمجية القابلة للتنفيذ تثير وكلاء LLM أفضل. وانغ وآخرون. آي سي إم إل. [ورقة] [الريبو]
[2024/02] التطوير القائم على الاختبار لإنشاء الأكواد البرمجية. ماثيوز وآخرون. arXiv. [ورقة] [الريبو]
[2024/01] إنشاء الكود باستخدام AlphaCodium: من الهندسة السريعة إلى هندسة التدفق. ريدنيك وآخرون. arXiv. [ورقة] [الريبو]
[2024/01] تجربة ممارسة برمجة جديدة مع LLMs. تشانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/01] CodeAgent: تعزيز إنشاء التعليمات البرمجية باستخدام أنظمة الوكلاء المدمجة بالأدوات لمواجهة تحديات الترميز على مستوى إعادة الشراء في العالم الحقيقي. تشانغ وآخرون. الرباط الصليبي الأمامي. [ورق]
[2023/12] AgentCoder: إنشاء أكواد برمجية قائمة على عوامل متعددة مع اختبار وتحسين متكررين. هوانغ وآخرون. arXiv. [ورق]
[2023/12] LLM4TDD: أفضل الممارسات للتطوير القائم على الاختبار باستخدام نماذج اللغة الكبيرة. بيا وآخرون. arXiv. [ورقة] [الريبو]
[2023/11] المتدخل: تحفيز قدرة البرمجة لنماذج اللغات الكبيرة من خلال سلسلة الإصلاح التفاعلية. وانغ وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/10] ClarifyGPT: تمكين إنشاء الأكواد البرمجية المستندة إلى LLM مع توضيح النية. مو وآخرون. arXiv. [ورقة] [الريبو]
[2023/10] الليمور: مواءمة اللغة الطبيعية والرمز لوكلاء اللغة. شو وآخرون. ICLR. [ورقة] [الريبو]
[2023/10] برنامج التحويل البرمجي ذو الصندوق الأبيض مدعوم بنماذج اللغات الكبيرة. يانغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/09] فهم البرمجة المستندة إلى حالة الاختبار في نماذج اللغات الكبيرة لإنشاء أكواد برمجية أفضل. تيان وآخرون. arXiv. [ورق]
[2023/09] MINT: تقييم LLMS في التفاعل متعدد الأدوار باستخدام الأدوات وردود الفعل اللغوية. وانغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/08] METAGPT: البرمجة التعريفية لإطار عمل تعاوني متعدد الوكلاء. هونغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/08] إنشاء اختبار فعال باستخدام نماذج اللغة الكبيرة المدربة مسبقًا واختبار الطفرات. دخيل وآخرون. المشاة. سوفت دبليو. تكنول. . [ورقة] [الريبو]
[2023/08] AgentVerse: تسهيل التعاون متعدد الوكلاء واستكشاف السلوكيات الناشئة. تشن وآخرون. ICLR. [ورقة] [الريبو]
[2023/08] AutoGen: تمكين تطبيقات LLM من الجيل التالي عبر محادثة متعددة الوكلاء. وو وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] التدفقات: العناصر الأساسية للاستدلال والتعاون في مجال الذكاء الاصطناعي. جوزيفوسكي وآخرون. arXiv. [ورقة] [الريبو]
[2023/06] التطور الذاتي: إطار عمل لتطور التعليمات البرمجية عبر نماذج اللغات الكبيرة. جيانغ وآخرون. arXiv. [ورق]
[2023/06] InterCode: توحيد معايير الترميز التفاعلي وملاحظات التنفيذ. يانغ وآخرون. نوريبس. [ورقة] [الريبو]
[2023/06] هل الإصلاح الذاتي بمثابة رصاصة فضية لإنشاء الأكواد؟. أولاسون وآخرون. ICLR. [ورقة] [الريبو]
[2023/05] لا مزيد من الاختبارات اليدوية؟ تقييم وتحسين ChatGPT لإنشاء اختبار الوحدة. يوان وآخرون. arXiv. [ورقة] [الريبو]
[2023/04] برمجة مستقلة بالكامل مع نماذج لغات كبيرة. ليفينتسيف وآخرون. جيكو. [ورق]
[2023/04] تصحيح الأخطاء الآلي القابل للتفسير عبر التصحيح العلمي المستند إلى نموذج اللغة الكبير. كانغ وآخرون. arXiv. [ورق]
[2023/03] الفن: التفكير التلقائي متعدد الخطوات واستخدام الأدوات لنماذج اللغات الكبيرة. بارانجابي وآخرون. arXiv. [ورقة] [الريبو]
[2023/03] التأمل: وكلاء اللغة مع تعلم التعزيز اللفظي. شين وآخرون. نوريبس. [ورقة] [الريبو]
[2023/02] تقييم تجريبي لاستخدام نماذج اللغة الكبيرة لإنشاء اختبار الوحدة الآلي. شيفر وآخرون. IEEE ترانس. هندسة البرمجيات.. [ورقة] [الريبو]
[2023/01] إصلاح برنامج المحادثة الآلي. شيا وآخرون. arXiv. [ورق]

أدوات توطين الأخطاء

[2024/04] AutoCodeRover: تحسين البرنامج المستقل. تشانغ وآخرون. ISSTA. [ورقة] [الريبو]
[2024/03] RepairAgent: وكيل مستقل قائم على LLM لإصلاح البرامج. بوزنية وآخرون. arXiv. [ورق]

نظام متعدد الوكلاء

أدوار الوكيل

أدوار المدير

[2024/06] AgileCoder: وكلاء تعاونيون ديناميكيون لتطوير البرمجيات استنادًا إلى منهجية Agile. نجوين وآخرون. arXiv. [ورقة] [الريبو]
[2024/05] تحسين الخبرة التكرارية لوكلاء تطوير البرمجيات. تشيان وآخرون. arXiv. [ورق]
[2024/05] MapCoder: إنشاء أكواد برمجية متعددة الوكلاء لحل المشكلات بشكل تنافسي. الإسلام وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2024/04] الوكلاء المنظمون ذاتيًا: إطار عمل متعدد الوكلاء LLM نحو إنشاء الأكواد البرمجية على نطاق واسع للغاية وتحسينها. إيشيباشي وآخرون. arXiv. [ورقة] [الريبو]
[2024/04] 3DGen: الجيل بمساعدة الذكاء الاصطناعي لموزعي التنسيق الثنائي الصحيحين . فاخوري وآخرون. أركايف [ورقة]
[2024/03] MAGIS: إطار عمل متعدد الوكلاء قائم على LLM لحل مشكلات GitHub. تاو وآخرون. arXiv. [ورق]
[2024/03] عندما يلتقي إنشاء الأكواد البرمجية المستندة إلى LLM بعملية تطوير البرمجيات. لين وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] CodeAgent: وكلاء متعاونون لهندسة البرمجيات. تانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] CodePori: نموذج واسع النطاق لتطوير البرمجيات المستقلة باستخدام وكلاء متعددين. رشيد وآخرون. arXiv. [ورق]
[2023/12] التعلم التجريبي المشترك لوكلاء تطوير البرمجيات. تشيان وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/11] الوكلاء المستقلون في تطوير البرمجيات: ورقة رؤية رشيد وآخرون. arXiv. [ورق]
[2023/11] اختبار واجهة المستخدم الرسومية المتنقلة المستندة إلى النوايا باستخدام وكلاء نماذج اللغة الكبيرة المستقلين . يون وآخرون. ICST. [ورقة] [الريبو]
[2023/10] AXNav: إعادة تشغيل اختبارات إمكانية الوصول من اللغة الطبيعية. الطيب وآخرون. تشي. [ورق]
[2023/10] RCAgent: تحليل السبب الجذري للسحابة بواسطة وكلاء مستقلين باستخدام نماذج اللغات الكبيرة المعززة بالأدوات. وانغ وآخرون. arXiv. [ورق]
[2023/09] الوكلاء التلقائيون: إطار عمل لإنشاء الوكيل تلقائيًا. تشن وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] METAGPT: البرمجة التعريفية لإطار عمل تعاوني متعدد الوكلاء. هونغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/04] LLM ذات الكود المنخفض: البرمجة المرئية عبر LLM. كاي وآخرون. arXiv. [ورقة] [الريبو]
[2023/03] CAMEL: وكلاء التواصل لاستكشاف "العقل" لمجتمع نماذج اللغة الكبيرة. لي وآخرون. نوريبس. [ورقة] [الريبو]

متطلبات تحليل الأدوار

[2024/06] تجربة تطوير البرمجيات متعددة الوكلاء: نحو منصة موحدة Sami et al. arXiv. [ورق]
[2024/06] AgileCoder: وكلاء تعاونيون ديناميكيون لتطوير البرمجيات استنادًا إلى منهجية Agile. نجوين وآخرون. arXiv. [ورقة] [الريبو]
[2024/05] MARE: إطار التعاون متعدد الوكلاء لهندسة المتطلبات. جين وآخرون. arXiv. [ورق]
[2024/04] Elicitron: إطار محاكاة قائم على وكيل LLM لاستنباط متطلبات التصميم. عطائي وآخرون. arXiv. [ورق]
[2024/03] عندما يلتقي إنشاء الأكواد البرمجية المستندة إلى LLM بعملية تطوير البرمجيات. لين وآخرون. arXiv. [ورقة] [الريبو]
[2024/01] تجربة ممارسة برمجة جديدة مع LLMs. تشانغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/11] الوكلاء المستقلون في تطوير البرمجيات: ورقة رؤية رشيد وآخرون. arXiv. [ورق]
[2023/10] تحليل الكود الثابت في عصر الذكاء الاصطناعي: استكشاف متعمق لمفهوم ووظيفة وإمكانات تحليل الكود الذكي. مروحة وآخرون. arXiv. [ورق]
[2023/08] METAGPT: البرمجة التعريفية لإطار عمل تعاوني متعدد الوكلاء. هونغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/06] التعاون بين الوكلاء المتعددين: تسخير قوة وكلاء LLM الأذكياء. طالبيراد وآخرون. arXiv. [ورق]
[2023/04] إنشاء كود التعاون الذاتي عبر ChatGPT. دونغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/03] CAMEL: وكلاء التواصل لاستكشاف "العقل" لمجتمع نماذج اللغة الكبيرة. لي وآخرون. نوريبس. [ورقة] [الريبو]

أدوار المصمم

[2024/06] تجربة تطوير البرمجيات متعددة الوكلاء: نحو منصة موحدة Sami et al. arXiv. [ورق]
[2024/03] عندما يلتقي إنشاء الأكواد البرمجية المستندة إلى LLM بعملية تطوير البرمجيات. لين وآخرون. arXiv. [ورقة] [الريبو]
[2024/01] تجربة ممارسة برمجة جديدة مع LLMs. تشانغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/11] الوكلاء المستقلون في تطوير البرمجيات: ورقة رؤية رشيد وآخرون. arXiv. [ورق]
[2023/08] METAGPT: البرمجة التعريفية لإطار عمل تعاوني متعدد الوكلاء. هونغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/08] AgentVerse: تسهيل التعاون متعدد الوكلاء واستكشاف السلوكيات الناشئة. تشن وآخرون. ICLR. [ورقة] [الريبو]
[2023/07] وكلاء التواصل لتطوير البرمجيات. تشيان وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/06] التعاون بين الوكلاء المتعددين: تسخير قوة وكلاء LLM الأذكياء. طالبيراد وآخرون. arXiv. [ورق]

أدوار المطورين

[2024/06] تجربة تطوير البرمجيات متعددة الوكلاء: نحو منصة موحدة Sami et al. arXiv. [ورق]
[2024/06] AgileCoder: وكلاء تعاونيون ديناميكيون لتطوير البرمجيات استنادًا إلى منهجية Agile. نجوين وآخرون. arXiv. [ورقة] [الريبو]
[2024/05] AutoCoder: تحسين نموذج اللغة الكبير للكود باستخدام AIEV-INSTRUCT. لي وآخرون. arXiv. [ورقة] [الريبو]
[2024/05] MapCoder: إنشاء أكواد برمجية متعددة الوكلاء لحل المشكلات بشكل تنافسي. الإسلام وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2024/04] الوكلاء المنظمون ذاتيًا: إطار عمل متعدد الوكلاء LLM نحو إنشاء الأكواد البرمجية على نطاق واسع للغاية وتحسينها. إيشيباشي وآخرون. arXiv. [ورقة] [الريبو]
[2024/04] 3DGen: الجيل بمساعدة الذكاء الاصطناعي لموزعي التنسيق الثنائي الصحيحين . فاخوري وآخرون. أركايف [ورقة]
[2024/03] CodeS: تحويل اللغة الطبيعية إلى مستودع الأكواد عبر رسم متعدد الطبقات. زان وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] MAGIS: إطار عمل متعدد الوكلاء قائم على LLM لحل مشكلات GitHub. تاو وآخرون. arXiv. [ورق]
[2024/03] عندما يلتقي إنشاء الأكواد البرمجية المستندة إلى LLM بعملية تطوير البرمجيات. لين وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] التطوير القائم على الاختبار لإنشاء الأكواد البرمجية. ماثيوز وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] CodePori: نموذج واسع النطاق لتطوير البرمجيات المستقلة باستخدام وكلاء متعددين. رشيد وآخرون. arXiv. [ورق]
[2024/01] تجربة ممارسة برمجة جديدة مع LLMs. تشانغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/12] AgentCoder: إنشاء أكواد برمجية قائمة على عوامل متعددة مع اختبار وتحسين متكررين. هوانغ وآخرون. arXiv. [ورق]
[2023/11] الوكلاء المستقلون في تطوير البرمجيات: ورقة رؤية رشيد وآخرون. arXiv. [ورق]
[2023/11] المتدخل: تحفيز قدرة البرمجة لنماذج اللغات الكبيرة من خلال سلسلة الإصلاح التفاعلية. وانغ وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/08] AutoGen: تمكين تطبيقات LLM من الجيل التالي عبر محادثة متعددة الوكلاء. وو وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] METAGPT: البرمجة التعريفية لإطار عمل تعاوني متعدد الوكلاء. هونغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/08] AgentVerse: تسهيل التعاون متعدد الوكلاء واستكشاف السلوكيات الناشئة. تشن وآخرون. ICLR. [ورقة] [الريبو]
[2023/07] وكلاء التواصل لتطوير البرمجيات. تشيان وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/06] هل الإصلاح الذاتي بمثابة رصاصة فضية لإنشاء الأكواد؟. أولاسون وآخرون. ICLR. [ورقة] [الريبو]
[2023/06] التعاون بين الوكلاء المتعددين: تسخير قوة وكلاء LLM الأذكياء. طالبيراد وآخرون. arXiv. [ورق]
[2023/05] التحرير الذاتي: محرر الأكواد البرمجية المدرك للخطأ لإنشاء الأكواد . تشانغ وآخرون. الرباط الصليبي الأمامي. [ورق]
[2023/04] إنشاء كود التعاون الذاتي عبر ChatGPT. دونغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/03] CAMEL: وكلاء التواصل لاستكشاف "العقل" لمجتمع نماذج اللغة الكبيرة. لي وآخرون. نوريبس. [ورقة] [الريبو]

أدوار ضمان جودة البرمجيات

[2024/08] SpecRover: استخراج نية التعليمات البرمجية عبر LLMs Ruan et al. arXiv. [ورقة] [الريبو]
[2024/07] اختبار واجهة المستخدم الرسومية المتنقلة الآلي القائم على الرؤية عبر نموذج اللغة الكبير متعدد الوسائط. ليو وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] تجربة تطوير البرمجيات متعددة الوكلاء: نحو منصة موحدة Sami et al. arXiv. [ورق]
[2024/06] تطوير برمجيات متعددة الوكلاء من خلال التعاون بين الفرق. دو وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] AgileCoder: وكلاء تعاونيون ديناميكيون لتطوير البرمجيات استنادًا إلى منهجية Agile. نجوين وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] MASAI: البنية المعيارية لوكلاء الذكاء الاصطناعي في هندسة البرمجيات. أرورا وآخرون. arXiv. [ورق]
[2024/05] AutoCoder: تحسين نموذج اللغة الكبير للكود باستخدام AIEV-INSTRUCT. لي وآخرون. arXiv. [ورقة] [الريبو]
[2024/05] MapCoder: إنشاء أكواد برمجية متعددة الوكلاء لحل المشكلات بشكل تنافسي. الإسلام وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2024/04] مراجعة التعليمات البرمجية المدعومة بالذكاء الاصطناعي مع ماجستير إدارة الأعمال: النتائج المبكرة. رشيد وآخرون. arXiv. [ورق]
[2024/04] 3DGen: الجيل بمساعدة الذكاء الاصطناعي لموزعي التنسيق الثنائي الصحيحين . فاخوري وآخرون. أركايف [ورقة]
[2024/04] نهج موحد لتصحيح الأخطاء من خلال التآزر متعدد الوكلاء القائم على LLM. لي وآخرون. arXiv. [ورقة] [الريبو]
[2024/04] إلى أي مدى يمكننا الذهاب مع إصلاح البرنامج العملي على مستوى الوظيفة؟. شيانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] MAGIS: إطار عمل متعدد الوكلاء قائم على LLM لحل مشكلات GitHub. تاو وآخرون. arXiv. [ورق]
[2024/03] AGENTFL: توسيع نطاق توطين الأخطاء القائم على LLM إلى سياق مستوى المشروع. تشين وآخرون. arXiv. [ورق]
[2024/03] الجمع بين الضبط الدقيق والوكلاء المعتمدين على LLM من أجل تدقيق العقود الذكية البديهية مع المبررات. ما وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] عندما يلتقي إنشاء الأكواد البرمجية المستندة إلى LLM بعملية تطوير البرمجيات. لين وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] ACFIX: توجيه طلاب LLM باستخدام ممارسات RBAC الشائعة لإصلاح ثغرات التحكم في الوصول في العقود الذكية وفقًا للسياق. تشانغ وآخرون. arXiv. [ورق]
[2024/02] CodeAgent: وكلاء متعاونون لهندسة البرمجيات. تانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] التطوير القائم على الاختبار لإنشاء الأكواد البرمجية. ماثيوز وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] CodePori: نموذج واسع النطاق لتطوير البرمجيات المستقلة باستخدام وكلاء متعددين. رشيد وآخرون. arXiv. [ورق]
[2024/01] XUAT-Copilot: نظام تعاوني متعدد الوكلاء لاختبار قبول المستخدم الآلي باستخدام نموذج لغة كبير. وانغ وآخرون. arXiv. [ورق]
[2023/12] AgentCoder: إنشاء أكواد برمجية قائمة على عوامل متعددة مع اختبار وتحسين متكررين. هوانغ وآخرون. arXiv. [ورق]
[2023/11] الوكلاء المستقلون في تطوير البرمجيات: ورقة رؤية رشيد وآخرون. arXiv. [ورق]
[2023/11] اختبار واجهة المستخدم الرسومية المتنقلة المستندة إلى النوايا باستخدام وكلاء نماذج اللغة الكبيرة المستقلين . يون وآخرون. ICST. [ورقة] [الريبو]
[2023/10] اكتشاف ثغرات العقد الذكي المستند إلى نموذج اللغة الكبيرة: وجهات نظر جديدة. هو وآخرون. TPS-ISA. [ورقة] [الريبو]
[2023/10] تحليل الكود الثابت في عصر الذكاء الاصطناعي: استكشاف متعمق لمفهوم ووظيفة وإمكانات تحليل الكود الذكي. مروحة وآخرون. arXiv. [ورق]
[2023/10] برنامج التحويل البرمجي ذو الصندوق الأبيض مدعوم بنماذج اللغات الكبيرة. يانغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/10] AXNav: إعادة تشغيل اختبارات إمكانية الوصول من اللغة الطبيعية. الطيب وآخرون. تشي. [ورق]
[2023/08] AutoGen: تمكين تطبيقات LLM من الجيل التالي عبر محادثة متعددة الوكلاء. وو وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] METAGPT: البرمجة التعريفية لإطار عمل تعاوني متعدد الوكلاء. هونغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/07] وكلاء التواصل لتطوير البرمجيات. تشيان وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/06] هل الإصلاح الذاتي بمثابة رصاصة فضية لإنشاء الأكواد؟. أولاسون وآخرون. ICLR. [ورقة] [الريبو]
[2023/06] التعاون بين الوكلاء المتعددين: تسخير قوة وكلاء LLM الأذكياء. طالبيراد وآخرون. arXiv. [ورق]
[2023/05] التحرير الذاتي: محرر الأكواد البرمجية المدرك للخطأ لإنشاء الأكواد . تشانغ وآخرون. الرباط الصليبي الأمامي. [ورق]
[2023/03] CAMEL: وكلاء التواصل لاستكشاف "العقل" لمجتمع نماذج اللغة الكبيرة. لي وآخرون. نوريبس. [ورقة] [الريبو]

أدوار مساعد

[2024/08] التنوع يُمكّن الذكاء: الخبرة المتكاملة لوكلاء هندسة البرمجيات Zhang et al. arXiv. [ورق]
[2024/08] SpecRover: استخراج نية التعليمات البرمجية عبر LLMs Ruan et al. arXiv. [ورقة] [الريبو]
[2024/06] MASAI: البنية المعيارية لوكلاء الذكاء الاصطناعي في هندسة البرمجيات. أرورا وآخرون. arXiv. [ورق]
[2024/05] MapCoder: إنشاء أكواد برمجية متعددة الوكلاء لحل المشكلات بشكل تنافسي. الإسلام وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2024/03] MAGIS: إطار عمل متعدد الوكلاء قائم على LLM لحل مشكلات GitHub. تاو وآخرون. arXiv. [ورق]
[2024/03] CodeS: تحويل اللغة الطبيعية إلى مستودع الأكواد عبر رسم متعدد الطبقات. زان وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] الجمع بين الضبط الدقيق والوكلاء المعتمدين على LLM من أجل تدقيق العقود الذكية البديهية مع المبررات. ما وآخرون. arXiv. [ورقة] [الريبو]
[2023/10] تحليل الكود الثابت في عصر الذكاء الاصطناعي: استكشاف متعمق لمفهوم ووظيفة وإمكانات تحليل الكود الذكي. مروحة وآخرون. arXiv. [ورق]

آلية التعاون

تعاون

هيكل الطبقات

[2024/08] التنوع يُمكّن الذكاء: الخبرة المتكاملة لوكلاء هندسة البرمجيات Zhang et al. arXiv. [ورق]
[2024/08] SpecRover: استخراج نية التعليمات البرمجية عبر LLMs Ruan et al. arXiv. [ورقة] [الريبو]
[2024/06] تجربة تطوير البرمجيات متعددة الوكلاء: نحو منصة موحدة Sami et al. arXiv. [ورق]
[2024/06] توسيع نطاق التعاون متعدد الوكلاء القائم على النماذج الكبيرة Qian et al. arXiv. [ورقة] [الريبو]
[2024/06] تطوير برمجيات متعددة الوكلاء من خلال التعاون بين الفرق. دو وآخرون. arXiv. [ورقة] [الريبو]
[2024/06] AgileCoder: وكلاء تعاونيون ديناميكيون لتطوير البرمجيات استنادًا إلى منهجية Agile. نجوين وآخرون. arXiv. [ورقة] [الريبو]
[2024/05] MapCoder: إنشاء أكواد برمجية متعددة الوكلاء لحل المشكلات بشكل تنافسي. الإسلام وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2024/05] MARE: إطار التعاون متعدد الوكلاء لهندسة المتطلبات. جين وآخرون. arXiv. [ورق]
[2024/04] AutoCodeRover: تحسين البرنامج المستقل. تشانغ وآخرون. ISSTA. [ورقة] [الريبو]
[2024/04] إلى أي مدى يمكننا الذهاب مع إصلاح البرنامج العملي على مستوى الوظيفة؟. شيانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] CodeS: تحويل اللغة الطبيعية إلى مستودع الأكواد عبر رسم متعدد الطبقات. زان وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] عندما يلتقي إنشاء الأكواد البرمجية المستندة إلى LLM بعملية تطوير البرمجيات. لين وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] AGENTFL: توسيع نطاق توطين الأخطاء القائم على LLM إلى سياق مستوى المشروع. تشين وآخرون. arXiv. [ورق]
[2024/02] عندما يلتقي تحليل تدفق البيانات بنماذج اللغات الكبيرة. وانغ وآخرون. arXiv. [ورق]
[2024/02] CodeAgent: وكلاء متعاونون لهندسة البرمجيات. تانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] كل ما تحتاجه هو المزيد من الوكلاء. لي وآخرون. arXiv. [ورق]
[2024/01] تجربة ممارسة برمجة جديدة مع LLMs. تشانغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/11] الوكلاء المستقلون في تطوير البرمجيات: ورقة رؤية رشيد وآخرون. arXiv. [ورق]
[2023/10] تحليل الكود الثابت في عصر الذكاء الاصطناعي: استكشاف متعمق لمفهوم ووظيفة وإمكانات تحليل الكود الذكي. مروحة وآخرون. arXiv. [ورق]
[2023/10] اكتشاف ثغرات العقد الذكي المستند إلى نموذج اللغة الكبيرة: وجهات نظر جديدة. هو وآخرون. TPS-ISA. [ورقة] [الريبو]
[2023/10] برنامج التحويل البرمجي ذو الصندوق الأبيض مدعوم بنماذج اللغات الكبيرة. يانغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/10] شبكة الوكلاء الديناميكية LLM: إطار عمل تعاون بين وكلاء LLM مع تحسين فريق الوكلاء. ليو وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] METAGPT: البرمجة التعريفية لإطار عمل تعاوني متعدد الوكلاء. هونغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/08] التدفقات: العناصر الأساسية للاستدلال والتعاون في مجال الذكاء الاصطناعي. جوزيفوسكي وآخرون. arXiv. [ورقة] [الريبو]
[2023/07] وكلاء التواصل لتطوير البرمجيات. تشيان وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/05] التحرير الذاتي: محرر الأكواد البرمجية المدرك للخطأ لإنشاء الأكواد . تشانغ وآخرون. الرباط الصليبي الأمامي. ورق
[2023/04] LLM ذات الكود المنخفض: البرمجة المرئية عبر LLM. كاي وآخرون. arXiv. [ورقة] [الريبو]

هيكل دائري

[2024/05] AutoCoder: تحسين نموذج اللغة الكبير للكود باستخدام AIEV-INSTRUCT. لي وآخرون. arXiv. [ورقة] [الريبو]
[2024/04] نهج موحد لتصحيح الأخطاء من خلال التآزر متعدد الوكلاء القائم على LLM. لي وآخرون. arXiv. [ورقة] [الريبو]
[2024/03] ACFIX: توجيه طلاب LLM باستخدام ممارسات RBAC الشائعة لإصلاح ثغرات التحكم في الوصول في العقود الذكية وفقًا للسياق. تشانغ وآخرون. arXiv. [ورق]
[2024/03] إجماع متعدد الأدوار من خلال مناقشات ماجستير إدارة الأعمال لاكتشاف الثغرات الأمنية. ماو وآخرون. QRS. [ورق]
[2024/03] الجمع بين الضبط الدقيق والوكلاء المعتمدين على LLM من أجل تدقيق العقود الذكية البديهية مع المبررات. ما وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] التطوير القائم على الاختبار لإنشاء الأكواد البرمجية. ماثيوز وآخرون. arXiv. [ورقة] [الريبو]
[2024/02] CodePori: نموذج واسع النطاق لتطوير البرمجيات المستقلة باستخدام وكلاء متعددين. رشيد وآخرون. arXiv. [ورق]
[2023/12] التعلم التجريبي المشترك لوكلاء تطوير البرمجيات. تشيان وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/12] AgentCoder: إنشاء أكواد برمجية قائمة على عوامل متعددة مع اختبار وتحسين متكررين. هوانغ وآخرون. arXiv. [ورق]
[2023/11] المتدخل: تحفيز قدرة البرمجة لنماذج اللغات الكبيرة من خلال سلسلة الإصلاح التفاعلية. وانغ وآخرون. الرباط الصليبي الأمامي. [ورقة] [الريبو]
[2023/11] اختبار واجهة المستخدم الرسومية المتنقلة المستندة إلى النوايا باستخدام وكلاء نماذج اللغة الكبيرة المستقلين . يون وآخرون. ICST. [ورقة] [الريبو]
[2023/10] AXNav: إعادة تشغيل اختبارات إمكانية الوصول من اللغة الطبيعية. الطيب وآخرون. تشي. [ورق]
[2023/06] هل الإصلاح الذاتي بمثابة رصاصة فضية لإنشاء الأكواد؟. أولاسون وآخرون. ICLR. [ورقة] [الريبو]
[2023/03] CAMEL: وكلاء التواصل لاستكشاف "العقل" لمجتمع نماذج اللغة الكبيرة. لي وآخرون. نوريبس. [ورقة] [الريبو]
[2023/03] التأمل: وكلاء اللغة مع تعلم التعزيز اللفظي. شين وآخرون. نوريبس. [ورقة] [الريبو]

هيكل يشبه الشجرة

[2024/06] توسيع نطاق التعاون متعدد الوكلاء القائم على النماذج الكبيرة Qian et al. arXiv. [ورقة] [الريبو]
[2024/06] MASAI: البنية المعيارية لوكلاء الذكاء الاصطناعي في هندسة البرمجيات. أرورا وآخرون. arXiv. [ورق]
[2024/04] الوكلاء المنظمون ذاتيًا: إطار عمل متعدد الوكلاء LLM نحو إنشاء الأكواد البرمجية على نطاق واسع للغاية وتحسينها. إيشيباشي وآخرون. arXiv. [ورقة] [الريبو]

هيكل يشبه النجم

[2024/06] توسيع نطاق التعاون متعدد الوكلاء القائم على النماذج الكبيرة Qian et al. arXiv. [ورقة] [الريبو]
[2024/03] التطوير التلقائي: التطوير الآلي القائم على الذكاء الاصطناعي . توفانو وآخرون. أركايف [ورقة]
[2024/01] XUAT-Copilot: نظام تعاوني متعدد الوكلاء لاختبار قبول المستخدم الآلي باستخدام نموذج لغة كبير. وانغ وآخرون. arXiv. [ورق]
[2023/10] RCAgent: تحليل السبب الجذري للسحابة بواسطة وكلاء مستقلين باستخدام نماذج اللغات الكبيرة المعززة بالأدوات. وانغ وآخرون. arXiv. [ورق]
[2023/08] AutoGen: تمكين تطبيقات LLM من الجيل التالي عبر محادثة متعددة الوكلاء. وو وآخرون. arXiv. [ورقة] [الريبو]

هيكل شبكي

[2024/06] توسيع نطاق التعاون متعدد الوكلاء القائم على النماذج الكبيرة Qian et al. arXiv. [ورقة] [الريبو]
[2024/04] 3DGen: الجيل بمساعدة الذكاء الاصطناعي لموزعي التنسيق الثنائي الصحيحين . فاخوري وآخرون. أركايف [ورقة]

التعاون بين الإنسان والوكيل

وكيل الإنسان

مرحلة التخطيط

[2024/01] تجربة ممارسة برمجة جديدة مع LLMs. تشانغ وآخرون. arXiv. [ورقة] [الريبو]
[2024/01] LLM4PLC: تسخير نماذج اللغة الكبيرة للبرمجة التي يمكن التحقق منها لـ PLCs في أنظمة التحكم الصناعية. فقيه وآخرون. ICSE. [ورقة] [الريبو]
[2023/10] تحليل الكود الثابت في عصر الذكاء الاصطناعي: استكشاف متعمق لمفهوم ووظيفة وإمكانات تحليل الكود الذكي. مروحة وآخرون. arXiv. [ورق]
[2023/04] LLM ذات الكود المنخفض: البرمجة المرئية عبر LLM. كاي وآخرون. arXiv. [ورقة] [الريبو]

مرحلة المتطلبات

[2024/05] MARE: إطار التعاون متعدد الوكلاء لهندسة المتطلبات. جين وآخرون. arXiv. [ورق]
[2024/02] إجراءات التعليمات البرمجية القابلة للتنفيذ تثير وكلاء LLM أفضل. وانغ وآخرون. آي سي إم إل. [ورقة] [الريبو]
[2024/01] تجربة ممارسة برمجة جديدة مع LLMs. تشانغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/10] ClarifyGPT: تمكين إنشاء الأكواد البرمجية المستندة إلى LLM مع توضيح النية. مو وآخرون. arXiv. [ورقة] [الريبو]
[2023/06] برنامج Prompt Sapper: البنية التحتية لهندسة البرمجيات المدعومة من LLM لخدمات الذكاء الاصطناعي الأصلية. شينغ وآخرون. arXiv. [ورق]

مرحلة التطوير

[2024/03] CodeS: تحويل اللغة الطبيعية إلى مستودع الأكواد عبر رسم متعدد الطبقات. زان وآخرون. arXiv. [ورقة] [الريبو]
[2024/01] LLM4PLC: تسخير نماذج اللغة الكبيرة للبرمجة التي يمكن التحقق منها لـ PLCs في أنظمة التحكم الصناعية. فقيه وآخرون. ICSE. [ورقة] [الريبو]
[2023/09] MINT: تقييم LLMS في التفاعل متعدد الأدوار باستخدام الأدوات وردود الفعل اللغوية. وانغ وآخرون. ICLR. [ورقة] [الريبو]
[2023/08] التدفقات: العناصر الأساسية للاستدلال والتعاون في مجال الذكاء الاصطناعي. جوزيفوسكي وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] AutoGen: تمكين تطبيقات LLM من الجيل التالي عبر محادثة متعددة الوكلاء. وو وآخرون. arXiv. [ورقة] [الريبو]

مرحلة التقييم

[2024/01] تجربة ممارسة برمجة جديدة مع LLMs. تشانغ وآخرون. arXiv. [ورقة] [الريبو]
[2023/08] Gentopia: منصة تعاونية لمجالس إدارة الحقوق المعززة بالأدوات. شو وآخرون. EMNLP. [ورقة] [الريبو]
[2023/06] برنامج Prompt Sapper: البنية التحتية لهندسة البرمجيات المدعومة من LLM لخدمات الذكاء الاصطناعي الأصلية. شينغ وآخرون. arXiv. [ورق]
[2023/03] الفن: التفكير التلقائي متعدد الخطوات واستخدام الأدوات لنماذج اللغات الكبيرة. بارانجابي وآخرون. arXiv. [ورقة] [الريبو]

الاقتباس

 @misc{Agent4SE, title={الوكلاء المعتمدون على نماذج اللغة الكبيرة لهندسة البرمجيات: دراسة استقصائية},
       المؤلف={Junwei Liu وKaixin Wang وYixuan Chen وXin Peng وZhenpeng Chen وLingming Zhang وYiling Lou}، year={2024}، eprint={2409.02977}، archivePrefix={arXiv}، PrimaryClass={cs.SE} ، URL={https://arxiv.org/abs/2409.02977},
 }

المشرفون

جونوي ليو @To-D
كيكسين وانغ @wkx228
ييشوان تشينFloridaSpidee

اتصل بنا

لا تتردد في طرح أية أسئلة أو تقديم بعض الاقتراحات لنا عبر:

جونوي ليو: [email protected]

يوسع