Les progrès récents des grands modèles linguistiques (LLM) ont façonné un nouveau paradigme d'agents d'IA, c'est-à-dire les agents basés sur LLM. Par rapport aux LLM autonomes, les agents basés sur LLM étendent considérablement la polyvalence et l'expertise des LLM en améliorant les LLM avec les capacités de perception et d'utilisation de ressources et d'outils externes. À ce jour, les agents basés sur LLM ont été appliqués et ont montré une efficacité remarquable en génie logiciel (SE). La synergie entre plusieurs agents et l’interaction humaine est encore plus prometteuse dans la résolution de problèmes complexes d’ES du monde réel. Dans ce travail, nous présentons une enquête complète et systématique sur les agents basés sur LLM pour SE. Nous collectons 106 articles et les catégorisons selon deux perspectives, à savoir les perspectives SE et Agent. De plus, nous discutons des défis ouverts et des orientations futures dans ce domaine critique.
? Nous avons systématiquement résumé les progrès d'Agent4SE du point de vue des tâches de génie logiciel et de l'architecture d'agent .
? Lien vers l'article : Agents basés sur des modèles de langage étendus pour le génie logiciel : une enquête
Ce domaine de recherche évolue rapidement ; star ce référentiel pour suivre les mises à jour !
[2024/09/04] Nous avons publié la première version de notre enquête sur arXiv.
Nouvelles
Perspectives SE
Localisation des défauts
Réparation du programme
Débogage unifié
Tests unitaires
Test du système
Détection de bogues statiques
Révision du code
Ingénierie des exigences
Génération de code
Vérification
Vérification du code statique
Essai
Débogage
Libérer
Développement de logiciels de bout en bout
Maintenance logicielle de bout en bout
Points de vue des agents
Phase de planification
Phase des exigences
Phase de développement
Phase d'évaluation
Rôles des agents
Mécanisme de collaboration
Planification
Mémoire
Perception
Action
Cadre d'agent
Système multi-agents
Collaboration homme-agent
Citation
Mainteneurs
Contactez-nous
Histoire des étoiles
[2024/05] MARE : Cadre de collaboration multi-agents pour l'ingénierie des exigences. Jin et coll. arXiv. [papier]
[2024/04] Elicitron : Un cadre de simulation basé sur un agent LLM pour l'élicitation des exigences de conception. Ataei et coll. arXiv. [papier]
[2024/01] SpecGen : génération automatisée de spécifications de programme formelles via de grands modèles de langage. Ma et coll. arXiv. [papier] [dépôt]
[2023/10] Faire progresser l'ingénierie des exigences grâce à l'IA générative : évaluer le rôle des LLM. Arora et coll. arXiv. [papier]
[2024/11] Programmation basée sur la planification : un flux de travail de programmation sur un grand modèle de langage Lei et al. arXiv [papier]
[2024/11] Chaîne de programmation : habilitation de grands modèles de langage pour la génération de codes géospatiaux Hou et al. arXiv [papier]
[2024/10] Bac à sable de langage multi-programmation pour les LLM Dou et al. arXiv [papier]
[2024/10] SceneGenAgent : génération précise de scènes industrielles avec un agent de codage Xia et al. arXiv [papier] [dépôt]
[2024/10] MCCoder : rationaliser le contrôle de mouvement avec la génération de code assistée par LLM et une vérification rigoureuse Li et al. arXiv [papier] [dépôt]
[2024/10] Agents4PLC : Automatisation de la génération et de la vérification de codes API en boucle fermée dans les systèmes de contrôle industriels à l'aide d'agents basés sur LLM Liu et al. arXiv [papier] [dépôt]
[2024/10] Amélioration des performances des programmes parallèles grâce à la génération de code pilotée par DSL avec les optimiseurs LLM Wei et al. arXiv. [papier]
[2024/10] AgentBank : vers des agents LLM généralisés via un réglage fin sur plus de 50 000 trajectoires d'interaction Song et al. arXiv. [papier]
[2024/10] RLEF : CODE DE MISE À LA TERRE LLMS EN RÉTROACTION D'EXÉCUTION AVEC APPRENTISSAGE PAR RENFORCEMENT Gehring et al. arXiv. [papier]
[2024/10] Mieux que votre professeur : des agents LLM qui apprennent grâce aux commentaires privilégiés sur l'IA Choudhury et al. arXiv. [papier]
[2024/10] AMR-Evol : l'évolution de la réponse modulaire adaptative entraîne une meilleure distillation des connaissances pour les grands modèles de langage dans la génération de code Luo et al. arXiv. [papier] [dépôt]
[2024/10] RGD : Débogueur d'agent basé sur plusieurs LLM via le raffinement et le guidage de génération Jin et al. arXiv. [papier]
[2024/09] AutoSafeCoder : un cadre multi-agents pour sécuriser la génération de code LLM via l'analyse statique et les tests Fuzz Nunez et al. arXiv [papier] [dépôt]
[2024/09] Un cadre de programmation en binôme pour la génération de code via l'exploration multi-plan et le raffinement piloté par rétroaction Zhang et al. arXiv [papier] [dépôt]
[2024/08] Passer au crible l'ivraie : utilisation des commentaires d'exécution pour classer les codes candidats générés Sun et al. arXiv [papier]
[2024/08] CODEXGRAPH : relier les grands modèles de langage et les référentiels de code via des bases de données Code Graph Liu et al. arXiv. [papier] [dépôt]
[2024/07] OPENHANDS : UNE PLATEFORME OUVERTE POUR LES DÉVELOPPEURS DE LOGICIELS D'IA EN TANT QU'AGENTS GÉNÉRALISTES Wang et al. arXiv [papier] [dépôt]
[2024/05] Génération de code au niveau de la classe à partir du langage naturel à l'aide d'un raisonnement itératif et amélioré par des outils sur un référentiel. Deshpande et coll. arXiv. [papier]
[2024/05] MapCoder : génération de code multi-agents pour une résolution de problèmes compétitive. Islam et coll. LCA. [papier] [dépôt]
[2024/05] AutoCoder : amélioration du modèle de code en grand langage avec AIEV-INSTRUCT. Lei et coll. arXiv. [papier] [dépôt]
[2024/04] 3DGen : génération assistée par l'IA d'analyseurs de format binaire dont la correction est prouvée . Fakhoury et coll. arXiv [papier]
[2024/04] Agents auto-organisés : un cadre multi-agent LLM vers la génération et l'optimisation de code à très grande échelle. Ishibashi et coll. arXiv. [papier] [dépôt]
[2024/03] AutoDev : développement automatisé basé sur l'IA . Tufano et coll. arXiv [papier]
[2024/03] CoCoST : Génération automatique de codes complexes avec recherche en ligne et tests d'exactitude. Lui et coll. arXiv. [papier]
[2024/03] RAT : La récupération des pensées augmentées suscite un raisonnement contextuel dans la génération à long horizon . Wang et coll. arXiv. [papier] [dépôt]
[2024/02] Les actions de code exécutable génèrent de meilleurs agents LLM. Wang et coll. CIML. [papier] [dépôt]
[2024/02] Plus d’agents sont tout ce dont vous avez besoin. Li et coll. arXiv. [papier]
[2024/02] Développement piloté par les tests pour la génération de code. Mathews et coll. arXiv. [papier] [dépôt]
[2024/02] LDB : un débogueur de modèle de langage étendu via la vérification de l'exécution du runtime étape par étape. Zhong et coll. arXiv. [papier] [dépôt]
[2024/01] CodeAgent : amélioration de la génération de code avec des systèmes d'agents intégrés à des outils pour les défis de codage au niveau des dépôts dans le monde réel. Zhang et coll. LCA. [papier]
[2024/01] Enseigner aux LLM de code à utiliser les outils d'auto-complétion dans la génération de code au niveau du référentiel. Wang et coll. arXiv. [papier]
[2024/01] Génération de code avec AlphaCodium : de l'ingénierie rapide à l'ingénierie des flux. Ridnik et coll. arXiv. [papier] [dépôt]
[2023/12] AgentCoder : génération de code basée sur plusieurs agents avec tests et optimisation itératifs. Huang et coll. arXiv. [papier]
[2023/12] LLM4TDD : Meilleures pratiques pour le développement piloté par les tests à l'aide de grands modèles de langage. Piya et coll. arXiv. [papier] [dépôt]
[2023/11] INTERVENANT : Stimuler la capacité de codage de grands modèles de langage avec la chaîne de réparation interactive. Wang et coll. LCA. [papier] [dépôt]
[2023/10] Réseau dynamique LLM-agent : un cadre de collaboration LLM-agent avec optimisation de l'équipe d'agents. Liu et coll. arXiv. [papier] [dépôt]
[2023/10] Lemur : Harmonisation du langage naturel et du code pour les agents linguistiques. Xu et coll. ICLR. [papier] [dépôt]
[2023/10] ClarifyGPT : permettre la génération de code basée sur LLM avec une clarification de l'intention. Mu et coll. arXiv. [papier] [dépôt]
[2023/10] CODECHAIN : VERS LA GÉNÉRATION DE CODE MODULAIRE PAR CHAÎNE D'AUTO-RÉVISIONS AVEC SOUS-MODULES REPRÉSENTANTS. Le et al. ICLR. [papier] [dépôt]
[2023/10] La recherche dans l'arborescence des agents linguistiques unifie le raisonnement, l'action et la planification dans les modèles linguistiques. Zhou et coll. CIML. [papier] [dépôt]
[2023/09] MINT : ÉVALUATION DES LLMS EN INTERACTION MULTI-TOURS AVEC DES OUTILS ET DES RETOURS LINGUISTIQUES. Wang et coll. ICLR. [papier] [dépôt]
[2023/09] Compréhension de la programmation basée sur des cas de test dans de grands modèles de langage pour une meilleure génération de code. Tian et coll. arXiv. [papier]
[2023/09] CodePlan : codage au niveau du référentiel à l'aide de LLM et de planification. Bairi et coll. FSE. [papier] [dépôt]
[2023/09] De l'abus à la maîtrise : améliorer la génération de code grâce au chaînage de l'IA basé sur les connaissances. Ren et coll. ASS. [papier]
[2023/09] Parsel ? : Raisonnement algorithmique avec des modèles de langage en composant des décompositions. Zelikman et coll. NeuroIPS. [papier] [dépôt]
[2023/08] AutoGen : Activation des applications LLM de nouvelle génération via une conversation multi-agents. Wu et coll. arXiv. [papier] [dépôt]
[2023/08] Gentopia : une plateforme collaborative pour les LLM augmentés par des outils. Xu et coll. EMNLP. [papier] [dépôt]
[2023/08] Flux : éléments constitutifs du raisonnement et de l'IA collaborative. Josifoski et coll. arXiv. [papier] [dépôt]
[2023/08] CodeCoT : lutte contre les erreurs de syntaxe du code dans le raisonnement CoT pour la génération de code. Huang et coll. arXiv. [papier]
[2023/06] SELFEVOLVE : un cadre d'évolution de code via de grands modèles de langage. Jiang et coll. arXiv. [papier]
[2023/06] InterCode : normalisation et analyse comparative du codage interactif avec retour d'exécution. Yang et coll. NeuroIPS. [papier] [dépôt]
[2023/06] L'AUTO-RÉPARATION EST-ELLE UNE BALLE D'ARGENT POUR LA GÉNÉRATION DE CODE ?. Olausson et coll. ICLR. [papier] [dépôt]
[2023/05] ToolCoder : Apprenez aux modèles de génération de code à utiliser les outils de recherche d'API. Zhang et coll. arXiv. [papier]
[2023/05] Auto-édition : éditeur de code sensible aux erreurs pour la génération de code . Zhang et coll. LCA. [papier]
[2023/04] Enseigner l'auto-débogage de grands modèles de langage. Chen et coll. ICLR. [papier]
[2023/04] Programmation entièrement autonome avec de grands modèles de langage. Liventsev et al. GECCO. [papier]
[2023/03] CAMEL : Agents de communication pour l'exploration « mentale » de la société modèle de langage large. Li et coll. NeuroIPS. [papier] [dépôt]
[2023/03] Réflexion : Agents linguistiques avec apprentissage par renforcement verbal. Shinn et coll. NeuroIPS. [papier] [dépôt]
[2023/03] AUTO-AFFINE : raffinement itératif avec auto-rétroaction. Madaan et coll. NeuroIPS. [papier] [dépôt]
[2024/10] Génération automatisée de preuves pour Rust Code via Self-Evolution Chen et al. arXiv [papier]
[2024/09] AutoVerus : génération automatisée de preuves pour Rust Code Yang et al. arXiv [papier]
[2024/10] Tirer parti de modèles linguistiques affinés pour un audit de contrat intelligent efficace et précis Wei et al. arXiv [papier] [dépôt]
[2024/10] LLM-SmartAudit : Détection avancée des vulnérabilités des contrats intelligents Wei et al. arXiv. [papier] [dépôt]
[2024/05] Analyse statique assistée par LLM pour la détection des vulnérabilités de sécurité. Li et coll. arXiv. [papier]
[2024/05] PropertyGPT : vérification formelle des contrats intelligents basée sur LLM via la génération de propriétés augmentée par récupération. Liu et coll. arXiv. [papier] [dépôt]
[2024/03] Consensus multirôle grâce aux discussions LLM pour la détection des vulnérabilités. Mao et coll. QRS. [papier]
[2024/03] Combinaison d'agents de réglage fin et basés sur LLM pour un audit intuitif de contrats intelligents avec justifications. Ma et coll. arXiv. [papier] [dépôt]
[2024/02] Quand l'analyse des flux de données rencontre les grands modèles linguistiques. Wang et coll. arXiv. [papier]
[2024/01] LLM4Vuln : un cadre d'évaluation unifié pour découpler et améliorer le raisonnement sur la vulnérabilité des LLM. Sun et coll. arXiv. [papier] [dépôt]
[2023/12] E&V : inciter les grands modèles de langage à effectuer une analyse statique par exécution et vérification de pseudo-code. Hao et coll. arXiv. [papier]
[2023/10] Détection des vulnérabilités des contrats intelligents basée sur un grand modèle linguistique : nouvelles perspectives. Hu et coll. TPS-ISA. [papier] [dépôt]
[2023/10] Analyse de code statique à l'ère de l'IA : une exploration approfondie du concept, de la fonction et du potentiel de l'analyse de code intelligent. Fan et coll. arXiv. [papier]
[2023/08] Amélioration de l'analyse statique pour la détection pratique des bogues : une approche intégrée au LLM. Li et coll. arXiv. [papier] [dépôt]
[2023/03] ART : Raisonnement automatique en plusieurs étapes et utilisation d'outils pour les grands modèles de langage. Paranjape et coll. arXiv. [papier] [dépôt]
[2024/10] Agent en tant que juge : évaluez les agents avec les agents Zhuge et al. arXiv. [papier] [dépôt]
[2024/09] Diviser pour mieux régner : automatisation des révisions de code via la localisation et la révision Wang et al. ACM Trans. Logiciel. Ing. Méthode. [papier]
[2024/04] Révision de code basée sur l'IA avec des LLM : premiers résultats. Rasheed et coll. arXiv. [papier]
[2024/02] CodeAgent : Agents collaboratifs pour le génie logiciel. Tang et coll. arXiv. [papier] [dépôt]
[2023/10] Analyse de code statique à l'ère de l'IA : une exploration approfondie du concept, de la fonction et du potentiel de l'analyse de code intelligent. Fan et coll. arXiv. [papier]
[2023/09] CORE : Résolution des problèmes de qualité du code à l'aide de LLM. Wadhwa et coll. FSE. [papier] [dépôt]
[2024/11] ReAccept : coévolution automatisée du code de production et de test basée sur la validation dynamique et de grands modèles de langage Chi et al. arXiv [papier] [dépôt]
[2024/09] Exécution symbolique Python avec génération de code basée sur LLM Wang et al. arXiv [papier]
[2024/06] Mokav : tests différentiels basés sur l'exécution avec des LLM. Etemadi et coll. arXiv. [papier] [dépôt]
[2024/04] Amélioration de la génération de tests basés sur LLM pour les branches difficiles à couvrir via l'analyse de programme. Yang et coll. arXiv. [papier]
[2024/03] AutoDev : développement automatisé basé sur l'IA . Tufano et coll. arXiv [papier]
[2024/03] COVERUP : Génération de tests basés sur LLM guidée par la couverture. Pizzorno et coll. arXiv. [papier] [dépôt]
[2023/08] Génération de tests efficaces à l'aide de modèles de langage étendus pré-entraînés et de tests de mutation. Dakhel et coll. Inf. Logiciel. Technologie. . [papier] [dépôt]
[2023/05] Plus de tests manuels ? Évaluation et amélioration de ChatGPT pour la génération de tests unitaires. Yuan et coll. arXiv. [papier] [dépôt]
[2023/05] ChatUniTest : un cadre pour la génération de tests basés sur LLM. Chen et coll. FSE. [papier] [dépôt]
[2023/02] Une évaluation empirique de l'utilisation de grands modèles de langage pour la génération automatisée de tests unitaires. Schäfer et al. IEEETrans. Ingénierie logicielle. [papier] [dépôt]
[2024/11] Un système amélioré par code Knowledge Graph pour la génération de pilotes Fuzz basée sur LLM Xu et al. arXiv. [papier]
[2024/07] Tests d'interface graphique mobile automatisés basés sur la vision via un modèle multimodal en grand langage. Liu et coll. arXiv. [papier] [dépôt]
[2024/04] Les agents LLM peuvent exploiter de manière autonome les vulnérabilités d'un jour. Fang et coll. arXiv. [papier]
[2024/02] Vous pouvez vous reposer maintenant : inférence de spécifications automatisée et tests en boîte noire des API RESTful avec de grands modèles de langage. Decrop et coll. arXiv. [papier] [dépôt]
[2024/01] XUAT-Copilot : système collaboratif multi-agents pour les tests automatisés d'acceptation des utilisateurs avec un grand modèle linguistique. Wang et coll. arXiv. [papier]
[2024/01] KernelGPT : amélioration du fuzzing du noyau via de grands modèles de langage. Yang et coll. arXiv. [papier]
[2023/11] Tests d'interface graphique mobile basés sur l'intention avec des agents autonomes de modèles de langage étendus . Yoon et coll. STIC. [papier] [dépôt]
[2023/10] Faites de LLM un expert en tests : apporter une interaction de type humain aux tests d'interface graphique mobile via des décisions tenant compte des fonctionnalités. Liu et coll. ICSE. [papier]
[2023/10] AXNav : Rejouer les tests d'accessibilité à partir du langage naturel. Taeb et coll. CHI. [papier]
[2023/10] Fuzzing du compilateur en boîte blanche optimisé par de grands modèles de langage. Yang et coll. arXiv. [papier] [dépôt]
[2023/10] Tester les limites : génération d'entrées de texte inhabituelles pour la détection des pannes d'applications mobiles avec un grand modèle linguistique. Liu et coll. ICSE. [papier] [dépôt]
[2023/08] PENTESTGPT : un outil de test d'intrusion automatique optimisé par LLM. Deng et coll. arXiv. [papier] [dépôt]
[2023/08] Fuzz4All : Fuzzing universel avec de grands modèles de langage. Xia et coll. ICSE. [papier] [dépôt]
[2023/07] Isoler les bogues du compilateur en générant des programmes témoins efficaces avec de grands modèles de langage. Tu et coll. IEEETrans. Logiciel Ing. [papier] [dépôt]
[2023/06] Des invites sont tout ce dont vous avez besoin : relecture automatisée des bogues Android avec de grands modèles de langage. Feng et coll. ICSE. [papier] [dépôt]
[2024/11] FlexFL : localisation flexible et efficace des défauts avec des modèles de langage larges open source Xu et al. arXiv [papier]
[2024/09] Amélioration de la localisation des défauts grâce à l'analyse de code ordonnée avec des agents LLM et l'auto-réflexion Rafi et al. arXiv [papier]
[2024/03] AGENTFL : Adaptation de la localisation des défauts basée sur LLM au contexte au niveau du projet. Qin et coll. arXiv. [papier]
[2023/10] RCAgent : Analyse des causes profondes du cloud par des agents autonomes avec des modèles de langage étendus augmentés par des outils. Wang et coll. arXiv. [papier]
[2023/08] Une évaluation quantitative et qualitative de la localisation des défauts explicables basée sur LLM . Kang et coll. FSE. [papier]
[2024/07] OPENHANDS : UNE PLATEFORME OUVERTE POUR LES DÉVELOPPEURS DE LOGICIELS D'IA EN TANT QU'AGENTS GÉNÉRALISTES Wang et al. arXiv [papier] [dépôt]
[2024/10] Recherche guidée sémantique pour une réparation efficace des programmes avec de grands modèles de langage Thanh et al. arXiv [papier]
[2024/09] Réparation neurosymbolique de la desquamation test . Chen et coll. ISSTA. [papier]
[2024/04] Jusqu'où pouvons-nous aller avec la réparation pratique des programmes au niveau des fonctions ?. Xiang et coll. arXiv. [papier] [dépôt]
[2024/03] RepairAgent : un agent autonome basé sur LLM pour la réparation de programmes. Bouzénia et al. arXiv. [papier]
[2024/03] ACFIX : Guider les LLM avec des pratiques RBAC communes extraites pour la réparation contextuelle des vulnérabilités de contrôle d'accès dans les contrats intelligents. Zhang et coll. arXiv. [papier]
[2024/02] CigaR : réparation de programmes rentable avec les LLM. Hidvégi et al. arXiv. [papier] [dépôt]
[2023/04] Débogage automatisé explicable via le débogage scientifique basé sur un grand modèle de langage. Kang et coll. arXiv. [papier]
[2023/04] Poursuivez la conversation : correction de 162 bogues sur 337 pour 0,42 $ chacun à l'aide de ChatGPT. Xia et coll. arXiv. [papier]
[2023/01] Réparation de programmes automatisés conversationnels. Xia et coll. arXiv. [papier]
[2024/04] Une approche de débogage unifiée via une synergie multi-agents basée sur LLM. Lee et coll. arXiv. [papier] [dépôt]
[2024/02] LDB : un débogueur de modèle de langage étendu via la vérification de l'exécution du runtime étape par étape. Zhong et coll. arXiv. [papier] [dépôt]
[2024/08] GoNoGo : un système multi-agent efficace basé sur LLM pour rationaliser la prise de décision en matière de publication de logiciels automobiles Khoee et al. arXiv [papier]
[2024/09] Génération du couplage de code Java avec ChatGPT Zhao et al. Informatique théorique [article]
[2024/07] Renforcer le développement de logiciels génératifs basés sur Agile grâce au travail d'équipe homme-IA Zhang et al. TOSEM [papier] [dépôt]
[2024/06] Expérimentation du développement de logiciels multi-agents : vers une plate-forme unifiée Sami et al. arXiv. [papier]
[2024/06] Mise à l'échelle de la collaboration multi-agents basée sur un grand modèle de langage Qian et al. arXiv. [papier] [dépôt]
[2024/06] Développement de logiciels multi-agents grâce à la collaboration entre équipes. Du et coll. arXiv. [papier] [dépôt]
[2024/06] AgileCoder : agents collaboratifs dynamiques pour le développement de logiciels basés sur la méthodologie Agile. Nguyen et coll. arXiv. [papier] [dépôt]
[2024/05] Raffinement de l'expérience itérative des agents de développement de logiciels. Qian et coll. arXiv. [papier]
[2024/03] Quand la génération de code basée sur LLM rencontre le processus de développement logiciel. Lin et coll. arXiv. [papier] [dépôt]
[2024/03] CodeS : langage naturel vers référentiel de codes via une esquisse multicouche. Zan et coll. arXiv. [papier] [dépôt]
[2024/02] CodePori : modèle à grande échelle pour le développement de logiciels autonomes à l'aide de multi-agents. Rasheed et coll. arXiv. [papier]
[2024/01] Expérimenter une nouvelle pratique de programmation avec les LLM. Zhang et coll. arXiv. [papier] [dépôt]
[2024/01] LLM4PLC : Exploitation de grands modèles de langage pour la programmation vérifiable des automates dans les systèmes de contrôle industriels. Fakih et coll. ICSE. [papier] [dépôt]
[2023/12] Co-apprentissage expérientiel des agents de développement de logiciels. Qian et coll. LCA. [papier] [dépôt]
[2023/11] Agents autonomes dans le développement de logiciels : un document de vision Rasheed et al. arXiv. [papier]
[2023/09] AutoAgents : un cadre pour la génération automatique d'agents. Chen et coll. arXiv. [papier] [dépôt]
[2023/08] AgentVerse : faciliter la collaboration multi-agents et explorer les comportements émergents. Chen et coll. ICLR. [papier] [dépôt]
[2023/08] METAGPT : MÉTA-PROGRAMMATION POUR UN CADRE COLLABORATIF MULTI-AGENTS. Hong et coll. ICLR. [papier] [dépôt]
[2023/07] Agents de communication pour le développement de logiciels. Qian et coll. LCA. [papier] [dépôt]
[2023/06] COLLABORATION MULTI-AGENTS : Exploiter la puissance des agents LLM intelligents. Talebirad et coll. arXiv. [papier]
[2023/06] Prompt Sapper : Infrastructure de génie logiciel optimisée par LLM pour les services natifs d'IA. Xing et coll. arXiv. [papier]
[2023/04] Génération de code en auto-collaboration via ChatGPT. Dong et coll. arXiv. [papier] [dépôt]
[2023/04] LLM Low-code : Programmation visuelle sur LLM. Cai et coll. arXiv. [papier] [dépôt]
[2024/11] Les LLM en tant qu'apprenants continus : améliorer la reproduction du code défectueux dans les problèmes logiciels Lin et al. arXiv [papier]
[2024/11] Agents de développement de logiciels Human-In-the-Loop Takerngsaksiri et al. arXiv [papier]
[2024/11] Lingma SWE-GPT : un modèle de langage ouvert centré sur les processus de développement pour l'amélioration automatisée des logiciels Ma et al. arXiv [papier] [dépôt]
[2024/10] RepoGraph : Améliorer l'ingénierie logicielle de l'IA avec un code Graph au niveau du référentiel Ouyang et al. arXiv [papier] [dépôt]
[2024/09] Agent MarsCode : correction automatisée de bogues native par l'IA Liu et al. arXiv. [papier]
[2024/08] CODEXGRAPH : relier les grands modèles de langage et les référentiels de code via des bases de données Code Graph Liu et al. arXiv. [papier] [dépôt]
[2024/08] LA DIVERSITÉ PERMET L'INTELLIGENCE : INTÉGRATION DE L'EXPERTISE DES AGENTS D'INGÉNIERIE LOGICIEL Zhang et al. arXiv. [papier]
[2024/08] SpecRover : Extraction d'intentions de code via LLM Ruan et al. arXiv. [papier] [dépôt]
[2024/07] OPENHANDS : UNE PLATEFORME OUVERTE POUR LES DÉVELOPPEURS DE LOGICIELS D'IA EN TANT QU'AGENTS GÉNÉRALISTES Wang et al. arXiv [papier] [dépôt]
[2024/07] Sans agent : démystifier les agents de génie logiciel basés sur LLM. Xia et coll. arXiv. [papier] [dépôt]
[2024/06] Comment comprendre l'ensemble du référentiel de logiciels ?. Ma et coll. arXiv. [papier] [dépôt]
[2024/06] CODEUR : RÉSOLUTION DE PROBLÈMES AVEC DES GRAPHIQUES MULTI-AGENTS ET TÂCHES. Chen et coll. arXiv. [papier] [dépôt]
[2024/06] MASAI : Architecture modulaire pour les agents d'IA en génie logiciel. Arora et coll. arXiv. [papier]
[2024/05] SWE-AGENT : LES INTERFACES AGENT-ORDINATEUR PERMETTENT L'INGÉNIERIE LOGICIELLE AUTOMATISÉE. Yang et coll. arXiv. [papier] [dépôt]
[2024/04] AutoCodeRover : Amélioration du programme autonome. Zhang et coll. ISSTA. [papier] [dépôt]
[2024/03] MAGIS : cadre multi-agent basé sur LLM pour la résolution des problèmes GitHub. Tao et coll. arXiv. [papier]
Référence
[2024/10] SWE-Bench+ : référence de codage améliorée pour les LLM Aleithan et al. arXiv. [papier]
[2024/10] SWE-bench Multimodal : les systèmes d'IA se généralisent-ils aux domaines logiciels visuels ? Yang et coll. arXiv. [papier] [dépôt]
[2024/08] SWE-bench-java : un test de résolution de problèmes GitHub pour Java Zan et al. arXiv [papier] [dépôt]
[2024/07] Sans agent : démystifier les agents de génie logiciel basés sur LLM. Xia et coll. arXiv. [papier] [dépôt]
[2023/10] Swe-bench : les modèles de langage peuvent-ils résoudre les problèmes réels de Github ? Jiménez et coll. ICLR [article] [dépôt]
Planification en un seul tour
[2024/06] AgileCoder : agents collaboratifs dynamiques pour le développement de logiciels basés sur la méthodologie Agile. Nguyen et coll. arXiv. [papier] [dépôt]
[2024/06] Développement de logiciels multi-agents grâce à la collaboration entre équipes. Du et coll. arXiv. [papier] [dépôt]
[2024/05] MapCoder : génération de code multi-agents pour une résolution de problèmes compétitive. Islam et coll. LCA. [papier] [dépôt]
[2024/03] MAGIS : cadre multi-agent basé sur LLM pour la résolution des problèmes GitHub. Tao et coll. arXiv. [papier]
[2024/03] CodeS : langage naturel vers référentiel de codes via une esquisse multicouche. Zan et coll. arXiv. [papier] [dépôt]
[2024/03] CoCoST : Génération automatique de codes complexes avec recherche en ligne et tests d'exactitude. Lui et coll. arXiv. [papier]
[2024/02] CodePori : modèle à grande échelle pour le développement de logiciels autonomes à l'aide de multi-agents. Rasheed et coll. arXiv. [papier]
[2024/01] CodeAgent : amélioration de la génération de code avec des systèmes d'agents intégrés à des outils pour les défis de codage au niveau des dépôts dans le monde réel. Zhang et coll. LCA. [papier]
[2024/01] LLM4PLC : Exploitation de grands modèles de langage pour la programmation vérifiable des automates dans les systèmes de contrôle industriels. Fakih et coll. ICSE. [papier] [dépôt]
[2024/01] Expérimenter une nouvelle pratique de programmation avec les LLM. Zhang et coll. arXiv. [papier] [dépôt]
[2023/11] Agents autonomes dans le développement de logiciels : un document de vision Rasheed et al. arXiv. [papier]
[2023/10] Analyse de code statique à l'ère de l'IA : une exploration approfondie du concept, de la fonction et du potentiel de l'analyse de code intelligent. Fan et coll. arXiv. [papier]
[2023/09] Parsel ? : Raisonnement algorithmique avec des modèles de langage en composant des décompositions. Zelikman et coll. NeuroIPS. [papier] [dépôt]
[2023/08] PENTESTGPT : un outil de test d'intrusion automatique optimisé par LLM. Deng et coll. arXiv. [papier] [dépôt]
[2023/08] Flux : éléments constitutifs du raisonnement et de l'IA collaborative. Josifoski et coll. arXiv. [papier] [dépôt]
[2023/08] METAGPT : MÉTA-PROGRAMMATION POUR UN CADRE COLLABORATIF MULTI-AGENTS. Hong et coll. ICLR. [papier] [dépôt]
[2023/07] Agents de communication pour le développement de logiciels. Qian et coll. LCA. [papier] [dépôt]
[2023/04] Génération de code en auto-collaboration via ChatGPT. Dong et coll. arXiv. [papier] [dépôt]
[2023/04] LLM Low-code : Programmation visuelle sur LLM. Cai et coll. arXiv. [papier] [dépôt]
Planification multi-tours
[2024/03] RAT : La récupération des pensées augmentées suscite un raisonnement contextuel dans la génération à long horizon . Wang et coll. arXiv. [papier] [dépôt]
Réagir comme
[2024/06] MASAI : Architecture modulaire pour les agents d'IA en génie logiciel. Arora et coll. arXiv. [papier]
[2024/02] Les actions de code exécutable génèrent de meilleurs agents LLM. Wang et coll. CIML. [papier] [dépôt]
[2024/01] CodeAgent : amélioration de la génération de code avec des systèmes d'agents intégrés à des outils pour les défis de codage au niveau des dépôts dans le monde réel. Zhang et coll. LCA. [papier]
[2024/01] XUAT-Copilot : système collaboratif multi-agents pour les tests automatisés d'acceptation des utilisateurs avec un grand modèle linguistique. Wang et coll. arXiv. [papier]
[2023/11] Tests d'interface graphique mobile basés sur l'intention avec des agents autonomes de modèles de langage étendus . Yoon et coll. STIC. [papier] [dépôt]
[2023/10] RCAgent : Analyse des causes profondes du cloud par des agents autonomes avec des modèles de langage étendus augmentés par des outils. Wang et coll. arXiv. [papier]
[2023/10] La recherche dans l'arborescence des agents linguistiques unifie le raisonnement, l'action et la planification dans les modèles linguistiques. Zhou et coll. CIML. [papier] [dépôt]
[2023/10] AXNav : Rejouer les tests d'accessibilité à partir du langage naturel. Taeb et coll. CHI. [papier]
[2023/09] CodePlan : codage au niveau du référentiel à l'aide de LLM et de planification. Bairi et coll. FSE. [papier] [dépôt]
En couches
[2024/04] Agents auto-organisés : un cadre multi-agent LLM vers la génération et l'optimisation de code à très grande échelle. Ishibashi et coll. arXiv. [papier] [dépôt]
Mémoire à long terme
[2024/06] Mise à l'échelle de la collaboration multi-agents basée sur un grand modèle de langage Qian et al. arXiv. [papier] [dépôt]
[2024/06] Développement de logiciels multi-agents grâce à la collaboration entre équipes. Du et coll. arXiv. [papier] [dépôt]
[2024/05] Raffinement de l'expérience itérative des agents de développement de logiciels. Qian et coll. arXiv. [papier]
[2023/12] Co-apprentissage expérientiel des agents de développement de logiciels. Qian et coll. LCA. [papier] [dépôt]
[2023/11] Tests d'interface graphique mobile basés sur l'intention avec des agents autonomes de modèles de langage étendus . Yoon et coll. STIC. [papier] [dépôt]
[2023/09] AutoAgents : un cadre pour la génération automatique d'agents. Chen et coll. arXiv. [papier] [dépôt]
[2023/08] METAGPT : MÉTA-PROGRAMMATION POUR UN CADRE COLLABORATIF MULTI-AGENTS. Hong et coll. ICLR. [papier] [dépôt]
[2023/07] Agents de communication pour le développement de logiciels. Qian et coll. LCA. [papier] [dépôt]
[2023/03] Réflexion : Agents linguistiques avec apprentissage par renforcement verbal. Shinn et coll. NeuroIPS. [papier] [dépôt]
Mémoire à court terme
[2024/07] Tests d'interface graphique mobile automatisés basés sur la vision via un modèle multimodal en grand langage. Liu et coll. arXiv. [papier] [dépôt]
[2024/06] Mise à l'échelle de la collaboration multi-agents basée sur un grand modèle de langage Qian et al. arXiv. [papier] [dépôt]
[2024/06] Développement de logiciels multi-agents grâce à la collaboration entre équipes. Du et coll. arXiv. [papier] [dépôt]
[2024/06] AgileCoder : agents collaboratifs dynamiques pour le développement de logiciels basés sur la méthodologie Agile. Nguyen et coll. arXiv. [papier] [dépôt]
[2024/04] Agents auto-organisés : un cadre multi-agent LLM vers la génération et l'optimisation de code à très grande échelle. Ishibashi et coll. arXiv. [papier] [dépôt]
[2024/03] MAGIS : cadre multi-agent basé sur LLM pour la résolution des problèmes GitHub. Tao et coll. arXiv. [papier]
[2024/01] XUAT-Copilot : système collaboratif multi-agents pour les tests automatisés d'acceptation des utilisateurs avec un grand modèle linguistique. Wang et coll. arXiv. [papier]
[2023/12] E&V : inciter les grands modèles de langage à effectuer une analyse statique par exécution et vérification de pseudo-code. Hao et coll. arXiv. [papier]
[2023/11] Tests d'interface graphique mobile basés sur l'intention avec des agents autonomes de modèles de langage étendus . Yoon et coll. STIC. [papier] [dépôt]
[2023/10] RCAgent : Analyse des causes profondes du cloud par des agents autonomes avec des modèles de langage étendus augmentés par des outils. Wang et coll. arXiv. [papier]
[2023/10] Analyse de code statique à l'ère de l'IA : une exploration approfondie du concept, de la fonction et du potentiel de l'analyse de code intelligent. Fan et coll. arXiv. [papier]
[2023/10] Faites de LLM un expert en tests : apporter une interaction de type humain aux tests d'interface graphique mobile via des décisions tenant compte des fonctionnalités. Liu et coll. ICSE. [papier]
[2023/09] CodePlan : codage au niveau du référentiel à l'aide de LLM et de planification. Bairi et coll. FSE. [papier] [dépôt]
[2023/09] AutoAgents : un cadre pour la génération automatique d'agents. Chen et coll. arXiv. [papier] [dépôt]
[2023/08] METAGPT : MÉTA-PROGRAMMATION POUR UN CADRE COLLABORATIF MULTI-AGENTS. Hong et coll. ICLR. [papier] [dépôt]
[2023/07] Agents de communication pour le développement de logiciels. Qian et coll. LCA. [papier] [dépôt]
[2023/03] Réflexion : Agents linguistiques avec apprentissage par renforcement verbal. Shinn et coll. NeuroIPS. [papier] [dépôt]
Mémoire partagée : un type particulier de mémoire à court terme
[2024/06] AgileCoder : agents collaboratifs dynamiques pour le développement de logiciels basés sur la méthodologie Agile. Nguyen et coll. arXiv. [papier] [dépôt]
[2024/05] MARE : Cadre de collaboration multi-agents pour l'ingénierie des exigences. Jin et coll. arXiv. [papier]
[2024/03] Quand la génération de code basée sur LLM rencontre le processus de développement logiciel. Lin et coll. arXiv. [papier] [dépôt]
[2024/03] AGENTFL : Adaptation de la localisation des défauts basée sur LLM au contexte au niveau du projet. Qin et coll. arXiv. [papier]
[2023/08] METAGPT : MÉTA-PROGRAMMATION POUR UN CADRE COLLABORATIF MULTI-AGENTS. Hong et coll. ICLR. [papier] [dépôt]
[2023/04] Génération de code en auto-collaboration via ChatGPT. Dong et coll. arXiv. [papier] [dépôt]
Entrée visuelle
[2024/10] SWE-bench Multimodal : les systèmes d'IA se généralisent-ils aux domaines logiciels visuels ? Yang et coll. arXiv. [papier] [dépôt]
[2024/07] Tests d'interface graphique mobile automatisés basés sur la vision via un modèle multimodal en grand langage. Liu et coll. arXiv. [papier] [dépôt]
[2024/06] Expérimentation du développement de logiciels multi-agents : vers une plate-forme unifiée Sami et al. arXiv. [papier]
[2024/01] XUAT-Copilot : système collaboratif multi-agents pour les tests automatisés d'acceptation des utilisateurs avec un grand modèle linguistique. Wang et coll. arXiv. [papier]
[2023/10] AXNav : Rejouer les tests d'accessibilité à partir du langage naturel. Taeb et coll. CHI. [papier]
[2023/10] Tester les limites : génération d'entrées de texte inhabituelles pour la détection des pannes d'applications mobiles avec un grand modèle linguistique. Liu et coll. ICSE. [papier] [dépôt]
[2023/08] METAGPT : MÉTA-PROGRAMMATION POUR UN CADRE COLLABORATIF MULTI-AGENTS. Hong et coll. ICLR. [papier] [dépôt]
Outils de recherche
[2024/05] Génération de code au niveau de la classe à partir du langage naturel à l'aide d'un raisonnement itératif et amélioré par des outils sur un référentiel. Deshpande et coll. arXiv. [papier]
[2024/04] Les agents LLM peuvent exploiter de manière autonome les vulnérabilités d'un jour. Fang et coll. arXiv. [papier]
[2024/03] AutoDev : développement automatisé basé sur l'IA . Tufano et coll. arXiv [papier]
[2024/03] RepairAgent : un agent autonome basé sur LLM pour la réparation de programmes. Bouzénia et al. arXiv. [papier]
[2024/03] CoCoST : Génération automatique de codes complexes avec recherche en ligne et tests d'exactitude. Lui et coll. arXiv. [papier]
[2024/03] RAT : La récupération des pensées augmentées suscite un raisonnement contextuel dans la génération à long horizon . Wang et coll. arXiv. [papier] [dépôt]
[2024/02] CodePori : modèle à grande échelle pour le développement de logiciels autonomes à l'aide de multi-agents. Rasheed et coll. arXiv. [papier]
[2024/01] LLM4Vuln : un cadre d'évaluation unifié pour découpler et améliorer le raisonnement sur la vulnérabilité des LLM. Sun et coll. arXiv. [papier] [dépôt]
[2024/01] CodeAgent : amélioration de la génération de code avec des systèmes d'agents intégrés à des outils pour les défis de codage au niveau des dépôts dans le monde réel. Zhang et coll. LCA. [papier]
[2023/12] E&V : inciter les grands modèles de langage à effectuer une analyse statique par exécution et vérification de pseudo-code. Hao et coll. arXiv. [papier]
[2023/12] Co-apprentissage expérientiel des agents de développement de logiciels. Qian et coll. LCA. [papier] [dépôt]
[2023/11] Tests d'interface graphique mobile basés sur l'intention avec des agents autonomes de modèles de langage étendus . Yoon et coll. STIC. [papier] [dépôt]
[2023/10] Lemur : Harmonisation du langage naturel et du code pour les agents linguistiques. Xu et coll. ICLR. [papier] [dépôt]
[2023/10] RCAgent : Analyse des causes profondes du cloud par des agents autonomes avec des modèles de langage étendus augmentés par des outils. Wang et coll. arXiv. [papier]
[2023/10] Analyse de code statique à l'ère de l'IA : une exploration approfondie du concept, de la fonction et du potentiel de l'analyse de code intelligent. Fan et coll. arXiv. [papier]
[2023/08] METAGPT : MÉTA-PROGRAMMATION POUR UN CADRE COLLABORATIF MULTI-AGENTS. Hong et coll. ICLR. [papier] [dépôt]
[2023/08] PENTESTGPT : un outil de test d'intrusion automatique optimisé par LLM. Deng et coll. arXiv. [papier] [dépôt]
[2023/08] AgentVerse : faciliter la collaboration multi-agents et explorer les comportements émergents. Chen et coll. ICLR. [papier] [dépôt]
[2023/08] Gentopia : une plateforme collaborative pour les LLM augmentés par des outils. Xu et coll. EMNLP. [papier] [dépôt]
[2023/08] AutoGen : Activation des applications LLM de nouvelle génération via une conversation multi-agents. Wu et coll. arXiv. [papier] [dépôt]
[2023/05] ToolCoder : Apprenez aux modèles de génération de code à utiliser les outils de recherche d'API. Zhang et coll. arXiv. [papier]
[2023/03] ART : Raisonnement automatique en plusieurs étapes et utilisation d'outils pour les grands modèles de langage. Paranjape et coll. arXiv. [papier] [dépôt]
Opération sur les fichiers
[2024/08] SpecRover : Extraction d'intentions de code via LLM Ruan et al. arXiv. [papier] [dépôt]
[2024/06] MASAI : Architecture modulaire pour les agents d'IA en génie logiciel. Arora et coll. arXiv. [papier]
[2024/05] Analyse statique assistée par LLM pour la détection des vulnérabilités de sécurité. Li et coll. arXiv. [papier]
[2024/05] SWE-AGENT : LES INTERFACES AGENT-ORDINATEUR PERMETTENT L'INGÉNIERIE LOGICIELLE AUTOMATISÉE. Yang et coll. arXiv. [papier] [dépôt]
[2024/04] Les agents LLM peuvent exploiter de manière autonome les vulnérabilités d'un jour. Fang et coll. arXiv. [papier]
[2024/03] RepairAgent : un agent autonome basé sur LLM pour la réparation de programmes. Bouzénia et al. arXiv. [papier]
[2024/03] AutoDev : développement automatisé basé sur l'IA . Tufano et coll. arXiv [papier]
[2023/04] Débogage automatisé explicable via le débogage scientifique basé sur un grand modèle de langage. Kang et coll. arXiv. [papier]
Fonctionnement de l'interface graphique
[2024/07] Tests d'interface graphique mobile automatisés basés sur la vision via un modèle multimodal en grand langage. Liu et coll. arXiv. [papier] [dépôt]
[2024/01] XUAT-Copilot : système collaboratif multi-agents pour les tests automatisés d'acceptation des utilisateurs avec un grand modèle linguistique. Wang et coll. arXiv. [papier]
[2023/10] Faites de LLM un expert en tests : apporter une interaction de type humain aux tests d'interface graphique mobile via des décisions tenant compte des fonctionnalités. Liu et coll. ICSE. [papier]
[2023/10] AXNav : Rejouer les tests d'accessibilité à partir du langage naturel. Taeb et coll. CHI. [papier]
[2023/10] Tester les limites : génération d'entrées de texte inhabituelles pour la détection des pannes d'applications mobiles avec un grand modèle linguistique. Liu et coll. ICSE. [papier] [dépôt]
[2023/06] Des invites sont tout ce dont vous avez besoin : relecture automatisée des bogues Android avec de grands modèles de langage. Feng et coll. ICSE. [papier] [dépôt]
Analyse du programme statique
[2024/06] Développement de logiciels multi-agents grâce à la collaboration entre équipes. Du et coll. arXiv. [papier] [dépôt]
[2024/06] AgileCoder : agents collaboratifs dynamiques pour le développement de logiciels basés sur la méthodologie Agile. Nguyen et coll. arXiv. [papier] [dépôt]
[2024/06] MASAI : Architecture modulaire pour les agents d'IA en génie logiciel. Arora et coll. arXiv. [papier]
[2024/05] Génération de code au niveau de la classe à partir du langage naturel à l'aide d'un raisonnement itératif et amélioré par des outils sur un référentiel. Deshpande et coll. arXiv. [papier]
[2024/05] Analyse statique assistée par LLM pour la détection des vulnérabilités de sécurité. Li et coll. arXiv. [papier]
[2024/04] AutoCodeRover : Amélioration du programme autonome. Zhang et coll. ISSTA. [papier] [dépôt]
[2024/04] Amélioration de la génération de tests basés sur LLM pour les branches difficiles à couvrir via l'analyse de programme. Yang et coll. arXiv. [papier]
[2024/04] 3DGen : génération assistée par l'IA d'analyseurs de format binaire dont la correction est prouvée . Fakhoury et coll. arXiv [papier]
[2024/03] AutoDev : développement automatisé basé sur l'IA . Tufano et coll. arXiv [papier]
[2024/03] RepairAgent : un agent autonome basé sur LLM pour la réparation de programmes. Bouzénia et al. arXiv. [papier]
[2024/03] COVERUP : Génération de tests basés sur LLM guidée par la couverture. Pizzorno et coll. arXiv. [papier] [dépôt]
[2024/03] ACFIX : Guider les LLM avec des pratiques RBAC communes extraites pour la réparation contextuelle des vulnérabilités de contrôle d'accès dans les contrats intelligents. Zhang et coll. arXiv. [papier]
[2024/03] AGENTFL : Adaptation de la localisation des défauts basée sur LLM au contexte au niveau du projet. Qin et coll. arXiv. [papier]
[2024/02] Quand l'analyse des flux de données rencontre les grands modèles linguistiques. Wang et coll. arXiv. [papier]
[2024/02] LDB : un débogueur de modèle de langage étendu via la vérification de l'exécution du runtime étape par étape. Zhong et coll. arXiv. [papier] [dépôt]
[2024/01] Enseigner aux LLM de code à utiliser les outils d'auto-complétion dans la génération de code au niveau du référentiel. Wang et coll. arXiv. [papier]
[2024/01] CodeAgent : amélioration de la génération de code avec des systèmes d'agents intégrés à des outils pour les défis de codage au niveau des dépôts dans le monde réel. Zhang et coll. LCA. [papier]
[2024/01] LLM4PLC : Exploitation de grands modèles de langage pour la programmation vérifiable des automates dans les systèmes de contrôle industriels. Fakih et coll. ICSE. [papier] [dépôt]
[2023/12] E&V : inciter les grands modèles de langage à effectuer une analyse statique par exécution et vérification de pseudo-code. Hao et coll. arXiv. [papier]
[2023/09] CodePlan : codage au niveau du référentiel à l'aide de LLM et de planification. Bairi et coll. FSE. [papier] [dépôt]
[2023/08] CodeCoT : lutte contre les erreurs de syntaxe du code dans le raisonnement CoT pour la génération de code. Huang et coll. arXiv. [papier]
[2023/07] Isoler les bogues du compilateur en générant des programmes témoins efficaces avec de grands modèles de langage. Tu et coll. IEEETrans. Ingénierie logicielle. [papier] [dépôt]
[2023/06] Des invites sont tout ce dont vous avez besoin : relecture automatisée des bogues Android avec de grands modèles de langage. Feng et coll. ICSE. [papier] [dépôt]
Analyse dynamique
[2024/04] Amélioration de la génération de tests basés sur LLM pour les branches difficiles à couvrir via l'analyse de programme. Yang et coll. arXiv. [papier]
[2024/03] COVERUP : Génération de tests basés sur LLM guidée par la couverture. Pizzorno et coll. arXiv. [papier] [dépôt]
[2024/03] AGENTFL : Adaptation de la localisation des défauts basée sur LLM au contexte au niveau du projet. Qin et coll. arXiv. [papier]
[2024/02] LDB : un débogueur de modèle de langage étendu via la vérification de l'exécution du runtime étape par étape. Zhong et coll. arXiv. [papier] [dépôt]
[2023/07] Isoler les bogues du compilateur en générant des programmes témoins efficaces avec de grands modèles de langage. Tu et coll. IEEETrans. Ingénierie logicielle. [papier] [dépôt]
[2023/04] Débogage automatisé explicable via le débogage scientifique basé sur un grand modèle de langage. Kang et coll. arXiv. [papier]
Outils de test
[2024/09] Réparation neurosymbolique de la desquamation test . Chen et coll. ISSTA. [papier]
[2024/08] SpecRover : Extraction d'intentions de code via LLM Ruan et al. arXiv. [papier] [dépôt]
[2024/06] AgileCoder : agents collaboratifs dynamiques pour le développement de logiciels basés sur la méthodologie Agile. Nguyen et coll. arXiv. [papier] [dépôt]
[2024/06] MASAI : Architecture modulaire pour les agents d'IA en génie logiciel. Arora et coll. arXiv. [papier]
[2024/05] AutoCoder : amélioration du modèle de code en grand langage avec AIEV-INSTRUCT. Lei et coll. arXiv. [papier] [dépôt]
[2024/05] MapCoder : génération de code multi-agents pour une résolution de problèmes compétitive. Islam et coll. LCA. [papier] [dépôt]
[2024/04] Agents auto-organisés : un cadre multi-agent LLM vers la génération et l'optimisation de code à très grande échelle. Ishibashi et coll. arXiv. [papier] [dépôt]
[2024/04] Une approche de débogage unifiée via une synergie multi-agents basée sur LLM. Lee et coll. arXiv. [papier] [dépôt]
[2024/04] Les agents LLM peuvent exploiter de manière autonome les vulnérabilités d'un jour. Fang et coll. arXiv. [papier]
[2024/04] Amélioration de la génération de tests basés sur LLM pour les branches difficiles à couvrir via l'analyse de programme. Yang et coll. arXiv. [papier]
[2024/04] 3DGen : génération assistée par l'IA d'analyseurs de format binaire dont la correction est prouvée . Fakhoury et coll. arXiv [papier]
[2024/04] AutoCodeRover : Amélioration du programme autonome. Zhang et coll. ISSTA. [papier] [dépôt]
[2024/03] AutoDev : développement automatisé basé sur l'IA . Tufano et coll. arXiv [papier]
[2024/03] Quand la génération de code basée sur LLM rencontre le processus de développement logiciel. Lin et coll. arXiv. [papier] [dépôt]
[2024/03] RepairAgent : un agent autonome basé sur LLM pour la réparation de programmes. Bouzénia et al. arXiv. [papier]
[2024/03] CoCoST : Génération automatique de codes complexes avec recherche en ligne et tests d'exactitude. Lui et coll. arXiv. [papier]
[2024/02] Les actions de code exécutable génèrent de meilleurs agents LLM. Wang et coll. CIML. [papier] [dépôt]
[2024/02] Développement piloté par les tests pour la génération de code. Mathews et coll. arXiv. [papier] [dépôt]
[2024/01] Génération de code avec AlphaCodium : de l'ingénierie rapide à l'ingénierie des flux. Ridnik et coll. arXiv. [papier] [dépôt]
[2024/01] Expérimenter une nouvelle pratique de programmation avec les LLM. Zhang et coll. arXiv. [papier] [dépôt]
[2024/01] CodeAgent : amélioration de la génération de code avec des systèmes d'agents intégrés à des outils pour les défis de codage au niveau des dépôts dans le monde réel. Zhang et coll. LCA. [papier]
[2023/12] AgentCoder : génération de code basée sur plusieurs agents avec tests et optimisation itératifs. Huang et coll. arXiv. [papier]
[2023/12] LLM4TDD : Meilleures pratiques pour le développement piloté par les tests à l'aide de grands modèles de langage. Piya et coll. arXiv. [papier] [dépôt]
[2023/11] INTERVENANT : Stimuler la capacité de codage de grands modèles de langage avec la chaîne de réparation interactive. Wang et coll. LCA. [papier] [dépôt]
[2023/10] ClarifyGPT : permettre la génération de code basée sur LLM avec une clarification de l'intention. Mu et coll. arXiv. [papier] [dépôt]
[2023/10] Lemur : Harmonisation du langage naturel et du code pour les agents linguistiques. Xu et coll. ICLR. [papier] [dépôt]
[2023/10] Fuzzing du compilateur en boîte blanche optimisé par de grands modèles de langage. Yang et coll. arXiv. [papier] [dépôt]
[2023/09] Compréhension de la programmation basée sur des cas de test dans de grands modèles de langage pour une meilleure génération de code. Tian et coll. arXiv. [papier]
[2023/09] MINT : ÉVALUATION DES LLMS EN INTERACTION MULTI-TOURS AVEC DES OUTILS ET DES RETOURS LINGUISTIQUES. Wang et coll. ICLR. [papier] [dépôt]
[2023/08] METAGPT : MÉTA-PROGRAMMATION POUR UN CADRE COLLABORATIF MULTI-AGENTS. Hong et coll. ICLR. [papier] [dépôt]
[2023/08] Génération de tests efficaces à l'aide de modèles de langage étendus pré-entraînés et de tests de mutation. Dakhel et coll. Inf. Logiciel. Technologie. . [papier] [dépôt]
[2023/08] AgentVerse : faciliter la collaboration multi-agents et explorer les comportements émergents. Chen et coll. ICLR. [papier] [dépôt]
[2023/08] AutoGen : Activation des applications LLM de nouvelle génération via une conversation multi-agents. Wu et coll. arXiv. [papier] [dépôt]
[2023/08] Flux : éléments constitutifs du raisonnement et de l'IA collaborative. Josifoski et coll. arXiv. [papier] [dépôt]
[2023/06] SELFEVOLVE : un cadre d'évolution de code via de grands modèles de langage. Jiang et coll. arXiv. [papier]
[2023/06] InterCode : normalisation et analyse comparative du codage interactif avec retour d'exécution. Yang et coll. NeuroIPS. [papier] [dépôt]
[2023/06] L'AUTO-RÉPARATION EST-ELLE UNE BALLE D'ARGENT POUR LA GÉNÉRATION DE CODE ?. Olausson et coll. ICLR. [papier] [dépôt]
[2023/05] Plus de tests manuels ? Évaluation et amélioration de ChatGPT pour la génération de tests unitaires. Yuan et coll. arXiv. [papier] [dépôt]
[2023/04] Programmation entièrement autonome avec de grands modèles de langage. Liventsev et al. GECCO. [papier]
[2023/04] Débogage automatisé explicable via le débogage scientifique basé sur un grand modèle de langage. Kang et coll. arXiv. [papier]
[2023/03] ART : Raisonnement automatique en plusieurs étapes et utilisation d'outils pour les grands modèles de langage. Paranjape et coll. arXiv. [papier] [dépôt]
[2023/03] Réflexion : Agents linguistiques avec apprentissage par renforcement verbal. Shinn et coll. NeuroIPS. [papier] [dépôt]
[2023/02] Une évaluation empirique de l'utilisation de grands modèles de langage pour la génération automatisée de tests unitaires. Schäfer et al. IEEETrans. Ingénierie logicielle. [papier] [dépôt]
[2023/01] Réparation de programmes automatisés conversationnels. Xia et coll. arXiv. [papier]
Outils de localisation des défauts
[2024/04] AutoCodeRover : Amélioration du programme autonome. Zhang et coll. ISSTA. [papier] [dépôt]
[2024/03] RepairAgent : un agent autonome basé sur LLM pour la réparation de programmes. Bouzénia et al. arXiv. [papier]
Rôles de gestionnaire
[2024/06] AgileCoder : agents collaboratifs dynamiques pour le développement de logiciels basés sur la méthodologie Agile. Nguyen et coll. arXiv. [papier] [dépôt]
[2024/05] Raffinement de l'expérience itérative des agents de développement de logiciels. Qian et coll. arXiv. [papier]
[2024/05] MapCoder : génération de code multi-agents pour une résolution de problèmes compétitive. Islam et coll. LCA. [papier] [dépôt]
[2024/04] Agents auto-organisés : un cadre multi-agent LLM vers la génération et l'optimisation de code à très grande échelle. Ishibashi et coll. arXiv. [papier] [dépôt]
[2024/04] 3DGen : génération assistée par l'IA d'analyseurs de format binaire dont la correction est prouvée . Fakhoury et coll. arXiv [papier]
[2024/03] MAGIS : cadre multi-agent basé sur LLM pour la résolution des problèmes GitHub. Tao et coll. arXiv. [papier]
[2024/03] Quand la génération de code basée sur LLM rencontre le processus de développement logiciel. Lin et coll. arXiv. [papier] [dépôt]
[2024/02] CodeAgent : Agents collaboratifs pour le génie logiciel. Tang et coll. arXiv. [papier] [dépôt]
[2024/02] CodePori : modèle à grande échelle pour le développement de logiciels autonomes à l'aide de multi-agents. Rasheed et coll. arXiv. [papier]
[2023/12] Co-apprentissage expérientiel des agents de développement de logiciels. Qian et coll. LCA. [papier] [dépôt]
[2023/11] Agents autonomes dans le développement de logiciels : un document de vision Rasheed et al. arXiv. [papier]
[2023/11] Tests d'interface graphique mobile basés sur l'intention avec des agents autonomes de modèles de langage étendus . Yoon et coll. STIC. [papier] [dépôt]
[2023/10] AXNav : Rejouer les tests d'accessibilité à partir du langage naturel. Taeb et coll. CHI. [papier]
[2023/10] RCAgent : Analyse des causes profondes du cloud par des agents autonomes avec des modèles de langage étendus augmentés par des outils. Wang et coll. arXiv. [papier]
[2023/09] AutoAgents : un cadre pour la génération automatique d'agents. Chen et coll. arXiv. [papier] [dépôt]
[2023/08] METAGPT : MÉTA-PROGRAMMATION POUR UN CADRE COLLABORATIF MULTI-AGENTS. Hong et coll. ICLR. [papier] [dépôt]
[2023/04] LLM Low-code : Programmation visuelle sur LLM. Cai et coll. arXiv. [papier] [dépôt]
[2023/03] CAMEL : Agents de communication pour l'exploration « mentale » de la société modèle de langage large. Li et coll. NeuroIPS. [papier] [dépôt]
Rôles d'analyse des exigences
[2024/06] Expérimentation du développement de logiciels multi-agents : vers une plate-forme unifiée Sami et al. arXiv. [papier]
[2024/06] AgileCoder : agents collaboratifs dynamiques pour le développement de logiciels basés sur la méthodologie Agile. Nguyen et coll. arXiv. [papier] [dépôt]
[2024/05] MARE : Cadre de collaboration multi-agents pour l'ingénierie des exigences. Jin et coll. arXiv. [papier]
[2024/04] Elicitron : Un cadre de simulation basé sur un agent LLM pour l'élicitation des exigences de conception. Ataei et coll. arXiv. [papier]
[2024/03] Quand la génération de code basée sur LLM rencontre le processus de développement logiciel. Lin et coll. arXiv. [papier] [dépôt]
[2024/01] Expérimenter une nouvelle pratique de programmation avec les LLM. Zhang et coll. arXiv. [papier] [dépôt]
[2023/11] Agents autonomes dans le développement de logiciels : un document de vision Rasheed et al. arXiv. [papier]
[2023/10] Analyse de code statique à l'ère de l'IA : une exploration approfondie du concept, de la fonction et du potentiel de l'analyse de code intelligent. Fan et coll. arXiv. [papier]
[2023/08] METAGPT : MÉTA-PROGRAMMATION POUR UN CADRE COLLABORATIF MULTI-AGENTS. Hong et coll. ICLR. [papier] [dépôt]
[2023/06] COLLABORATION MULTI-AGENTS : Exploiter la puissance des agents LLM intelligents. Talebirad et coll. arXiv. [papier]
[2023/04] Génération de code en auto-collaboration via ChatGPT. Dong et coll. arXiv. [papier] [dépôt]
[2023/03] CAMEL : Agents de communication pour l'exploration « mentale » de la société modèle de langage large. Li et coll. NeuroIPS. [papier] [dépôt]
Rôles de concepteur
[2024/06] Expérimentation du développement de logiciels multi-agents : vers une plate-forme unifiée Sami et al. arXiv. [papier]
[2024/03] Quand la génération de code basée sur LLM rencontre le processus de développement logiciel. Lin et coll. arXiv. [papier] [dépôt]
[2024/01] Expérimenter une nouvelle pratique de programmation avec les LLM. Zhang et coll. arXiv. [papier] [dépôt]
[2023/11] Agents autonomes dans le développement de logiciels : un document de vision Rasheed et al. arXiv. [papier]
[2023/08] METAGPT : MÉTA-PROGRAMMATION POUR UN CADRE COLLABORATIF MULTI-AGENTS. Hong et coll. ICLR. [papier] [dépôt]
[2023/08] AgentVerse : faciliter la collaboration multi-agents et explorer les comportements émergents. Chen et coll. ICLR. [papier] [dépôt]
[2023/07] Agents de communication pour le développement de logiciels. Qian et coll. LCA. [papier] [dépôt]
[2023/06] COLLABORATION MULTI-AGENTS : Exploiter la puissance des agents LLM intelligents. Talebirad et coll. arXiv. [papier]
Rôles de développeur
[2024/06] Expérimentation du développement de logiciels multi-agents : vers une plate-forme unifiée Sami et al. arXiv. [papier]
[2024/06] AgileCoder : agents collaboratifs dynamiques pour le développement de logiciels basés sur la méthodologie Agile. Nguyen et coll. arXiv. [papier] [dépôt]
[2024/05] AutoCoder : amélioration du modèle de code en grand langage avec AIEV-INSTRUCT. Lei et coll. arXiv. [papier] [dépôt]
[2024/05] MapCoder : génération de code multi-agents pour une résolution de problèmes compétitive. Islam et coll. LCA. [papier] [dépôt]
[2024/04] Agents auto-organisés : un cadre multi-agent LLM vers la génération et l'optimisation de code à très grande échelle. Ishibashi et coll. arXiv. [papier] [dépôt]
[2024/04] 3DGen : génération assistée par l'IA d'analyseurs de format binaire dont la correction est prouvée . Fakhoury et coll. arXiv [papier]
[2024/03] CodeS : langage naturel vers référentiel de codes via une esquisse multicouche. Zan et coll. arXiv. [papier] [dépôt]
[2024/03] MAGIS : cadre multi-agent basé sur LLM pour la résolution des problèmes GitHub. Tao et coll. arXiv. [papier]
[2024/03] Quand la génération de code basée sur LLM rencontre le processus de développement logiciel. Lin et coll. arXiv. [papier] [dépôt]
[2024/02] Développement piloté par les tests pour la génération de code. Mathews et coll. arXiv. [papier] [dépôt]
[2024/02] CodePori : modèle à grande échelle pour le développement de logiciels autonomes à l'aide de multi-agents. Rasheed et coll. arXiv. [papier]
[2024/01] Expérimenter une nouvelle pratique de programmation avec les LLM. Zhang et coll. arXiv. [papier] [dépôt]
[2023/12] AgentCoder : génération de code basée sur plusieurs agents avec tests et optimisation itératifs. Huang et coll. arXiv. [papier]
[2023/11] Agents autonomes dans le développement de logiciels : un document de vision Rasheed et al. arXiv. [papier]
[2023/11] INTERVENANT : Stimuler la capacité de codage de grands modèles de langage avec la chaîne de réparation interactive. Wang et coll. LCA. [papier] [dépôt]
[2023/08] AutoGen : Activation des applications LLM de nouvelle génération via une conversation multi-agents. Wu et coll. arXiv. [papier] [dépôt]
[2023/08] METAGPT : MÉTA-PROGRAMMATION POUR UN CADRE COLLABORATIF MULTI-AGENTS. Hong et coll. ICLR. [papier] [dépôt]
[2023/08] AgentVerse : faciliter la collaboration multi-agents et explorer les comportements émergents. Chen et coll. ICLR. [papier] [dépôt]
[2023/07] Agents de communication pour le développement de logiciels. Qian et coll. LCA. [papier] [dépôt]
[2023/06] L'AUTO-RÉPARATION EST-ELLE UNE BALLE D'ARGENT POUR LA GÉNÉRATION DE CODE ?. Olausson et coll. ICLR. [papier] [dépôt]
[2023/06] COLLABORATION MULTI-AGENTS : Exploiter la puissance des agents LLM intelligents. Talebirad et coll. arXiv. [papier]
[2023/05] Auto-édition : éditeur de code sensible aux erreurs pour la génération de code . Zhang et coll. LCA. [papier]
[2023/04] Génération de code en auto-collaboration via ChatGPT. Dong et coll. arXiv. [papier] [dépôt]
[2023/03] CAMEL : Agents de communication pour l'exploration « mentale » de la société modèle de langage large. Li et coll. NeuroIPS. [papier] [dépôt]
Rôles d'assurance qualité des logiciels
[2024/08] SpecRover : Extraction d'intentions de code via LLM Ruan et al. arXiv. [papier] [dépôt]
[2024/07] Tests d'interface graphique mobile automatisés basés sur la vision via un modèle multimodal en grand langage. Liu et coll. arXiv. [papier] [dépôt]
[2024/06] Expérimentation du développement de logiciels multi-agents : vers une plate-forme unifiée Sami et al. arXiv. [papier]
[2024/06] Développement de logiciels multi-agents grâce à la collaboration entre équipes. Du et coll. arXiv. [papier] [dépôt]
[2024/06] AgileCoder : agents collaboratifs dynamiques pour le développement de logiciels basés sur la méthodologie Agile. Nguyen et coll. arXiv. [papier] [dépôt]
[2024/06] MASAI : Architecture modulaire pour les agents d'IA en génie logiciel. Arora et coll. arXiv. [papier]
[2024/05] AutoCoder : amélioration du modèle de code en grand langage avec AIEV-INSTRUCT. Lei et coll. arXiv. [papier] [dépôt]
[2024/05] MapCoder : génération de code multi-agents pour une résolution de problèmes compétitive. Islam et coll. LCA. [papier] [dépôt]
[2024/04] Révision de code basée sur l'IA avec des LLM : premiers résultats. Rasheed et coll. arXiv. [papier]
[2024/04] 3DGen : génération assistée par l'IA d'analyseurs de format binaire dont la correction est prouvée . Fakhoury et coll. arXiv [papier]
[2024/04] Une approche de débogage unifiée via une synergie multi-agents basée sur LLM. Lee et coll. arXiv. [papier] [dépôt]
[2024/04] Jusqu'où pouvons-nous aller avec la réparation pratique des programmes au niveau des fonctions ?. Xiang et coll. arXiv. [papier] [dépôt]
[2024/03] MAGIS : cadre multi-agent basé sur LLM pour la résolution des problèmes GitHub. Tao et coll. arXiv. [papier]
[2024/03] AGENTFL : Adaptation de la localisation des défauts basée sur LLM au contexte au niveau du projet. Qin et coll. arXiv. [papier]
[2024/03] Combinaison d'agents de réglage fin et basés sur LLM pour un audit intuitif de contrats intelligents avec justifications. Ma et coll. arXiv. [papier] [dépôt]
[2024/03] Quand la génération de code basée sur LLM rencontre le processus de développement logiciel. Lin et coll. arXiv. [papier] [dépôt]
[2024/03] ACFIX : Guider les LLM avec des pratiques RBAC communes extraites pour la réparation contextuelle des vulnérabilités de contrôle d'accès dans les contrats intelligents. Zhang et coll. arXiv. [papier]
[2024/02] CodeAgent : Agents collaboratifs pour le génie logiciel. Tang et coll. arXiv. [papier] [dépôt]
[2024/02] Développement piloté par les tests pour la génération de code. Mathews et coll. arXiv. [papier] [dépôt]
[2024/02] CodePori : modèle à grande échelle pour le développement de logiciels autonomes à l'aide de multi-agents. Rasheed et coll. arXiv. [papier]
[2024/01] XUAT-Copilot : système collaboratif multi-agents pour les tests automatisés d'acceptation des utilisateurs avec un grand modèle linguistique. Wang et coll. arXiv. [papier]
[2023/12] AgentCoder : génération de code basée sur plusieurs agents avec tests et optimisation itératifs. Huang et coll. arXiv. [papier]
[2023/11] Agents autonomes dans le développement de logiciels : un document de vision Rasheed et al. arXiv. [papier]
[2023/11] Tests d'interface graphique mobile basés sur l'intention avec des agents autonomes de modèles de langage étendus . Yoon et coll. STIC. [papier] [dépôt]
[2023/10] Détection des vulnérabilités des contrats intelligents basée sur un grand modèle linguistique : nouvelles perspectives. Hu et coll. TPS-ISA. [papier] [dépôt]
[2023/10] Analyse de code statique à l'ère de l'IA : une exploration approfondie du concept, de la fonction et du potentiel de l'analyse de code intelligent. Fan et coll. arXiv. [papier]
[2023/10] Fuzzing du compilateur en boîte blanche optimisé par de grands modèles de langage. Yang et coll. arXiv. [papier] [dépôt]
[2023/10] AXNav : Rejouer les tests d'accessibilité à partir du langage naturel. Taeb et coll. CHI. [papier]
[2023/08] AutoGen : Activation des applications LLM de nouvelle génération via une conversation multi-agents. Wu et coll. arXiv. [papier] [dépôt]
[2023/08] METAGPT : MÉTA-PROGRAMMATION POUR UN CADRE COLLABORATIF MULTI-AGENTS. Hong et coll. ICLR. [papier] [dépôt]
[2023/07] Agents de communication pour le développement de logiciels. Qian et coll. LCA. [papier] [dépôt]
[2023/06] L'AUTO-RÉPARATION EST-ELLE UNE BALLE D'ARGENT POUR LA GÉNÉRATION DE CODE ?. Olausson et coll. ICLR. [papier] [dépôt]
[2023/06] COLLABORATION MULTI-AGENTS : Exploiter la puissance des agents LLM intelligents. Talebirad et coll. arXiv. [papier]
[2023/05] Auto-édition : éditeur de code sensible aux erreurs pour la génération de code . Zhang et coll. LCA. [papier]
[2023/03] CAMEL : Agents de communication pour l'exploration « mentale » de la société modèle de langage large. Li et coll. NeuroIPS. [papier] [dépôt]
Rôles d'assistant
[2024/08] LA DIVERSITÉ PERMET L'INTELLIGENCE : INTÉGRATION DE L'EXPERTISE DES AGENTS D'INGÉNIERIE LOGICIEL Zhang et al. arXiv. [papier]
[2024/08] SpecRover : Extraction d'intentions de code via LLM Ruan et al. arXiv. [papier] [dépôt]
[2024/06] MASAI : Architecture modulaire pour les agents d'IA en génie logiciel. Arora et coll. arXiv. [papier]
[2024/05] MapCoder : génération de code multi-agents pour une résolution de problèmes compétitive. Islam et coll. LCA. [papier] [dépôt]
[2024/03] MAGIS : cadre multi-agent basé sur LLM pour la résolution des problèmes GitHub. Tao et coll. arXiv. [papier]
[2024/03] CodeS : langage naturel vers référentiel de codes via une esquisse multicouche. Zan et coll. arXiv. [papier] [dépôt]
[2024/03] Combinaison d'agents de réglage fin et basés sur LLM pour un audit intuitif de contrats intelligents avec justifications. Ma et coll. arXiv. [papier] [dépôt]
[2023/10] Analyse de code statique à l'ère de l'IA : une exploration approfondie du concept, de la fonction et du potentiel de l'analyse de code intelligent. Fan et coll. arXiv. [papier]
Structure en couches
[2024/08] LA DIVERSITÉ PERMET L'INTELLIGENCE : INTÉGRATION DE L'EXPERTISE DES AGENTS D'INGÉNIERIE LOGICIEL Zhang et al. arXiv. [papier]
[2024/08] SpecRover : Extraction d'intentions de code via LLM Ruan et al. arXiv. [papier] [dépôt]
[2024/06] Expérimentation du développement de logiciels multi-agents : vers une plate-forme unifiée Sami et al. arXiv. [papier]
[2024/06] Mise à l'échelle de la collaboration multi-agents basée sur un grand modèle de langage Qian et al. arXiv. [papier] [dépôt]
[2024/06] Développement de logiciels multi-agents grâce à la collaboration entre équipes. Du et coll. arXiv. [papier] [dépôt]
[2024/06] AgileCoder : agents collaboratifs dynamiques pour le développement de logiciels basés sur la méthodologie Agile. Nguyen et coll. arXiv. [papier] [dépôt]
[2024/05] MapCoder : génération de code multi-agents pour une résolution de problèmes compétitive. Islam et coll. LCA. [papier] [dépôt]
[2024/05] MARE : Cadre de collaboration multi-agents pour l'ingénierie des exigences. Jin et coll. arXiv. [papier]
[2024/04] AutoCodeRover : Amélioration du programme autonome. Zhang et coll. ISSTA. [papier] [dépôt]
[2024/04] Jusqu'où pouvons-nous aller avec la réparation pratique des programmes au niveau des fonctions ?. Xiang et coll. arXiv. [papier] [dépôt]
[2024/03] CodeS : langage naturel vers référentiel de codes via une esquisse multicouche. Zan et coll. arXiv. [papier] [dépôt]
[2024/03] Quand la génération de code basée sur LLM rencontre le processus de développement logiciel. Lin et coll. arXiv. [papier] [dépôt]
[2024/03] AGENTFL : Adaptation de la localisation des défauts basée sur LLM au contexte au niveau du projet. Qin et coll. arXiv. [papier]
[2024/02] Quand l'analyse des flux de données rencontre les grands modèles linguistiques. Wang et coll. arXiv. [papier]
[2024/02] CodeAgent : Agents collaboratifs pour le génie logiciel. Tang et coll. arXiv. [papier] [dépôt]
[2024/02] Plus d’agents sont tout ce dont vous avez besoin. Li et coll. arXiv. [papier]
[2024/01] Expérimenter une nouvelle pratique de programmation avec les LLM. Zhang et coll. arXiv. [papier] [dépôt]
[2023/11] Agents autonomes dans le développement de logiciels : un document de vision Rasheed et al. arXiv. [papier]
[2023/10] Analyse de code statique à l'ère de l'IA : une exploration approfondie du concept, de la fonction et du potentiel de l'analyse de code intelligent. Fan et coll. arXiv. [papier]
[2023/10] Détection des vulnérabilités des contrats intelligents basée sur un grand modèle linguistique : nouvelles perspectives. Hu et coll. TPS-ISA. [papier] [dépôt]
[2023/10] Fuzzing du compilateur en boîte blanche optimisé par de grands modèles de langage. Yang et coll. arXiv. [papier] [dépôt]
[2023/10] Réseau dynamique LLM-agent : un cadre de collaboration LLM-agent avec optimisation de l'équipe d'agents. Liu et coll. arXiv. [papier] [dépôt]
[2023/08] METAGPT : MÉTA-PROGRAMMATION POUR UN CADRE COLLABORATIF MULTI-AGENTS. Hong et coll. ICLR. [papier] [dépôt]
[2023/08] Flux : éléments constitutifs du raisonnement et de l'IA collaborative. Josifoski et coll. arXiv. [papier] [dépôt]
[2023/07] Agents de communication pour le développement de logiciels. Qian et coll. LCA. [papier] [dépôt]
[2023/05] Auto-édition : éditeur de code sensible aux erreurs pour la génération de code . Zhang et coll. LCA. papier
[2023/04] LLM Low-code : Programmation visuelle sur LLM. Cai et coll. arXiv. [papier] [dépôt]
Structure circulaire
[2024/05] AutoCoder : amélioration du modèle de code en grand langage avec AIEV-INSTRUCT. Lei et coll. arXiv. [papier] [dépôt]
[2024/04] Une approche de débogage unifiée via une synergie multi-agents basée sur LLM. Lee et coll. arXiv. [papier] [dépôt]
[2024/03] ACFIX : Guider les LLM avec des pratiques RBAC communes extraites pour la réparation contextuelle des vulnérabilités de contrôle d'accès dans les contrats intelligents. Zhang et coll. arXiv. [papier]
[2024/03] Consensus multirôle grâce aux discussions LLM pour la détection des vulnérabilités. Mao et coll. QRS. [papier]
[2024/03] Combinaison d'agents de réglage fin et basés sur LLM pour un audit intuitif de contrats intelligents avec justifications. Ma et coll. arXiv. [papier] [dépôt]
[2024/02] Développement piloté par les tests pour la génération de code. Mathews et coll. arXiv. [papier] [dépôt]
[2024/02] CodePori : modèle à grande échelle pour le développement de logiciels autonomes à l'aide de multi-agents. Rasheed et coll. arXiv. [papier]
[2023/12] Co-apprentissage expérientiel des agents de développement de logiciels. Qian et coll. LCA. [papier] [dépôt]
[2023/12] AgentCoder : génération de code basée sur plusieurs agents avec tests et optimisation itératifs. Huang et coll. arXiv. [papier]
[2023/11] INTERVENANT : Stimuler la capacité de codage de grands modèles de langage avec la chaîne de réparation interactive. Wang et coll. LCA. [papier] [dépôt]
[2023/11] Tests d'interface graphique mobile basés sur l'intention avec des agents autonomes de modèles de langage étendus . Yoon et coll. STIC. [papier] [dépôt]
[2023/10] AXNav : Rejouer les tests d'accessibilité à partir du langage naturel. Taeb et coll. CHI. [papier]
[2023/06] L'AUTO-RÉPARATION EST-ELLE UNE BALLE D'ARGENT POUR LA GÉNÉRATION DE CODE ?. Olausson et coll. ICLR. [papier] [dépôt]
[2023/03] CAMEL : Agents de communication pour l'exploration « mentale » de la société modèle de langage large. Li et coll. NeuroIPS. [papier] [dépôt]
[2023/03] Réflexion : Agents linguistiques avec apprentissage par renforcement verbal. Shinn et coll. NeuroIPS. [papier] [dépôt]
Structure arborescente
[2024/06] Mise à l'échelle de la collaboration multi-agents basée sur un grand modèle de langage Qian et al. arXiv. [papier] [dépôt]
[2024/06] MASAI : Architecture modulaire pour les agents d'IA en génie logiciel. Arora et coll. arXiv. [papier]
[2024/04] Agents auto-organisés : un cadre multi-agent LLM vers la génération et l'optimisation de code à très grande échelle. Ishibashi et coll. arXiv. [papier] [dépôt]
Structure en forme d'étoile
[2024/06] Mise à l'échelle de la collaboration multi-agents basée sur un grand modèle de langage Qian et al. arXiv. [papier] [dépôt]
[2024/03] AutoDev : développement automatisé basé sur l'IA . Tufano et coll. arXiv [papier]
[2024/01] XUAT-Copilot : système collaboratif multi-agents pour les tests automatisés d'acceptation des utilisateurs avec un grand modèle linguistique. Wang et coll. arXiv. [papier]
[2023/10] RCAgent : Analyse des causes profondes du cloud par des agents autonomes avec des modèles de langage étendus augmentés par des outils. Wang et coll. arXiv. [papier]
[2023/08] AutoGen : Activation des applications LLM de nouvelle génération via une conversation multi-agents. Wu et coll. arXiv. [papier] [dépôt]
Structure maillée
[2024/06] Mise à l'échelle de la collaboration multi-agents basée sur un grand modèle de langage Qian et al. arXiv. [papier] [dépôt]
[2024/04] 3DGen : génération assistée par l'IA d'analyseurs de format binaire dont la correction est prouvée . Fakhoury et coll. arXiv [papier]
[2024/01] Expérimenter une nouvelle pratique de programmation avec les LLM. Zhang et coll. arXiv. [papier] [dépôt]
[2024/01] LLM4PLC : Exploitation de grands modèles de langage pour la programmation vérifiable des automates dans les systèmes de contrôle industriels. Fakih et coll. ICSE. [papier] [dépôt]
[2023/10] Analyse de code statique à l'ère de l'IA : une exploration approfondie du concept, de la fonction et du potentiel de l'analyse de code intelligent. Fan et coll. arXiv. [papier]
[2023/04] LLM Low-code : Programmation visuelle sur LLM. Cai et coll. arXiv. [papier] [dépôt]
[2024/05] MARE : Cadre de collaboration multi-agents pour l'ingénierie des exigences. Jin et coll. arXiv. [papier]
[2024/02] Les actions de code exécutable génèrent de meilleurs agents LLM. Wang et coll. CIML. [papier] [dépôt]
[2024/01] Expérimenter une nouvelle pratique de programmation avec les LLM. Zhang et coll. arXiv. [papier] [dépôt]
[2023/10] ClarifyGPT : permettre la génération de code basée sur LLM avec une clarification de l'intention. Mu et coll. arXiv. [papier] [dépôt]
[2023/06] Prompt Sapper : Infrastructure de génie logiciel optimisée par LLM pour les services natifs d'IA. Xing et coll. arXiv. [papier]
[2024/03] CodeS : langage naturel vers référentiel de codes via une esquisse multicouche. Zan et coll. arXiv. [papier] [dépôt]
[2024/01] LLM4PLC : Exploitation de grands modèles de langage pour la programmation vérifiable des automates dans les systèmes de contrôle industriels. Fakih et coll. ICSE. [papier] [dépôt]
[2023/09] MINT : ÉVALUATION DES LLMS EN INTERACTION MULTI-TOURS AVEC DES OUTILS ET DES RETOURS LINGUISTIQUES. Wang et coll. ICLR. [papier] [dépôt]
[2023/08] Flux : éléments constitutifs du raisonnement et de l'IA collaborative. Josifoski et coll. arXiv. [papier] [dépôt]
[2023/08] AutoGen : Activation des applications LLM de nouvelle génération via une conversation multi-agents. Wu et coll. arXiv. [papier] [dépôt]
[2024/01] Expérimenter une nouvelle pratique de programmation avec les LLM. Zhang et coll. arXiv. [papier] [dépôt]
[2023/08] Gentopia : une plateforme collaborative pour les LLM augmentés par des outils. Xu et coll. EMNLP. [papier] [dépôt]
[2023/06] Prompt Sapper : Infrastructure de génie logiciel optimisée par LLM pour les services natifs d'IA. Xing et coll. arXiv. [papier]
[2023/03] ART : Raisonnement automatique en plusieurs étapes et utilisation d'outils pour les grands modèles de langage. Paranjape et coll. arXiv. [papier] [dépôt]
@misc{Agent4SE, title={Agents basés sur des modèles de langage étendus pour le génie logiciel : une enquête}, author={Junwei Liu et Kaixin Wang et Yixuan Chen et Xin Peng et Zhenpeng Chen et Lingming Zhang et Yiling Lou}, année={2024}, eprint={2409.02977}, archivePrefix={arXiv}, PrimaryClass={cs.SE} , url={https://arxiv.org/abs/2409.02977}, }
Junwei Liu @To-D
Kaixin Wang @wkx228
Yixuan Chen @FloridaSpidee
N'hésitez pas à poser vos questions ou à nous faire part de vos suggestions via :
Junwei Liu : [email protected]