El reciente avance en los modelos de lenguaje grande (LLM) ha dado forma a un nuevo paradigma de agentes de IA, es decir, agentes basados en LLM. En comparación con los LLM independientes, los agentes basados en LLM amplían sustancialmente la versatilidad y experiencia de los LLM al mejorarlos con las capacidades de percibir y utilizar recursos y herramientas externos. Hasta la fecha, los agentes basados en LLM se han aplicado y han demostrado una eficacia notable en Ingeniería de Software (SE). La sinergia entre múltiples agentes y la interacción humana es aún más prometedora para abordar problemas complejos de SE del mundo real. En este trabajo, presentamos una encuesta completa y sistemática sobre agentes de SE basados en LLM. Recopilamos 106 artículos y los clasificamos desde dos perspectivas, es decir, la SE y la perspectiva del agente. Además, analizamos los desafíos abiertos y las direcciones futuras en este ámbito crítico.
? Resumimos sistemáticamente el progreso de Agent4SE desde las perspectivas tanto de las tareas de Ingeniería de Software como de la Arquitectura del Agente .
? Enlace en papel: Agentes basados en modelos de lenguaje grande para ingeniería de software: una encuesta
Este campo de investigación está evolucionando rápidamente; Destaca este repositorio para mantenerte al día con las actualizaciones.
[2024/09/04] Publicamos la primera versión de nuestra encuesta en arXiv.
Noticias
Perspectivas SE
Localización de fallas
Reparación del programa
Depuración unificada
Pruebas unitarias
Pruebas del sistema
Detección de errores estáticos
Revisión de código
Ingeniería de requisitos
Generación de código
Verificación
Comprobación de código estático
Pruebas
Depuración
Liberar
Desarrollo de software de extremo a extremo
Mantenimiento de software de extremo a extremo
Perspectivas de los agentes
Fase de planificación
Fase de Requisitos
Fase de desarrollo
Fase de Evaluación
Roles de agente
Mecanismo de colaboración
Planificación
Memoria
Percepción
Acción
Marco del agente
Sistema multiagente
Colaboración humano-agente
Citación
mantenedores
Contáctenos
Historia de las estrellas
[2024/05] MARE: Marco de colaboración multiagentes para ingeniería de requisitos. Jin et al. arXiv. [papel]
[2024/04] Elicitron: un marco de simulación basado en agentes LLM para la obtención de requisitos de diseño. Ataei et al. arXiv. [papel]
[2024/01] SpecGen: Generación automatizada de especificaciones de programas formales a través de modelos de lenguaje grandes. Ma et al. arXiv. [papel] [repositorio]
[2023/10] Avance de la ingeniería de requisitos a través de la IA generativa: evaluación del papel de los LLM. Arora et al. arXiv. [papel]
[2024/11] Programación basada en la planificación: un flujo de trabajo de programación de modelo de lenguaje grande Lei et al. arXiv [papel]
[2024/11] Cadena de programación: potenciación de modelos de lenguaje grandes para la generación de código geoespacial Hou et al. arXiv [papel]
[2024/10] Sandbox de lenguajes de programación múltiple para LLM Dou et al. arXiv [papel]
[2024/10] SceneGenAgent: Generación precisa de escenas industriales con el agente codificador Xia et al. arXiv [papel] [repositorio]
[2024/10] MCCoder: Optimización del control de movimiento con generación de código asistida por LLM y verificación rigurosa Li et al. arXiv [papel] [repositorio]
[2024/10] Agents4PLC: Automatización de la generación y verificación de códigos PLC de circuito cerrado en sistemas de control industrial utilizando Agents basados en LLM Liu et al. arXiv [papel] [repositorio]
[2024/10] Mejora del rendimiento del programa paralelo mediante la generación de código impulsada por DSL con optimizadores LLM Wei et al. arXiv. [papel]
[2024/10] AgentBank: Hacia agentes LLM generalizados mediante ajustes en más de 50000 trayectorias de interacción Song et al. arXiv. [papel]
[2024/10] RLEF: CÓDIGO DE PUESTA A TIERRA LLMS EN EJECUCIÓN RETROALIMENTACIÓN CON APRENDIZAJE POR REFUERZO Gehring et al. arXiv. [papel]
[2024/10] Mejor que su maestro: agentes de LLM que aprenden de la retroalimentación privilegiada de IA Choudhury et al. arXiv. [papel]
[2024/10] AMR-Evol: La evolución de la respuesta modular adaptativa genera una mejor destilación del conocimiento para modelos de lenguaje grandes en la generación de código Luo et al. arXiv. [papel] [repositorio]
[2024/10] RGD: Depurador de agentes basado en múltiples LLM mediante guía de refinamiento y generación Jin et al. arXiv. [papel]
[2024/09] AutoSafeCoder: un marco de múltiples agentes para asegurar la generación de código LLM mediante análisis estático y pruebas Fuzz Nunez et al. arXiv [papel] [repositorio]
[2024/09] Un marco de programación en pares para la generación de código mediante exploración de múltiples planes y refinamiento basado en retroalimentación Zhang et al. arXiv [papel] [repositorio]
[2024/08] Examinando la paja: sobre la utilización de comentarios de ejecución para clasificar los candidatos de código generado Sun et al. arXiv [papel]
[2024/08] CODEXGRAPH: Uniendo grandes modelos de lenguaje y repositorios de código a través de bases de datos de gráficos de código Liu et al. arXiv. [papel] [repositorio]
[2024/07] OPENHANDS: UNA PLATAFORMA ABIERTA PARA DESARROLLADORES DE SOFTWARE DE IA COMO AGENTES GENERALISTAS Wang et al. arXiv [papel] [repositorio]
[2024/05] Generación de código a nivel de clase a partir de lenguaje natural mediante razonamiento iterativo mejorado por herramientas a través del repositorio. Deshpande et al. arXiv. [papel]
[2024/05] MapCoder: Generación de código multiagente para la resolución competitiva de problemas. Islam y otros. LCA. [papel] [repositorio]
[2024/05] AutoCoder: Mejora del modelo de lenguaje grande de código con AIEV-INSTRUCT. Lei et al. arXiv. [papel] [repositorio]
[2024/04] 3DGen: Generación asistida por IA de analizadores de formato binario demostrablemente correctos . Fakhoury et al. arXiv [papel]
[2024/04] Agentes autoorganizados: un marco de LLM multiagente hacia la generación y optimización de código a ultra gran escala. Ishibashi et al. arXiv. [papel] [repositorio]
[2024/03] AutoDev: desarrollo automatizado impulsado por IA . Tufano et al. arXiv [papel]
[2024/03] CoCoST: Generación automática de códigos complejos con búsqueda en línea y pruebas de corrección. Él y otros. arXiv. [papel]
[2024/03] RAT: La recuperación de pensamientos aumentados provoca un razonamiento consciente del contexto en la generación de horizontes a largo plazo . Wang y cols. arXiv. [papel] [repositorio]
[2024/02] Las acciones de código ejecutable generan mejores agentes de LLM. Wang y cols. ICML. [papel] [repositorio]
[2024/02] Más agentes es todo lo que necesita. Li y col. arXiv. [papel]
[2024/02] Desarrollo basado en pruebas para la generación de código. Mathews y cols. arXiv. [papel] [repositorio]
[2024/02] LDB: un depurador de modelos de lenguaje grande mediante la verificación paso a paso de la ejecución del tiempo de ejecución. Zhong et al. arXiv. [papel] [repositorio]
[2024/01] CodeAgent: Mejora de la generación de código con sistemas de agentes integrados en herramientas para desafíos de codificación a nivel de repositorio del mundo real. Zhang et al. LCA. [papel]
[2024/01] Enseñanza de LLM de código para utilizar herramientas de autocompletado en la generación de código a nivel de repositorio. Wang y cols. arXiv. [papel]
[01/2024] Generación de código con AlphaCodium: de la ingeniería rápida a la ingeniería de flujo. Ridnik et al. arXiv. [papel] [repositorio]
[2023/12] AgentCoder: Generación de código basada en múltiples agentes con pruebas y optimización iterativas. Huang et al. arXiv. [papel]
[2023/12] LLM4TDD: Mejores prácticas para el desarrollo basado en pruebas utilizando modelos de lenguaje grandes. Piya et al. arXiv. [papel] [repositorio]
[2023/11] INTERVENTOR: Impulsar la capacidad de codificación de modelos de lenguaje grandes con la cadena interactiva de reparación. Wang y cols. LCA. [papel] [repositorio]
[2023/10] Red dinámica de agentes LLM: un marco de colaboración de agentes LLM con optimización del equipo de agentes. Liu y cols. arXiv. [papel] [repositorio]
[2023/10] Lemur: Armonización del lenguaje natural y el código para agentes lingüísticos. Xu et al. ICLR. [papel] [repositorio]
[2023/10] ClarifyGPT: Potenciar la generación de código basada en LLM con aclaración de intenciones. Mu et al. arXiv. [papel] [repositorio]
[2023/10] CODECHAIN: HACIA LA GENERACIÓN DE CÓDIGO MODULAR MEDIANTE CADENA DE AUTOREVISIONES CON SUBMÓDULOS REPRESENTATIVOS. Le et al. ICLR. [papel] [repositorio]
[2023/10] La búsqueda en el árbol de agentes lingüísticos unifica el razonamiento, la acción y la planificación en modelos lingüísticos. Zhou y cols. ICML. [papel] [repositorio]
[2023/09] MINT: EVALUACIÓN DE LLMS EN INTERACCIÓN MULTITURNOS CON HERRAMIENTAS Y RETROALIMENTACIÓN DEL LENGUAJE. Wang y cols. ICLR. [papel] [repositorio]
[2023/09] Comprensión de la programación basada en casos de prueba en modelos de lenguaje grandes para una mejor generación de código. Tian et al. arXiv. [papel]
[2023/09] CodePlan: Codificación a nivel de repositorio utilizando LLM y planificación. Bairi et al. FSE. [papel] [repositorio]
[2023/09] Del uso indebido al dominio: mejora de la generación de código con encadenamiento de IA basado en el conocimiento. Ren et al. PLAZA BURSÁTIL NORTEAMERICANA. [papel]
[2023/09] ¿Parsel?: Razonamiento algorítmico con modelos de lenguaje mediante la composición de descomposiciones. Zelikman et al. NeurIPS. [papel] [repositorio]
[2023/08] AutoGen: Habilitación de aplicaciones LLM de próxima generación a través de una conversación entre múltiples agentes. Wu et al. arXiv. [papel] [repositorio]
[2023/08] Gentopia: una plataforma colaborativa para LLM mejorados con herramientas. Xu et al. EMNLP. [papel] [repositorio]
[2023/08] Flujos: componentes básicos de la IA de razonamiento y colaboración. Josifoski et al. arXiv. [papel] [repositorio]
[2023/08] CodeCoT: Abordar los errores de sintaxis del código en el razonamiento de CoT para la generación de código. Huang et al. arXiv. [papel]
[2023/06] SELFEVOLVE: Un marco de evolución de código a través de modelos de lenguaje grandes. Jiang et al. arXiv. [papel]
[2023/06] InterCode: Estandarización y evaluación comparativa de la codificación interactiva con retroalimentación de ejecución. Yang et al. NeurIPS. [papel] [repositorio]
[2023/06] ¿ES LA AUTOREPARACIÓN UNA BALA DE PLATA PARA LA GENERACIÓN DE CÓDIGOS? Olausson et al. ICLR. [papel] [repositorio]
[2023/05] ToolCoder: Enseñe a los modelos de generación de código a utilizar herramientas de búsqueda API. Zhang et al. arXiv. [papel]
[2023/05] Autoedición: editor de código con reconocimiento de fallas para generación de código . Zhang et al. LCA. [papel]
[2023/04] Enseñanza de modelos de lenguaje grandes para la autodepuración. Chen et al. ICLR. [papel]
[2023/04] Programación totalmente autónoma con modelos de lenguaje grandes. Liventsev et al. GECCO. [papel]
[2023/03] CAMEL: Agentes comunicativos para la exploración “mente” de una gran sociedad modelo lingüística. Li y col. NeurIPS. [papel] [repositorio]
[2023/03] Reflexión: Agentes del lenguaje con aprendizaje por refuerzo verbal. Shinn et al. NeurIPS. [papel] [repositorio]
[2023/03] SELF-REFINE: Refinamiento iterativo con autorretroalimentación. Madaan et al. NeurIPS. [papel] [repositorio]
[2024/10] Generación de pruebas automatizada para código Rust mediante la autoevolución Chen et al. arXiv [papel]
[2024/09] AutoVerus: Generación de pruebas automatizada para Rust Code Yang et al. arXiv [papel]
[2024/10] Aprovechamiento de modelos de lenguaje perfeccionados para una auditoría de contratos inteligentes eficiente y precisa Wei et al. arXiv [papel] [repositorio]
[2024/10] LLM-SmartAudit: Detección avanzada de vulnerabilidades de contratos inteligentes Wei et al. arXiv. [papel] [repositorio]
[2024/05] Análisis estático asistido por LLM para detectar vulnerabilidades de seguridad. Li y col. arXiv. [papel]
[2024/05] PropertyGPT: Verificación formal de contratos inteligentes impulsada por LLM mediante generación de propiedad aumentada con recuperación. Liu y cols. arXiv. [papel] [repositorio]
[2024/03] Consenso de múltiples funciones a través de debates de LLM para la detección de vulnerabilidades. Mao et al. QRS. [papel]
[2024/03] Combinación de agentes de ajuste fino y basados en LLM para una auditoría intuitiva de contratos inteligentes con justificaciones. Ma et al. arXiv. [papel] [repositorio]
[2024/02] Cuando el análisis de flujo de datos se encuentra con modelos de lenguaje grandes. Wang y cols. arXiv. [papel]
[2024/01] LLM4Vuln: Un marco de evaluación unificado para desacoplar y mejorar el razonamiento de vulnerabilidad de los LLM. Sol y cols. arXiv. [papel] [repositorio]
[2023/12] E&V: Incitar a modelos de lenguaje grandes a realizar análisis estáticos mediante ejecución y verificación de pseudocódigo. Hao y cols. arXiv. [papel]
[2023/10] Detección de vulnerabilidades de contratos inteligentes basada en modelos de lenguaje grande: nuevas perspectivas. Hu et al. TPS-ISA. [papel] [repositorio]
[2023/10] Análisis de código estático en la era de la IA: una exploración en profundidad del concepto, la función y el potencial del análisis de código inteligente. Fan et al. arXiv. [papel]
[2023/08] Mejora del análisis estático para la detección práctica de errores: un enfoque integrado en LLM. Li y col. arXiv. [papel] [repositorio]
[2023/03] ART: Razonamiento automático de varios pasos y uso de herramientas para modelos de lenguaje grandes. Paranjape et al. arXiv. [papel] [repositorio]
[2024/10] Agente como juez: evaluar agentes con agentes Zhuge et al. arXiv. [papel] [repositorio]
[2024/09] Divide y vencerás: automatización de revisiones de código mediante localización y revisión Wang et al. Transmisión ACM. Software. Ing. Método. [papel]
[2024/04] Revisión de código impulsada por IA con LLM: primeros resultados. Rashid y cols. arXiv. [papel]
[02/2024] CodeAgent: Agentes Colaboradores para la Ingeniería de Software. Tang y cols. arXiv. [papel] [repositorio]
[2023/10] Análisis de código estático en la era de la IA: una exploración en profundidad del concepto, la función y el potencial del análisis de código inteligente. Fan et al. arXiv. [papel]
[2023/09] PRINCIPAL: Resolución de problemas de calidad del código mediante LLM. Wadhwa et al. FSE. [papel] [repositorio]
[2024/11] ReAccept: Coevolución automatizada de producción y código de prueba basada en validación dinámica y modelos de lenguaje grandes Chi et al. arXiv [papel] [repositorio]
[2024/09] Ejecución simbólica de Python con generación de código impulsada por LLM Wang et al. arXiv [papel]
[2024/06] Mokav: Pruebas diferenciales impulsadas por la ejecución con LLM. Etemadi et al. arXiv. [papel] [repositorio]
[2024/04] Mejora de la generación de pruebas basadas en LLM para sucursales difíciles de cubrir mediante el análisis de programas. Yang et al. arXiv. [papel]
[2024/03] AutoDev: desarrollo automatizado impulsado por IA . Tufano et al. arXiv [papel]
[2024/03] COVERUP: Generación de pruebas basadas en LLM guiadas por cobertura. Pizzorno et al. arXiv. [papel] [repositorio]
[2023/08] Generación de pruebas efectiva utilizando modelos de lenguaje grande previamente entrenados y pruebas de mutaciones. Dakhel et al. inf. Software. Tecnología. . [papel] [repositorio]
[2023/05] ¿No más pruebas manuales? Evaluación y mejora de ChatGPT para la generación de pruebas unitarias. Yuan et al. arXiv. [papel] [repositorio]
[2023/05] ChatUniTest: un marco para la generación de pruebas basadas en LLM. Chen et al. FSE. [papel] [repositorio]
[2023/02] Una evaluación empírica del uso de modelos de lenguaje grandes para la generación automatizada de pruebas unitarias. Schäfer et al. Traducción IEEE. Ingeniería de software. [artículo] [repositorio]
[2024/11] Un sistema mejorado con gráficos de conocimiento de código para la generación de controladores Fuzz basados en LLM Xu et al. arXiv. [papel]
[2024/07] Pruebas de GUI móviles automatizadas impulsadas por visión a través de un modelo de lenguaje grande multimodal. Liu y cols. arXiv. [papel] [repositorio]
[2024/04] Los agentes LLM pueden explotar de forma autónoma las vulnerabilidades de un día. Fang et al. arXiv. [papel]
[2024/02] Puede DESCANSAR ahora: inferencia de especificaciones automatizada y pruebas de caja negra de API RESTful con modelos de lenguaje grandes. Decrop et al. arXiv. [papel] [repositorio]
[2024/01] XUAT-Copilot: Sistema colaborativo multiagente para pruebas automatizadas de aceptación de usuarios con modelo de lenguaje grande. Wang y cols. arXiv. [papel]
[2024/01] KernelGPT: Fuzzing del kernel mejorado a través de modelos de lenguaje grandes. Yang et al. arXiv. [papel]
[2023/11] Pruebas de GUI móviles basadas en intención con agentes autónomos de modelos de lenguaje grande . Yoon et al. ICST. [papel] [repositorio]
[2023/10] Convierta a LLM en un experto en pruebas: lleve la interacción similar a la humana a las pruebas de GUI móviles a través de decisiones conscientes de la funcionalidad. Liu y cols. CISE. [papel]
[2023/10] AXNav: Reproducción de pruebas de accesibilidad desde lenguaje natural. Taeb et al. CHI. [papel]
[2023/10] Fuzzing del compilador de caja blanca potenciado por modelos de lenguaje grandes. Yang et al. arXiv. [papel] [repositorio]
[2023/10] Probando los límites: generación de entradas de texto inusuales para la detección de fallos de aplicaciones móviles con un modelo de lenguaje grande. Liu y cols. CISE. [papel] [repositorio]
[2023/08] PENTESTGPT: una herramienta de prueba de penetración automática habilitada por LLM. Deng et al. arXiv. [papel] [repositorio]
[2023/08] Fuzz4All: Fuzzing universal con modelos de lenguaje grandes. Xia y col. CISE. [papel] [repositorio]
[2023/07] Aislar errores del compilador generando programas testigo eficaces con modelos de lenguaje grandes. Tu et al. Traducción IEEE. Ing. de Software. [papel] [repositorio]
[2023/06] Todo lo que necesita son indicaciones: reproducción automatizada de errores de Android con modelos de lenguaje grandes. Feng et al. CISE. [papel] [repositorio]
[2024/11] FlexFL: localización de fallas flexible y efectiva con modelos de lenguaje grande de código abierto Xu et al. arXiv [papel]
[2024/09] Mejora de la localización de fallas mediante análisis de código ordenado con agentes LLM y autorreflexión Rafi et al. arXiv [papel]
[2024/03] AGENTFL: Ampliación de la localización de fallas basada en LLM al contexto a nivel de proyecto. Qin y cols. arXiv. [papel]
[2023/10] RCAgent: Análisis de la causa raíz de la nube por parte de agentes autónomos con modelos de lenguaje grandes aumentados por herramientas. Wang y cols. arXiv. [papel]
[2023/08] Una evaluación cuantitativa y cualitativa de la localización de fallas explicables basada en LLM . Kang et al. FSE. [papel]
[2024/07] OPENHANDS: UNA PLATAFORMA ABIERTA PARA DESARROLLADORES DE SOFTWARE DE IA COMO AGENTES GENERALISTAS Wang et al. arXiv [papel] [repositorio]
[2024/10] Búsqueda guiada semántica para la reparación eficiente de programas con modelos de lenguaje grandes Thanh et al. arXiv [papel]
[2024/09] Reparación neurosimbólica de la descamación de la prueba . Chen et al. ISSTA. [papel]
[2024/04] ¿Hasta dónde podemos llegar con la reparación práctica de programas a nivel de función? Xiang et al. arXiv. [papel] [repositorio]
[2024/03] RepairAgent: un agente autónomo basado en LLM para la reparación de programas. Bouzenia et al. arXiv. [papel]
[2024/03] ACFIX: Orientación de los LLM con prácticas RBAC comunes extraídas para la reparación contextual de vulnerabilidades de control de acceso en contratos inteligentes. Zhang et al. arXiv. [papel]
[2024/02] CigaR: Reparación de programas rentable con LLM. Hidvegi et al. arXiv. [papel] [repositorio]
[2023/04] Depuración automatizada explicable mediante depuración científica basada en modelos de lenguaje grande. Kang et al. arXiv. [papel]
[2023/04] Mantenga la conversación: corrige 162 de 337 errores por $ 0,42 cada uno usando ChatGPT. Xia y col. arXiv. [papel]
[2023/01] Reparación de programas automatizados conversacionales. Xia y col. arXiv. [papel]
[2024/04] Un enfoque de depuración unificado a través de una sinergia de agentes múltiples basada en LLM. Lee y cols. arXiv. [papel] [repositorio]
[2024/02] LDB: un depurador de modelos de lenguaje grande mediante la verificación paso a paso de la ejecución del tiempo de ejecución. Zhong et al. arXiv. [papel] [repositorio]
[2024/08] GoNoGo: un sistema multiagente eficiente basado en LLM para agilizar la toma de decisiones sobre la versión de software automotriz Khoee et al. arXiv [papel]
[2024/09] Generación de emparejamiento de código Java con ChatGPT Zhao et al. Informática teórica [artículo]
[2024/07] Potenciar el desarrollo de software generativo basado en ágil a través del trabajo en equipo entre humanos e inteligencia artificial Zhang et al. TOSEM [papel] [repositorio]
[2024/06] Experimentación con el desarrollo de software multiagente: hacia una plataforma unificada Sami et al. arXiv. [papel]
[2024/06] Ampliación de la colaboración entre múltiples agentes basada en modelos de lenguaje grande Qian et al. arXiv. [papel] [repositorio]
[2024/06] Desarrollo de software multiagente mediante colaboración entre equipos. Du et al. arXiv. [papel] [repositorio]
[2024/06] AgileCoder: Agentes Colaborativos Dinámicos para el Desarrollo de Software basados en Metodología Agile. Nguyen et al. arXiv. [papel] [repositorio]
[2024/05] Refinamiento de la experiencia iterativa de los agentes de desarrollo de software. Qian et al. arXiv. [papel]
[2024/03] Cuando la generación de código basada en LLM se encuentra con el proceso de desarrollo de software. Lin et al. arXiv. [papel] [repositorio]
[2024/03] CodeS: Repositorio de lenguaje natural a código a través de un boceto multicapa. Zan et al. arXiv. [papel] [repositorio]
[2024/02] CodePori: Modelo a gran escala para el desarrollo autónomo de software mediante el uso de múltiples agentes. Rashid y cols. arXiv. [papel]
[2024/01] Experimentando una nueva práctica de programación con LLM. Zhang et al. arXiv. [papel] [repositorio]
[2024/01] LLM4PLC: Aprovechamiento de modelos de lenguaje grandes para la programación verificable de PLC en sistemas de control industrial. Fakih et al. CISE. [papel] [repositorio]
[2023/12] Coaprendizaje experiencial de agentes desarrolladores de software. Qian et al. LCA. [papel] [repositorio]
[2023/11] Agentes autónomos en el desarrollo de software: un documento de visión Rasheed et al. arXiv. [papel]
[2023/09] AutoAgents: un marco para la generación automática de agentes. Chen et al. arXiv. [papel] [repositorio]
[2023/08] AgentVerse: Facilitar la colaboración entre múltiples agentes y explorar comportamientos emergentes. Chen et al. ICLR. [papel] [repositorio]
[2023/08] METAGPT: METAPROGRAMACIÓN PARA UN MARCO COLABORATIVO MULTIAGENTE. Hong et al. ICLR. [papel] [repositorio]
[2023/07] Agentes Comunicativos para el Desarrollo de Software. Qian et al. LCA. [papel] [repositorio]
[2023/06] COLABORACIÓN MULTIAGENTE: APROVECHAMIENTO DEL PODER DE AGENTES INTELIGENTES DE LLM. Talebirad et al. arXiv. [papel]
[2023/06] Prompt Sapper: Infraestructura de ingeniería de software habilitada por LLM para servicios nativos de IA. Xing et al. arXiv. [papel]
[2023/04] Generación de código de autocolaboración a través de ChatGPT. Dong et al. arXiv. [papel] [repositorio]
[2023/04] LLM de código bajo: programación visual sobre LLM. Cai et al. arXiv. [papel] [repositorio]
[2024/11] LLM como estudiantes continuos: mejora de la reproducción de código defectuoso en problemas de software Lin et al. arXiv [papel]
[2024/11] Agentes de desarrollo de software Human-In-the-Loop Takerngsaksiri et al. arXiv [papel]
[2024/11] Lingma SWE-GPT: un modelo de lenguaje abierto centrado en el proceso de desarrollo para la mejora automatizada del software Ma et al. arXiv [papel] [repositorio]
[2024/10] RepoGraph: Mejora de la ingeniería de software de IA con gráfico de código a nivel de repositorio Ouyang et al. arXiv [papel] [repositorio]
[2024/09] Agente MarsCode: corrección de errores automatizada nativa de IA Liu et al. arXiv. [papel]
[2024/08] CODEXGRAPH: Uniendo grandes modelos de lenguaje y repositorios de código a través de bases de datos de gráficos de código Liu et al. arXiv. [papel] [repositorio]
[2024/08] LA DIVERSIDAD POTENCIA LA INTELIGENCIA: INTEGRACIÓN DE LA EXPERIENCIA DE AGENTES DE INGENIERÍA DE SOFTWARE Zhang et al. arXiv. [papel]
[2024/08] SpecRover: Extracción de intención de código a través de LLM Ruan et al. arXiv. [papel] [repositorio]
[2024/07] OPENHANDS: UNA PLATAFORMA ABIERTA PARA DESARROLLADORES DE SOFTWARE DE IA COMO AGENTES GENERALISTAS Wang et al. arXiv [papel] [repositorio]
[2024/07] Sin agentes: desmitificando los agentes de ingeniería de software basados en LLM. Xia y col. arXiv. [papel] [repositorio]
[2024/06] ¿Cómo entender el repositorio de software completo? Ma et al. arXiv. [papel] [repositorio]
[2024/06] CODIFICADOR: RESOLUCIÓN DE PROBLEMAS CON GRÁFICOS MULTIAGENTE Y TAREAS. Chen et al. arXiv. [papel] [repositorio]
[2024/06] MASAI: Arquitectura modular para agentes de IA de ingeniería de software. Arora et al. arXiv. [papel]
[2024/05] SWE-AGENT: LAS INTERFACES AGENTE-COMPUTADORA PERMITEN LA INGENIERÍA DE SOFTWARE AUTOMATIZADA. Yang et al. arXiv. [papel] [repositorio]
[2024/04] AutoCodeRover: Mejora del programa autónomo. Zhang et al. ISSTA. [papel] [repositorio]
[2024/03] MAGIS: Marco multiagente basado en LLM para la resolución de problemas de GitHub. Tao y cols. arXiv. [papel]
Punto de referencia
[2024/10] SWE-Bench+: Punto de referencia de codificación mejorado para LLM Aleithan et al. arXiv. [papel]
[2024/10] SWE-bench Multimodal: ¿Se generalizan los sistemas de IA a dominios de software visual? Yang et al. arXiv. [papel] [repositorio]
[2024/08] SWE-bench-java: Un punto de referencia de resolución de problemas de GitHub para Java Zan et al. arXiv [papel] [repositorio]
[2024/07] Sin agentes: desmitificando los agentes de ingeniería de software basados en LLM. Xia y col. arXiv. [papel] [repositorio]
[2023/10] Swe-bench: ¿Pueden los modelos de lenguaje resolver problemas de github del mundo real? Jiménez et al. ICLR [artículo] [repositorio]
Planificación de un solo turno
[2024/06] AgileCoder: Agentes Colaborativos Dinámicos para el Desarrollo de Software basados en Metodología Agile. Nguyen et al. arXiv. [papel] [repositorio]
[2024/06] Desarrollo de software multiagente mediante colaboración entre equipos. Du et al. arXiv. [papel] [repositorio]
[2024/05] MapCoder: Generación de código multiagente para la resolución competitiva de problemas. Islam y otros. LCA. [papel] [repositorio]
[2024/03] MAGIS: Marco multiagente basado en LLM para la resolución de problemas de GitHub. Tao y cols. arXiv. [papel]
[2024/03] CodeS: Repositorio de lenguaje natural a código a través de un boceto multicapa. Zan et al. arXiv. [papel] [repositorio]
[2024/03] CoCoST: Generación automática de códigos complejos con búsqueda en línea y pruebas de corrección. Él y otros. arXiv. [papel]
[2024/02] CodePori: Modelo a gran escala para el desarrollo autónomo de software mediante el uso de múltiples agentes. Rashid y cols. arXiv. [papel]
[2024/01] CodeAgent: Mejora de la generación de código con sistemas de agentes integrados en herramientas para desafíos de codificación a nivel de repositorio del mundo real. Zhang et al. LCA. [papel]
[2024/01] LLM4PLC: Aprovechamiento de modelos de lenguaje grandes para la programación verificable de PLC en sistemas de control industrial. Fakih et al. CISE. [papel] [repositorio]
[2024/01] Experimentando una nueva práctica de programación con LLM. Zhang et al. arXiv. [papel] [repositorio]
[2023/11] Agentes autónomos en el desarrollo de software: un documento de visión Rasheed et al. arXiv. [papel]
[2023/10] Análisis de código estático en la era de la IA: una exploración en profundidad del concepto, la función y el potencial del análisis de código inteligente. Fan et al. arXiv. [papel]
[2023/09] ¿Parsel?: Razonamiento algorítmico con modelos de lenguaje mediante la composición de descomposiciones. Zelikman et al. NeurIPS. [papel] [repositorio]
[2023/08] PENTESTGPT: una herramienta de prueba de penetración automática habilitada por LLM. Deng et al. arXiv. [papel] [repositorio]
[2023/08] Flujos: componentes básicos de la IA de razonamiento y colaboración. Josifoski et al. arXiv. [papel] [repositorio]
[2023/08] METAGPT: METAPROGRAMACIÓN PARA UN MARCO COLABORATIVO MULTIAGENTE. Hong et al. ICLR. [papel] [repositorio]
[2023/07] Agentes Comunicativos para el Desarrollo de Software. Qian et al. LCA. [papel] [repositorio]
[2023/04] Generación de código de autocolaboración a través de ChatGPT. Dong et al. arXiv. [papel] [repositorio]
[2023/04] LLM de código bajo: programación visual sobre LLM. Cai et al. arXiv. [papel] [repositorio]
Planificación de múltiples turnos
[2024/03] RAT: La recuperación de pensamientos aumentados provoca un razonamiento consciente del contexto en la generación de horizontes a largo plazo . Wang y cols. arXiv. [papel] [repositorio]
Reaccionar
[2024/06] MASAI: Arquitectura modular para agentes de IA de ingeniería de software. Arora et al. arXiv. [papel]
[2024/02] Las acciones de código ejecutable generan mejores agentes de LLM. Wang y cols. ICML. [papel] [repositorio]
[2024/01] CodeAgent: Mejora de la generación de código con sistemas de agentes integrados en herramientas para desafíos de codificación a nivel de repositorio del mundo real. Zhang et al. LCA. [papel]
[2024/01] XUAT-Copilot: Sistema colaborativo multiagente para pruebas automatizadas de aceptación de usuarios con modelo de lenguaje grande. Wang y cols. arXiv. [papel]
[2023/11] Pruebas de GUI móviles basadas en intención con agentes autónomos de modelos de lenguaje grande . Yoon et al. ICST. [papel] [repositorio]
[2023/10] RCAgent: Análisis de la causa raíz de la nube por parte de agentes autónomos con modelos de lenguaje grandes aumentados por herramientas. Wang y cols. arXiv. [papel]
[2023/10] La búsqueda en el árbol de agentes lingüísticos unifica el razonamiento, la acción y la planificación en modelos lingüísticos. Zhou y cols. ICML. [papel] [repositorio]
[2023/10] AXNav: Reproducción de pruebas de accesibilidad desde lenguaje natural. Taeb et al. CHI. [papel]
[2023/09] CodePlan: Codificación a nivel de repositorio utilizando LLM y planificación. Bairi et al. FSE. [papel] [repositorio]
en capas
[2024/04] Agentes autoorganizados: un marco de LLM multiagente hacia la generación y optimización de código a ultra gran escala. Ishibashi et al. arXiv. [papel] [repositorio]
Memoria a largo plazo
[2024/06] Ampliación de la colaboración entre múltiples agentes basada en modelos de lenguaje grande Qian et al. arXiv. [papel] [repositorio]
[2024/06] Desarrollo de software multiagente mediante colaboración entre equipos. Du et al. arXiv. [papel] [repositorio]
[2024/05] Refinamiento de la experiencia iterativa de los agentes de desarrollo de software. Qian et al. arXiv. [papel]
[2023/12] Coaprendizaje experiencial de agentes desarrolladores de software. Qian et al. LCA. [papel] [repositorio]
[2023/11] Pruebas de GUI móviles basadas en intención con agentes autónomos de modelos de lenguaje grande . Yoon et al. ICST. [papel] [repositorio]
[2023/09] AutoAgents: un marco para la generación automática de agentes. Chen et al. arXiv. [papel] [repositorio]
[2023/08] METAGPT: METAPROGRAMACIÓN PARA UN MARCO COLABORATIVO MULTIAGENTE. Hong et al. ICLR. [papel] [repositorio]
[2023/07] Agentes Comunicativos para el Desarrollo de Software. Qian et al. LCA. [papel] [repositorio]
[2023/03] Reflexión: Agentes del lenguaje con aprendizaje por refuerzo verbal. Shinn et al. NeurIPS. [papel] [repositorio]
Memoria a corto plazo
[2024/07] Pruebas de GUI móviles automatizadas impulsadas por visión a través de un modelo de lenguaje grande multimodal. Liu y cols. arXiv. [papel] [repositorio]
[2024/06] Ampliación de la colaboración entre múltiples agentes basada en modelos de lenguaje grande Qian et al. arXiv. [papel] [repositorio]
[2024/06] Desarrollo de software multiagente mediante colaboración entre equipos. Du et al. arXiv. [papel] [repositorio]
[2024/06] AgileCoder: Agentes Colaborativos Dinámicos para el Desarrollo de Software basados en Metodología Agile. Nguyen et al. arXiv. [papel] [repositorio]
[2024/04] Agentes autoorganizados: un marco de LLM multiagente hacia la generación y optimización de código a ultra gran escala. Ishibashi et al. arXiv. [papel] [repositorio]
[2024/03] MAGIS: Marco multiagente basado en LLM para la resolución de problemas de GitHub. Tao y cols. arXiv. [papel]
[2024/01] XUAT-Copilot: Sistema colaborativo multiagente para pruebas automatizadas de aceptación de usuarios con modelo de lenguaje grande. Wang y cols. arXiv. [papel]
[2023/12] E&V: Incitar a modelos de lenguaje grandes a realizar análisis estáticos mediante ejecución y verificación de pseudocódigo. Hao y cols. arXiv. [papel]
[2023/11] Pruebas de GUI móviles basadas en intención con agentes autónomos de modelos de lenguaje grande . Yoon et al. ICST. [papel] [repositorio]
[2023/10] RCAgent: Análisis de la causa raíz de la nube por parte de agentes autónomos con modelos de lenguaje grandes aumentados por herramientas. Wang y cols. arXiv. [papel]
[2023/10] Análisis de código estático en la era de la IA: una exploración en profundidad del concepto, la función y el potencial del análisis de código inteligente. Fan et al. arXiv. [papel]
[2023/10] Convierta a LLM en un experto en pruebas: lleve la interacción similar a la humana a las pruebas de GUI móviles a través de decisiones conscientes de la funcionalidad. Liu y cols. CISE. [papel]
[2023/09] CodePlan: Codificación a nivel de repositorio utilizando LLM y planificación. Bairi et al. FSE. [papel] [repositorio]
[2023/09] AutoAgents: un marco para la generación automática de agentes. Chen et al. arXiv. [papel] [repositorio]
[2023/08] METAGPT: METAPROGRAMACIÓN PARA UN MARCO COLABORATIVO MULTIAGENTE. Hong et al. ICLR. [papel] [repositorio]
[2023/07] Agentes Comunicativos para el Desarrollo de Software. Qian et al. LCA. [papel] [repositorio]
[2023/03] Reflexión: Agentes del lenguaje con aprendizaje por refuerzo verbal. Shinn et al. NeurIPS. [papel] [repositorio]
Memoria compartida: un tipo especial de memoria a corto plazo
[2024/06] AgileCoder: Agentes Colaborativos Dinámicos para el Desarrollo de Software basados en Metodología Agile. Nguyen et al. arXiv. [papel] [repositorio]
[2024/05] MARE: Marco de colaboración multiagentes para ingeniería de requisitos. Jin et al. arXiv. [papel]
[2024/03] Cuando la generación de código basada en LLM se encuentra con el proceso de desarrollo de software. Lin et al. arXiv. [papel] [repositorio]
[2024/03] AGENTFL: Ampliación de la localización de fallas basada en LLM al contexto a nivel de proyecto. Qin y cols. arXiv. [papel]
[2023/08] METAGPT: METAPROGRAMACIÓN PARA UN MARCO COLABORATIVO MULTIAGENTE. Hong et al. ICLR. [papel] [repositorio]
[2023/04] Generación de código de autocolaboración a través de ChatGPT. Dong et al. arXiv. [papel] [repositorio]
Entrada visual
[2024/10] SWE-bench Multimodal: ¿Se generalizan los sistemas de IA a dominios de software visual? Yang et al. arXiv. [papel] [repositorio]
[2024/07] Pruebas de GUI móviles automatizadas impulsadas por visión a través de un modelo de lenguaje grande multimodal. Liu y cols. arXiv. [papel] [repositorio]
[2024/06] Experimentación con el desarrollo de software multiagente: hacia una plataforma unificada Sami et al. arXiv. [papel]
[2024/01] XUAT-Copilot: Sistema colaborativo multiagente para pruebas automatizadas de aceptación de usuarios con modelo de lenguaje grande. Wang y cols. arXiv. [papel]
[2023/10] AXNav: Reproducción de pruebas de accesibilidad desde lenguaje natural. Taeb et al. CHI. [papel]
[2023/10] Probando los límites: generación de entradas de texto inusuales para la detección de fallos de aplicaciones móviles con un modelo de lenguaje grande. Liu y cols. CISE. [papel] [repositorio]
[2023/08] METAGPT: METAPROGRAMACIÓN PARA UN MARCO COLABORATIVO MULTIAGENTE. Hong et al. ICLR. [papel] [repositorio]
Herramientas de búsqueda
[2024/05] Generación de código a nivel de clase a partir de lenguaje natural mediante razonamiento iterativo mejorado por herramientas a través del repositorio. Deshpande et al. arXiv. [papel]
[2024/04] Los agentes LLM pueden explotar de forma autónoma las vulnerabilidades de un día. Fang et al. arXiv. [papel]
[2024/03] AutoDev: desarrollo automatizado impulsado por IA . Tufano et al. arXiv [papel]
[2024/03] RepairAgent: un agente autónomo basado en LLM para la reparación de programas. Bouzenia et al. arXiv. [papel]
[2024/03] CoCoST: Generación automática de códigos complejos con búsqueda en línea y pruebas de corrección. Él y otros. arXiv. [papel]
[2024/03] RAT: La recuperación de pensamientos aumentados provoca un razonamiento consciente del contexto en la generación de horizontes a largo plazo . Wang y cols. arXiv. [papel] [repositorio]
[2024/02] CodePori: Modelo a gran escala para el desarrollo autónomo de software mediante el uso de múltiples agentes. Rashid y cols. arXiv. [papel]
[2024/01] LLM4Vuln: Un marco de evaluación unificado para desacoplar y mejorar el razonamiento de vulnerabilidad de los LLM. Sol y cols. arXiv. [papel] [repositorio]
[2024/01] CodeAgent: Mejora de la generación de código con sistemas de agentes integrados en herramientas para desafíos de codificación a nivel de repositorio del mundo real. Zhang et al. LCA. [papel]
[2023/12] E&V: Incitar a modelos de lenguaje grandes a realizar análisis estáticos mediante ejecución y verificación de pseudocódigo. Hao y cols. arXiv. [papel]
[2023/12] Coaprendizaje experiencial de agentes desarrolladores de software. Qian et al. LCA. [papel] [repositorio]
[2023/11] Pruebas de GUI móviles basadas en intención con agentes autónomos de modelos de lenguaje grande . Yoon et al. ICST. [papel] [repositorio]
[2023/10] Lemur: Armonización del lenguaje natural y el código para agentes lingüísticos. Xu et al. ICLR. [papel] [repositorio]
[2023/10] RCAgent: Análisis de la causa raíz de la nube por parte de agentes autónomos con modelos de lenguaje grandes aumentados por herramientas. Wang y cols. arXiv. [papel]
[2023/10] Análisis de código estático en la era de la IA: una exploración en profundidad del concepto, la función y el potencial del análisis de código inteligente. Fan et al. arXiv. [papel]
[2023/08] METAGPT: METAPROGRAMACIÓN PARA UN MARCO COLABORATIVO MULTIAGENTE. Hong et al. ICLR. [papel] [repositorio]
[2023/08] PENTESTGPT: una herramienta de prueba de penetración automática habilitada por LLM. Deng et al. arXiv. [papel] [repositorio]
[2023/08] AgentVerse: Facilitar la colaboración entre múltiples agentes y explorar comportamientos emergentes. Chen et al. ICLR. [papel] [repositorio]
[2023/08] Gentopia: una plataforma colaborativa para LLM mejorados con herramientas. Xu et al. EMNLP. [papel] [repositorio]
[2023/08] AutoGen: Habilitación de aplicaciones LLM de próxima generación a través de una conversación entre múltiples agentes. Wu et al. arXiv. [papel] [repositorio]
[2023/05] ToolCoder: Enseñe a los modelos de generación de código a utilizar herramientas de búsqueda API. Zhang et al. arXiv. [papel]
[2023/03] ART: Razonamiento automático de varios pasos y uso de herramientas para modelos de lenguaje grandes. Paranjape et al. arXiv. [papel] [repositorio]
Operación de archivos
[2024/08] SpecRover: Extracción de intención de código a través de LLM Ruan et al. arXiv. [papel] [repositorio]
[2024/06] MASAI: Arquitectura modular para agentes de IA de ingeniería de software. Arora et al. arXiv. [papel]
[2024/05] Análisis estático asistido por LLM para detectar vulnerabilidades de seguridad. Li y col. arXiv. [papel]
[2024/05] SWE-AGENT: LAS INTERFACES AGENTE-COMPUTADORA PERMITEN LA INGENIERÍA DE SOFTWARE AUTOMATIZADA. Yang et al. arXiv. [papel] [repositorio]
[2024/04] Los agentes LLM pueden explotar de forma autónoma las vulnerabilidades de un día. Fang et al. arXiv. [papel]
[2024/03] RepairAgent: un agente autónomo basado en LLM para la reparación de programas. Bouzenia et al. arXiv. [papel]
[2024/03] AutoDev: desarrollo automatizado impulsado por IA . Tufano et al. arXiv [papel]
[2023/04] Depuración automatizada explicable mediante depuración científica basada en modelos de lenguaje grande. Kang et al. arXiv. [papel]
Operación de la interfaz gráfica de usuario
[2024/07] Pruebas de GUI móviles automatizadas impulsadas por visión a través de un modelo de lenguaje grande multimodal. Liu y cols. arXiv. [papel] [repositorio]
[2024/01] XUAT-Copilot: Sistema colaborativo multiagente para pruebas automatizadas de aceptación de usuarios con modelo de lenguaje grande. Wang y cols. arXiv. [papel]
[2023/10] Convierta a LLM en un experto en pruebas: lleve la interacción similar a la humana a las pruebas de GUI móviles a través de decisiones conscientes de la funcionalidad. Liu y cols. CISE. [papel]
[2023/10] AXNav: Reproducción de pruebas de accesibilidad desde lenguaje natural. Taeb et al. CHI. [papel]
[2023/10] Probando los límites: generación de entradas de texto inusuales para la detección de fallos de aplicaciones móviles con un modelo de lenguaje grande. Liu y cols. CISE. [papel] [repositorio]
[2023/06] Todo lo que necesita son indicaciones: reproducción automatizada de errores de Android con modelos de lenguaje grandes. Feng et al. CISE. [papel] [repositorio]
Análisis de programas estáticos
[2024/06] Desarrollo de software multiagente mediante colaboración entre equipos. Du et al. arXiv. [papel] [repositorio]
[2024/06] AgileCoder: Agentes Colaborativos Dinámicos para el Desarrollo de Software basados en Metodología Agile. Nguyen et al. arXiv. [papel] [repositorio]
[2024/06] MASAI: Arquitectura modular para agentes de IA de ingeniería de software. Arora et al. arXiv. [papel]
[2024/05] Generación de código a nivel de clase a partir de lenguaje natural mediante razonamiento iterativo mejorado por herramientas a través del repositorio. Deshpande et al. arXiv. [papel]
[2024/05] Análisis estático asistido por LLM para detectar vulnerabilidades de seguridad. Li y col. arXiv. [papel]
[2024/04] AutoCodeRover: Mejora del programa autónomo. Zhang et al. ISSTA. [papel] [repositorio]
[2024/04] Mejora de la generación de pruebas basadas en LLM para sucursales difíciles de cubrir mediante el análisis de programas. Yang et al. arXiv. [papel]
[2024/04] 3DGen: Generación asistida por IA de analizadores de formato binario demostrablemente correctos . Fakhoury et al. arXiv [papel]
[2024/03] AutoDev: desarrollo automatizado impulsado por IA . Tufano et al. arXiv [papel]
[2024/03] RepairAgent: un agente autónomo basado en LLM para la reparación de programas. Bouzenia et al. arXiv. [papel]
[2024/03] COVERUP: Generación de pruebas basadas en LLM guiadas por cobertura. Pizzorno et al. arXiv. [papel] [repositorio]
[2024/03] ACFIX: Orientación de los LLM con prácticas RBAC comunes extraídas para la reparación contextual de vulnerabilidades de control de acceso en contratos inteligentes. Zhang et al. arXiv. [papel]
[2024/03] AGENTFL: Ampliación de la localización de fallas basada en LLM al contexto a nivel de proyecto. Qin y cols. arXiv. [papel]
[2024/02] Cuando el análisis de flujo de datos se encuentra con modelos de lenguaje grandes. Wang y cols. arXiv. [papel]
[2024/02] LDB: un depurador de modelos de lenguaje grande mediante la verificación paso a paso de la ejecución del tiempo de ejecución. Zhong et al. arXiv. [papel] [repositorio]
[2024/01] Enseñanza de LLM de código para utilizar herramientas de autocompletado en la generación de código a nivel de repositorio. Wang y cols. arXiv. [papel]
[2024/01] CodeAgent: Mejora de la generación de código con sistemas de agentes integrados en herramientas para desafíos de codificación a nivel de repositorio del mundo real. Zhang et al. LCA. [papel]
[2024/01] LLM4PLC: Aprovechamiento de modelos de lenguaje grandes para la programación verificable de PLC en sistemas de control industrial. Fakih et al. CISE. [papel] [repositorio]
[2023/12] E&V: Incitar a modelos de lenguaje grandes a realizar análisis estáticos mediante ejecución y verificación de pseudocódigo. Hao y cols. arXiv. [papel]
[2023/09] CodePlan: Codificación a nivel de repositorio utilizando LLM y planificación. Bairi et al. FSE. [papel] [repositorio]
[2023/08] CodeCoT: Abordar los errores de sintaxis del código en el razonamiento de CoT para la generación de código. Huang et al. arXiv. [papel]
[2023/07] Aislar errores del compilador generando programas testigo eficaces con modelos de lenguaje grandes. Tu et al. Traducción IEEE. Ingeniería de software. [artículo] [repositorio]
[2023/06] Todo lo que necesita son indicaciones: reproducción automatizada de errores de Android con modelos de lenguaje grandes. Feng et al. CISE. [papel] [repositorio]
Análisis dinámico
[2024/04] Mejora de la generación de pruebas basadas en LLM para sucursales difíciles de cubrir mediante el análisis de programas. Yang et al. arXiv. [papel]
[2024/03] COVERUP: Generación de pruebas basadas en LLM guiadas por cobertura. Pizzorno et al. arXiv. [papel] [repositorio]
[2024/03] AGENTFL: Ampliación de la localización de fallas basada en LLM al contexto a nivel de proyecto. Qin y cols. arXiv. [papel]
[2024/02] LDB: un depurador de modelos de lenguaje grande mediante la verificación paso a paso de la ejecución del tiempo de ejecución. Zhong et al. arXiv. [papel] [repositorio]
[2023/07] Aislar errores del compilador generando programas testigo eficaces con modelos de lenguaje grandes. Tu et al. Traducción IEEE. Ingeniería de software. [artículo] [repositorio]
[2023/04] Depuración automatizada explicable mediante depuración científica basada en modelos de lenguaje grande. Kang et al. arXiv. [papel]
Herramientas de prueba
[2024/09] Reparación neurosimbólica de la descamación de la prueba . Chen et al. ISSTA. [papel]
[2024/08] SpecRover: Extracción de intención de código a través de LLM Ruan et al. arXiv. [papel] [repositorio]
[2024/06] AgileCoder: Agentes Colaborativos Dinámicos para el Desarrollo de Software basados en Metodología Agile. Nguyen et al. arXiv. [papel] [repositorio]
[2024/06] MASAI: Arquitectura modular para agentes de IA de ingeniería de software. Arora et al. arXiv. [papel]
[2024/05] AutoCoder: Mejora del modelo de lenguaje grande de código con AIEV-INSTRUCT. Lei et al. arXiv. [papel] [repositorio]
[2024/05] MapCoder: Generación de código multiagente para la resolución competitiva de problemas. Islam y otros. LCA. [papel] [repositorio]
[2024/04] Agentes autoorganizados: un marco de LLM multiagente hacia la generación y optimización de código a ultra gran escala. Ishibashi et al. arXiv. [papel] [repositorio]
[2024/04] Un enfoque de depuración unificado a través de una sinergia de agentes múltiples basada en LLM. Lee y cols. arXiv. [papel] [repositorio]
[2024/04] Los agentes LLM pueden explotar de forma autónoma las vulnerabilidades de un día. Fang et al. arXiv. [papel]
[2024/04] Mejora de la generación de pruebas basadas en LLM para sucursales difíciles de cubrir mediante el análisis de programas. Yang et al. arXiv. [papel]
[2024/04] 3DGen: Generación asistida por IA de analizadores de formato binario demostrablemente correctos . Fakhoury et al. arXiv [papel]
[2024/04] AutoCodeRover: Mejora del programa autónomo. Zhang et al. ISSTA. [papel] [repositorio]
[2024/03] AutoDev: desarrollo automatizado impulsado por IA . Tufano et al. arXiv [papel]
[2024/03] Cuando la generación de código basada en LLM se encuentra con el proceso de desarrollo de software. Lin et al. arXiv. [papel] [repositorio]
[2024/03] RepairAgent: un agente autónomo basado en LLM para la reparación de programas. Bouzenia et al. arXiv. [papel]
[2024/03] CoCoST: Generación automática de códigos complejos con búsqueda en línea y pruebas de corrección. Él y otros. arXiv. [papel]
[2024/02] Las acciones de código ejecutable generan mejores agentes de LLM. Wang y cols. ICML. [papel] [repositorio]
[2024/02] Desarrollo basado en pruebas para la generación de código. Mathews y cols. arXiv. [papel] [repositorio]
[01/2024] Generación de código con AlphaCodium: de la ingeniería rápida a la ingeniería de flujo. Ridnik et al. arXiv. [papel] [repositorio]
[2024/01] Experimentando una nueva práctica de programación con LLM. Zhang et al. arXiv. [papel] [repositorio]
[2024/01] CodeAgent: Mejora de la generación de código con sistemas de agentes integrados en herramientas para desafíos de codificación a nivel de repositorio del mundo real. Zhang et al. LCA. [papel]
[2023/12] AgentCoder: Generación de código basada en múltiples agentes con pruebas y optimización iterativas. Huang et al. arXiv. [papel]
[2023/12] LLM4TDD: Mejores prácticas para el desarrollo basado en pruebas utilizando modelos de lenguaje grandes. Piya et al. arXiv. [papel] [repositorio]
[2023/11] INTERVENTOR: Impulsar la capacidad de codificación de modelos de lenguaje grandes con la cadena interactiva de reparación. Wang y cols. LCA. [papel] [repositorio]
[2023/10] ClarifyGPT: Potenciar la generación de código basada en LLM con aclaración de intenciones. Mu et al. arXiv. [papel] [repositorio]
[2023/10] Lemur: Armonización del lenguaje natural y el código para agentes lingüísticos. Xu et al. ICLR. [papel] [repositorio]
[2023/10] Fuzzing del compilador de caja blanca potenciado por modelos de lenguaje grandes. Yang et al. arXiv. [papel] [repositorio]
[2023/09] Comprensión de la programación basada en casos de prueba en modelos de lenguaje grandes para una mejor generación de código. Tian et al. arXiv. [papel]
[2023/09] MINT: EVALUACIÓN DE LLMS EN INTERACCIÓN MULTITURNOS CON HERRAMIENTAS Y RETROALIMENTACIÓN DEL LENGUAJE. Wang y cols. ICLR. [papel] [repositorio]
[2023/08] METAGPT: METAPROGRAMACIÓN PARA UN MARCO COLABORATIVO MULTIAGENTE. Hong et al. ICLR. [papel] [repositorio]
[2023/08] Generación de pruebas efectiva utilizando modelos de lenguaje grande previamente entrenados y pruebas de mutaciones. Dakhel et al. inf. Software. Tecnología. . [papel] [repositorio]
[2023/08] AgentVerse: Facilitar la colaboración entre múltiples agentes y explorar comportamientos emergentes. Chen et al. ICLR. [papel] [repositorio]
[2023/08] AutoGen: Habilitación de aplicaciones LLM de próxima generación a través de una conversación entre múltiples agentes. Wu et al. arXiv. [papel] [repositorio]
[2023/08] Flujos: componentes básicos de la IA de razonamiento y colaboración. Josifoski et al. arXiv. [papel] [repositorio]
[2023/06] SELFEVOLVE: Un marco de evolución de código a través de modelos de lenguaje grandes. Jiang et al. arXiv. [papel]
[2023/06] InterCode: Estandarización y evaluación comparativa de la codificación interactiva con retroalimentación de ejecución. Yang et al. NeurIPS. [papel] [repositorio]
[2023/06] ¿ES LA AUTOREPARACIÓN UNA BALA DE PLATA PARA LA GENERACIÓN DE CÓDIGOS? Olausson et al. ICLR. [papel] [repositorio]
[2023/05] ¿No más pruebas manuales? Evaluación y mejora de ChatGPT para la generación de pruebas unitarias. Yuan et al. arXiv. [papel] [repositorio]
[2023/04] Programación totalmente autónoma con modelos de lenguaje grandes. Liventsev et al. GECCO. [papel]
[2023/04] Depuración automatizada explicable mediante depuración científica basada en modelos de lenguaje grande. Kang et al. arXiv. [papel]
[2023/03] ART: Razonamiento automático de varios pasos y uso de herramientas para modelos de lenguaje grandes. Paranjape et al. arXiv. [papel] [repositorio]
[2023/03] Reflexión: Agentes del lenguaje con aprendizaje por refuerzo verbal. Shinn et al. NeurIPS. [papel] [repositorio]
[2023/02] Una evaluación empírica del uso de modelos de lenguaje grandes para la generación automatizada de pruebas unitarias. Schäfer et al. Traducción IEEE. Ingeniería de software. [artículo] [repositorio]
[2023/01] Reparación de programas automatizados conversacionales. Xia y col. arXiv. [papel]
Herramientas de localización de fallas
[2024/04] AutoCodeRover: Mejora del programa autónomo. Zhang et al. ISSTA. [papel] [repositorio]
[2024/03] RepairAgent: un agente autónomo basado en LLM para la reparación de programas. Bouzenia et al. arXiv. [papel]
Funciones del gerente
[2024/06] AgileCoder: Agentes Colaborativos Dinámicos para el Desarrollo de Software basados en Metodología Agile. Nguyen et al. arXiv. [papel] [repositorio]
[2024/05] Refinamiento de la experiencia iterativa de los agentes de desarrollo de software. Qian et al. arXiv. [papel]
[2024/05] MapCoder: Generación de código multiagente para la resolución competitiva de problemas. Islam y otros. LCA. [papel] [repositorio]
[2024/04] Agentes autoorganizados: un marco de LLM multiagente hacia la generación y optimización de código a ultra gran escala. Ishibashi et al. arXiv. [papel] [repositorio]
[2024/04] 3DGen: Generación asistida por IA de analizadores de formato binario demostrablemente correctos . Fakhoury et al. arXiv [papel]
[2024/03] MAGIS: Marco multiagente basado en LLM para la resolución de problemas de GitHub. Tao y cols. arXiv. [papel]
[2024/03] Cuando la generación de código basada en LLM se encuentra con el proceso de desarrollo de software. Lin et al. arXiv. [papel] [repositorio]
[02/2024] CodeAgent: Agentes Colaboradores para la Ingeniería de Software. Tang y cols. arXiv. [papel] [repositorio]
[2024/02] CodePori: Modelo a gran escala para el desarrollo autónomo de software mediante el uso de múltiples agentes. Rashid y cols. arXiv. [papel]
[2023/12] Coaprendizaje experiencial de agentes desarrolladores de software. Qian et al. LCA. [papel] [repositorio]
[2023/11] Agentes autónomos en el desarrollo de software: un documento de visión Rasheed et al. arXiv. [papel]
[2023/11] Pruebas de GUI móviles basadas en intención con agentes autónomos de modelos de lenguaje grande . Yoon et al. ICST. [papel] [repositorio]
[2023/10] AXNav: Reproducción de pruebas de accesibilidad desde lenguaje natural. Taeb et al. CHI. [papel]
[2023/10] RCAgent: Análisis de la causa raíz de la nube por parte de agentes autónomos con modelos de lenguaje grandes aumentados por herramientas. Wang y cols. arXiv. [papel]
[2023/09] AutoAgents: un marco para la generación automática de agentes. Chen et al. arXiv. [papel] [repositorio]
[2023/08] METAGPT: METAPROGRAMACIÓN PARA UN MARCO COLABORATIVO MULTIAGENTE. Hong et al. ICLR. [papel] [repositorio]
[2023/04] LLM de código bajo: programación visual sobre LLM. Cai et al. arXiv. [papel] [repositorio]
[2023/03] CAMEL: Agentes comunicativos para la exploración “mente” de una gran sociedad modelo lingüística. Li y col. NeurIPS. [papel] [repositorio]
Roles de análisis de requisitos
[2024/06] Experimentación con el desarrollo de software multiagente: hacia una plataforma unificada Sami et al. arXiv. [papel]
[2024/06] AgileCoder: Agentes Colaborativos Dinámicos para el Desarrollo de Software basados en Metodología Agile. Nguyen et al. arXiv. [papel] [repositorio]
[2024/05] MARE: Marco de colaboración multiagentes para ingeniería de requisitos. Jin et al. arXiv. [papel]
[2024/04] Elicitron: un marco de simulación basado en agentes LLM para la obtención de requisitos de diseño. Ataei et al. arXiv. [papel]
[2024/03] Cuando la generación de código basada en LLM se encuentra con el proceso de desarrollo de software. Lin et al. arXiv. [papel] [repositorio]
[2024/01] Experimentando una nueva práctica de programación con LLM. Zhang et al. arXiv. [papel] [repositorio]
[2023/11] Agentes autónomos en el desarrollo de software: un documento de visión Rasheed et al. arXiv. [papel]
[2023/10] Análisis de código estático en la era de la IA: una exploración en profundidad del concepto, la función y el potencial del análisis de código inteligente. Fan et al. arXiv. [papel]
[2023/08] METAGPT: METAPROGRAMACIÓN PARA UN MARCO COLABORATIVO MULTIAGENTE. Hong et al. ICLR. [papel] [repositorio]
[2023/06] COLABORACIÓN MULTIAGENTE: APROVECHAMIENTO DEL PODER DE AGENTES INTELIGENTES DE LLM. Talebirad et al. arXiv. [papel]
[2023/04] Generación de código de autocolaboración a través de ChatGPT. Dong et al. arXiv. [papel] [repositorio]
[2023/03] CAMEL: Agentes comunicativos para la exploración “mente” de una gran sociedad modelo lingüística. Li y col. NeurIPS. [papel] [repositorio]
Funciones del diseñador
[2024/06] Experimentación con el desarrollo de software multiagente: hacia una plataforma unificada Sami et al. arXiv. [papel]
[2024/03] Cuando la generación de código basada en LLM se encuentra con el proceso de desarrollo de software. Lin et al. arXiv. [papel] [repositorio]
[2024/01] Experimentando una nueva práctica de programación con LLM. Zhang et al. arXiv. [papel] [repositorio]
[2023/11] Agentes autónomos en el desarrollo de software: un documento de visión Rasheed et al. arXiv. [papel]
[2023/08] METAGPT: METAPROGRAMACIÓN PARA UN MARCO COLABORATIVO MULTIAGENTE. Hong et al. ICLR. [papel] [repositorio]
[2023/08] AgentVerse: Facilitar la colaboración entre múltiples agentes y explorar comportamientos emergentes. Chen et al. ICLR. [papel] [repositorio]
[2023/07] Agentes Comunicativos para el Desarrollo de Software. Qian et al. LCA. [papel] [repositorio]
[2023/06] COLABORACIÓN MULTIAGENTE: APROVECHAMIENTO DEL PODER DE AGENTES INTELIGENTES DE LLM. Talebirad et al. arXiv. [papel]
Roles de desarrollador
[2024/06] Experimentación con el desarrollo de software multiagente: hacia una plataforma unificada Sami et al. arXiv. [papel]
[2024/06] AgileCoder: Agentes Colaborativos Dinámicos para el Desarrollo de Software basados en Metodología Agile. Nguyen et al. arXiv. [papel] [repositorio]
[2024/05] AutoCoder: Mejora del modelo de lenguaje grande de código con AIEV-INSTRUCT. Lei et al. arXiv. [papel] [repositorio]
[2024/05] MapCoder: Generación de código multiagente para la resolución competitiva de problemas. Islam y otros. LCA. [papel] [repositorio]
[2024/04] Agentes autoorganizados: un marco de LLM multiagente hacia la generación y optimización de código a ultra gran escala. Ishibashi et al. arXiv. [papel] [repositorio]
[2024/04] 3DGen: Generación asistida por IA de analizadores de formato binario demostrablemente correctos . Fakhoury et al. arXiv [papel]
[2024/03] CodeS: Repositorio de lenguaje natural a código a través de un boceto multicapa. Zan et al. arXiv. [papel] [repositorio]
[2024/03] MAGIS: Marco multiagente basado en LLM para la resolución de problemas de GitHub. Tao y cols. arXiv. [papel]
[2024/03] Cuando la generación de código basada en LLM se encuentra con el proceso de desarrollo de software. Lin et al. arXiv. [papel] [repositorio]
[2024/02] Desarrollo basado en pruebas para la generación de código. Mathews y cols. arXiv. [papel] [repositorio]
[2024/02] CodePori: Modelo a gran escala para el desarrollo autónomo de software mediante el uso de múltiples agentes. Rashid y cols. arXiv. [papel]
[2024/01] Experimentando una nueva práctica de programación con LLM. Zhang et al. arXiv. [papel] [repositorio]
[2023/12] AgentCoder: Generación de código basada en múltiples agentes con pruebas y optimización iterativas. Huang et al. arXiv. [papel]
[2023/11] Agentes autónomos en el desarrollo de software: un documento de visión Rasheed et al. arXiv. [papel]
[2023/11] INTERVENTOR: Impulsar la capacidad de codificación de modelos de lenguaje grandes con la cadena interactiva de reparación. Wang y cols. LCA. [papel] [repositorio]
[2023/08] AutoGen: Habilitación de aplicaciones LLM de próxima generación a través de una conversación entre múltiples agentes. Wu et al. arXiv. [papel] [repositorio]
[2023/08] METAGPT: METAPROGRAMACIÓN PARA UN MARCO COLABORATIVO MULTIAGENTE. Hong et al. ICLR. [papel] [repositorio]
[2023/08] AgentVerse: Facilitar la colaboración entre múltiples agentes y explorar comportamientos emergentes. Chen et al. ICLR. [papel] [repositorio]
[2023/07] Agentes Comunicativos para el Desarrollo de Software. Qian et al. LCA. [papel] [repositorio]
[2023/06] ¿ES LA AUTOREPARACIÓN UNA BALA DE PLATA PARA LA GENERACIÓN DE CÓDIGOS? Olausson et al. ICLR. [papel] [repositorio]
[2023/06] COLABORACIÓN MULTIAGENTE: APROVECHAMIENTO DEL PODER DE AGENTES INTELIGENTES DE LLM. Talebirad et al. arXiv. [papel]
[2023/05] Autoedición: editor de código con reconocimiento de fallas para generación de código . Zhang et al. LCA. [papel]
[2023/04] Generación de código de autocolaboración a través de ChatGPT. Dong et al. arXiv. [papel] [repositorio]
[2023/03] CAMEL: Agentes comunicativos para la exploración “mente” de una gran sociedad modelo lingüística. Li y col. NeurIPS. [papel] [repositorio]
Funciones de garantía de calidad del software
[2024/08] SpecRover: Extracción de intención de código a través de LLM Ruan et al. arXiv. [papel] [repositorio]
[2024/07] Pruebas de GUI móviles automatizadas impulsadas por visión a través de un modelo de lenguaje grande multimodal. Liu y cols. arXiv. [papel] [repositorio]
[2024/06] Experimentación con el desarrollo de software multiagente: hacia una plataforma unificada Sami et al. arXiv. [papel]
[2024/06] Desarrollo de software multiagente mediante colaboración entre equipos. Du et al. arXiv. [papel] [repositorio]
[2024/06] AgileCoder: Agentes Colaborativos Dinámicos para el Desarrollo de Software basados en Metodología Agile. Nguyen et al. arXiv. [papel] [repositorio]
[2024/06] MASAI: Arquitectura modular para agentes de IA de ingeniería de software. Arora et al. arXiv. [papel]
[2024/05] AutoCoder: Mejora del modelo de lenguaje grande de código con AIEV-INSTRUCT. Lei et al. arXiv. [papel] [repositorio]
[2024/05] MapCoder: Generación de código multiagente para la resolución competitiva de problemas. Islam y otros. LCA. [papel] [repositorio]
[2024/04] Revisión de código impulsada por IA con LLM: primeros resultados. Rashid y cols. arXiv. [papel]
[2024/04] 3DGen: Generación asistida por IA de analizadores de formato binario demostrablemente correctos . Fakhoury et al. arXiv [papel]
[2024/04] Un enfoque de depuración unificado a través de una sinergia de agentes múltiples basada en LLM. Lee y cols. arXiv. [papel] [repositorio]
[2024/04] ¿Hasta dónde podemos llegar con la reparación práctica de programas a nivel de función? Xiang et al. arXiv. [papel] [repositorio]
[2024/03] MAGIS: Marco multiagente basado en LLM para la resolución de problemas de GitHub. Tao y cols. arXiv. [papel]
[2024/03] AGENTFL: Ampliación de la localización de fallas basada en LLM al contexto a nivel de proyecto. Qin y cols. arXiv. [papel]
[2024/03] Combinación de agentes de ajuste fino y basados en LLM para una auditoría intuitiva de contratos inteligentes con justificaciones. Ma et al. arXiv. [papel] [repositorio]
[2024/03] Cuando la generación de código basada en LLM se encuentra con el proceso de desarrollo de software. Lin et al. arXiv. [papel] [repositorio]
[2024/03] ACFIX: Orientación de los LLM con prácticas RBAC comunes extraídas para la reparación contextual de vulnerabilidades de control de acceso en contratos inteligentes. Zhang et al. arXiv. [papel]
[02/2024] CodeAgent: Agentes Colaboradores para la Ingeniería de Software. Tang y cols. arXiv. [papel] [repositorio]
[2024/02] Desarrollo basado en pruebas para la generación de código. Mathews y cols. arXiv. [papel] [repositorio]
[2024/02] CodePori: Modelo a gran escala para el desarrollo autónomo de software mediante el uso de múltiples agentes. Rashid y cols. arXiv. [papel]
[2024/01] XUAT-Copilot: Sistema colaborativo multiagente para pruebas automatizadas de aceptación de usuarios con modelo de lenguaje grande. Wang y cols. arXiv. [papel]
[2023/12] AgentCoder: Generación de código basada en múltiples agentes con pruebas y optimización iterativas. Huang et al. arXiv. [papel]
[2023/11] Agentes autónomos en el desarrollo de software: un documento de visión Rasheed et al. arXiv. [papel]
[2023/11] Pruebas de GUI móviles basadas en intención con agentes autónomos de modelos de lenguaje grande . Yoon et al. ICST. [papel] [repositorio]
[2023/10] Detección de vulnerabilidades de contratos inteligentes basada en modelos de lenguaje grande: nuevas perspectivas. Hu et al. TPS-ISA. [papel] [repositorio]
[2023/10] Análisis de código estático en la era de la IA: una exploración en profundidad del concepto, la función y el potencial del análisis de código inteligente. Fan et al. arXiv. [papel]
[2023/10] Fuzzing del compilador de caja blanca potenciado por modelos de lenguaje grandes. Yang et al. arXiv. [papel] [repositorio]
[2023/10] AXNav: Reproducción de pruebas de accesibilidad desde lenguaje natural. Taeb et al. CHI. [papel]
[2023/08] AutoGen: Habilitación de aplicaciones LLM de próxima generación a través de una conversación entre múltiples agentes. Wu et al. arXiv. [papel] [repositorio]
[2023/08] METAGPT: METAPROGRAMACIÓN PARA UN MARCO COLABORATIVO MULTIAGENTE. Hong et al. ICLR. [papel] [repositorio]
[2023/07] Agentes Comunicativos para el Desarrollo de Software. Qian et al. LCA. [papel] [repositorio]
[2023/06] ¿ES LA AUTOREPARACIÓN UNA BALA DE PLATA PARA LA GENERACIÓN DE CÓDIGOS? Olausson et al. ICLR. [papel] [repositorio]
[2023/06] COLABORACIÓN MULTIAGENTE: APROVECHAMIENTO DEL PODER DE AGENTES INTELIGENTES DE LLM. Talebirad et al. arXiv. [papel]
[2023/05] Autoedición: editor de código con reconocimiento de fallas para generación de código . Zhang et al. LCA. [papel]
[2023/03] CAMEL: Agentes comunicativos para la exploración “mente” de una gran sociedad modelo lingüística. Li y col. NeurIPS. [papel] [repositorio]
Funciones de asistente
[2024/08] LA DIVERSIDAD POTENCIA LA INTELIGENCIA: INTEGRACIÓN DE LA EXPERIENCIA DE AGENTES DE INGENIERÍA DE SOFTWARE Zhang et al. arXiv. [papel]
[2024/08] SpecRover: Extracción de intención de código a través de LLM Ruan et al. arXiv. [papel] [repositorio]
[2024/06] MASAI: Arquitectura modular para agentes de IA de ingeniería de software. Arora et al. arXiv. [papel]
[2024/05] MapCoder: Generación de código multiagente para la resolución competitiva de problemas. Islam y otros. LCA. [papel] [repositorio]
[2024/03] MAGIS: Marco multiagente basado en LLM para la resolución de problemas de GitHub. Tao y cols. arXiv. [papel]
[2024/03] CodeS: Repositorio de lenguaje natural a código a través de un boceto multicapa. Zan et al. arXiv. [papel] [repositorio]
[2024/03] Combinación de agentes de ajuste fino y basados en LLM para una auditoría intuitiva de contratos inteligentes con justificaciones. Ma et al. arXiv. [papel] [repositorio]
[2023/10] Análisis de código estático en la era de la IA: una exploración en profundidad del concepto, la función y el potencial del análisis de código inteligente. Fan et al. arXiv. [papel]
Estructura en capas
[2024/08] LA DIVERSIDAD POTENCIA LA INTELIGENCIA: INTEGRACIÓN DE LA EXPERIENCIA DE AGENTES DE INGENIERÍA DE SOFTWARE Zhang et al. arXiv. [papel]
[2024/08] SpecRover: Extracción de intención de código a través de LLM Ruan et al. arXiv. [papel] [repositorio]
[2024/06] Experimentación con el desarrollo de software multiagente: hacia una plataforma unificada Sami et al. arXiv. [papel]
[2024/06] Ampliación de la colaboración entre múltiples agentes basada en modelos de lenguaje grande Qian et al. arXiv. [papel] [repositorio]
[2024/06] Desarrollo de software multiagente mediante colaboración entre equipos. Du et al. arXiv. [papel] [repositorio]
[2024/06] AgileCoder: Agentes Colaborativos Dinámicos para el Desarrollo de Software basados en Metodología Agile. Nguyen et al. arXiv. [papel] [repositorio]
[2024/05] MapCoder: Generación de código multiagente para la resolución competitiva de problemas. Islam y otros. LCA. [papel] [repositorio]
[2024/05] MARE: Marco de colaboración multiagentes para ingeniería de requisitos. Jin et al. arXiv. [papel]
[2024/04] AutoCodeRover: Mejora del programa autónomo. Zhang et al. ISSTA. [papel] [repositorio]
[2024/04] ¿Hasta dónde podemos llegar con la reparación práctica de programas a nivel de función? Xiang et al. arXiv. [papel] [repositorio]
[2024/03] CodeS: Repositorio de lenguaje natural a código a través de un boceto multicapa. Zan et al. arXiv. [papel] [repositorio]
[2024/03] Cuando la generación de código basada en LLM se encuentra con el proceso de desarrollo de software. Lin et al. arXiv. [papel] [repositorio]
[2024/03] AGENTFL: Ampliación de la localización de fallas basada en LLM al contexto a nivel de proyecto. Qin y cols. arXiv. [papel]
[2024/02] Cuando el análisis de flujo de datos se encuentra con modelos de lenguaje grandes. Wang y cols. arXiv. [papel]
[02/2024] CodeAgent: Agentes Colaboradores para la Ingeniería de Software. Tang y cols. arXiv. [papel] [repositorio]
[2024/02] Más agentes es todo lo que necesita. Li y col. arXiv. [papel]
[2024/01] Experimentando una nueva práctica de programación con LLM. Zhang et al. arXiv. [papel] [repositorio]
[2023/11] Agentes autónomos en el desarrollo de software: un documento de visión Rasheed et al. arXiv. [papel]
[2023/10] Análisis de código estático en la era de la IA: una exploración en profundidad del concepto, la función y el potencial del análisis de código inteligente. Fan et al. arXiv. [papel]
[2023/10] Detección de vulnerabilidades de contratos inteligentes basada en modelos de lenguaje grande: nuevas perspectivas. Hu et al. TPS-ISA. [papel] [repositorio]
[2023/10] Fuzzing del compilador de caja blanca potenciado por modelos de lenguaje grandes. Yang et al. arXiv. [papel] [repositorio]
[2023/10] Red dinámica de agentes LLM: un marco de colaboración de agentes LLM con optimización del equipo de agentes. Liu y cols. arXiv. [papel] [repositorio]
[2023/08] METAGPT: METAPROGRAMACIÓN PARA UN MARCO COLABORATIVO MULTIAGENTE. Hong et al. ICLR. [papel] [repositorio]
[2023/08] Flujos: componentes básicos de la IA de razonamiento y colaboración. Josifoski et al. arXiv. [papel] [repositorio]
[2023/07] Agentes Comunicativos para el Desarrollo de Software. Qian et al. LCA. [papel] [repositorio]
[2023/05] Autoedición: editor de código con reconocimiento de fallas para generación de código . Zhang et al. LCA. papel
[2023/04] LLM de código bajo: programación visual sobre LLM. Cai et al. arXiv. [papel] [repositorio]
Estructura circular
[2024/05] AutoCoder: Mejora del modelo de lenguaje grande de código con AIEV-INSTRUCT. Lei et al. arXiv. [papel] [repositorio]
[2024/04] Un enfoque de depuración unificado a través de una sinergia de agentes múltiples basada en LLM. Lee y cols. arXiv. [papel] [repositorio]
[2024/03] ACFIX: Orientación de los LLM con prácticas RBAC comunes extraídas para la reparación contextual de vulnerabilidades de control de acceso en contratos inteligentes. Zhang et al. arXiv. [papel]
[2024/03] Consenso de múltiples funciones a través de debates de LLM para la detección de vulnerabilidades. Mao et al. QRS. [papel]
[2024/03] Combinación de agentes de ajuste fino y basados en LLM para una auditoría intuitiva de contratos inteligentes con justificaciones. Ma et al. arXiv. [papel] [repositorio]
[2024/02] Desarrollo basado en pruebas para la generación de código. Mathews y cols. arXiv. [papel] [repositorio]
[2024/02] CodePori: Modelo a gran escala para el desarrollo autónomo de software mediante el uso de múltiples agentes. Rashid y cols. arXiv. [papel]
[2023/12] Coaprendizaje experiencial de agentes desarrolladores de software. Qian et al. LCA. [papel] [repositorio]
[2023/12] AgentCoder: Generación de código basada en múltiples agentes con pruebas y optimización iterativas. Huang et al. arXiv. [papel]
[2023/11] INTERVENTOR: Impulsar la capacidad de codificación de modelos de lenguaje grandes con la cadena interactiva de reparación. Wang y cols. LCA. [papel] [repositorio]
[2023/11] Pruebas de GUI móviles basadas en intención con agentes autónomos de modelos de lenguaje grande . Yoon et al. ICST. [papel] [repositorio]
[2023/10] AXNav: Reproducción de pruebas de accesibilidad desde lenguaje natural. Taeb et al. CHI. [papel]
[2023/06] ¿ES LA AUTOREPARACIÓN UNA BALA DE PLATA PARA LA GENERACIÓN DE CÓDIGOS? Olausson et al. ICLR. [papel] [repositorio]
[2023/03] CAMEL: Agentes comunicativos para la exploración “mente” de una gran sociedad modelo lingüística. Li y col. NeurIPS. [papel] [repositorio]
[2023/03] Reflexión: Agentes del lenguaje con aprendizaje por refuerzo verbal. Shinn et al. NeurIPS. [papel] [repositorio]
Estructura en forma de árbol
[2024/06] Ampliación de la colaboración entre múltiples agentes basada en modelos de lenguaje grande Qian et al. arXiv. [papel] [repositorio]
[2024/06] MASAI: Arquitectura modular para agentes de IA de ingeniería de software. Arora et al. arXiv. [papel]
[2024/04] Agentes autoorganizados: un marco de LLM multiagente hacia la generación y optimización de código a ultra gran escala. Ishibashi et al. arXiv. [papel] [repositorio]
Estructura similar a una estrella
[2024/06] Ampliación de la colaboración entre múltiples agentes basada en modelos de lenguaje grande Qian et al. arXiv. [papel] [repositorio]
[2024/03] AutoDev: desarrollo automatizado impulsado por IA . Tufano et al. arXiv [papel]
[2024/01] XUAT-Copilot: Sistema colaborativo multiagente para pruebas automatizadas de aceptación de usuarios con modelo de lenguaje grande. Wang y cols. arXiv. [papel]
[2023/10] RCAgent: Análisis de la causa raíz de la nube por parte de agentes autónomos con modelos de lenguaje grandes aumentados por herramientas. Wang y cols. arXiv. [papel]
[2023/08] AutoGen: Habilitación de aplicaciones LLM de próxima generación a través de una conversación entre múltiples agentes. Wu et al. arXiv. [papel] [repositorio]
Estructura de malla
[2024/06] Ampliación de la colaboración entre múltiples agentes basada en modelos de lenguaje grande Qian et al. arXiv. [papel] [repositorio]
[2024/04] 3DGen: Generación asistida por IA de analizadores de formato binario demostrablemente correctos . Fakhoury et al. arXiv [papel]
[2024/01] Experimentando una nueva práctica de programación con LLM. Zhang et al. arXiv. [papel] [repositorio]
[2024/01] LLM4PLC: Aprovechamiento de modelos de lenguaje grandes para la programación verificable de PLC en sistemas de control industrial. Fakih et al. CISE. [papel] [repositorio]
[2023/10] Análisis de código estático en la era de la IA: una exploración en profundidad del concepto, la función y el potencial del análisis de código inteligente. Fan et al. arXiv. [papel]
[2023/04] LLM de código bajo: programación visual sobre LLM. Cai et al. arXiv. [papel] [repositorio]
[2024/05] MARE: Marco de colaboración multiagentes para ingeniería de requisitos. Jin et al. arXiv. [papel]
[2024/02] Las acciones de código ejecutable generan mejores agentes de LLM. Wang y cols. ICML. [papel] [repositorio]
[2024/01] Experimentando una nueva práctica de programación con LLM. Zhang et al. arXiv. [papel] [repositorio]
[2023/10] ClarifyGPT: Potenciar la generación de código basada en LLM con aclaración de intenciones. Mu et al. arXiv. [papel] [repositorio]
[2023/06] Prompt Sapper: Infraestructura de ingeniería de software habilitada por LLM para servicios nativos de IA. Xing et al. arXiv. [papel]
[2024/03] CodeS: Repositorio de lenguaje natural a código a través de un boceto multicapa. Zan et al. arXiv. [papel] [repositorio]
[2024/01] LLM4PLC: Aprovechamiento de modelos de lenguaje grandes para la programación verificable de PLC en sistemas de control industrial. Fakih et al. CISE. [papel] [repositorio]
[2023/09] MINT: EVALUACIÓN DE LLMS EN INTERACCIÓN MULTITURNOS CON HERRAMIENTAS Y RETROALIMENTACIÓN DEL LENGUAJE. Wang y cols. ICLR. [papel] [repositorio]
[2023/08] Flujos: componentes básicos de la IA de razonamiento y colaboración. Josifoski et al. arXiv. [papel] [repositorio]
[2023/08] AutoGen: Habilitación de aplicaciones LLM de próxima generación a través de una conversación entre múltiples agentes. Wu et al. arXiv. [papel] [repositorio]
[2024/01] Experimentando una nueva práctica de programación con LLM. Zhang et al. arXiv. [papel] [repositorio]
[2023/08] Gentopia: una plataforma colaborativa para LLM mejorados con herramientas. Xu et al. EMNLP. [papel] [repositorio]
[2023/06] Prompt Sapper: Infraestructura de ingeniería de software habilitada por LLM para servicios nativos de IA. Xing et al. arXiv. [papel]
[2023/03] ART: Razonamiento automático de varios pasos y uso de herramientas para modelos de lenguaje grandes. Paranjape et al. arXiv. [papel] [repositorio]
@misc{Agent4SE, title={Agentes basados en modelos de lenguaje grande para ingeniería de software: una encuesta}, autor={Junwei Liu y Kaixin Wang y Yixuan Chen y Xin Peng y Zhenpeng Chen y Lingming Zhang y Yiling Lou}, año={2024}, eprint={2409.02977}, archivePrefix={arXiv}, PrimaryClass={cs.SE} , URL={https://arxiv.org/abs/2409.02977}, }
Junwei Liu @To-D
Kaixin Wang @wkx228
Yixuan Chen @FloridaSpidee
No dude en hacernos cualquier pregunta o brindarnos algunas sugerencias a través de:
Junwei Liu: [email protected]