大規模言語モデル (LLM) の最近の進歩により、AI エージェント、つまり LLM ベースのエージェントの新しいパラダイムが形成されました。スタンドアロン LLM と比較して、LLM ベースのエージェントは、外部リソースとツールを認識して利用する機能で LLM を強化することにより、LLM の多用途性と専門知識を大幅に拡張します。現在までに、LLM ベースのエージェントが適用され、ソフトウェア エンジニアリング (SE) において顕著な効果を示しています。複数のエージェントと人間の相互作用の間の相乗効果は、現実世界の複雑な SE 問題への取り組みにおいてさらなる期待をもたらします。この研究では、SE 向けの LLM ベースのエージェントに関する包括的かつ体系的な調査を紹介します。 106件の論文を収集し、SE視点とエージェント視点の2つの視点から分類しました。さらに、この重要な領域における未解決の課題と将来の方向性についても議論します。
?ソフトウェア エンジニアリングタスクとエージェント アーキテクチャの両方の観点から、Agent4SE の進捗状況を体系的にまとめました。
?論文リンク: ソフトウェアエンジニアリングのための大規模言語モデルベースのエージェント: 調査
この研究分野は急速に進化しています。更新情報を入手するには、このリポジトリにスターを付けてください!
[2024/09/04] arXiv にてアンケートの第一弾を公開しました。
ニュース
SEの視点
障害の位置特定
プログラムの修復
統合デバッグ
単体テスト
システムテスト
静的バグの検出
コードレビュー
要件エンジニアリング
コード生成
検証
静的コードチェック
テスト
デバッグ
リリース
エンドツーエンドのソフトウェア開発
エンドツーエンドのソフトウェア保守
エージェントの視点
計画段階
要件フェーズ
開発段階
評価フェーズ
エージェントの役割
連携の仕組み
企画
メモリ
感知
アクション
エージェントフレームワーク
マルチエージェントシステム
ヒューマンエージェントのコラボレーション
引用
メンテナー
お問い合わせ
スターの歴史
[2024/05] MARE: 要件エンジニアリングのためのマルチエージェント コラボレーション フレームワーク。ジンら。 arXiv。 [紙]
[2024/04] Elicitron: 設計要件抽出のための LLM エージェントベースのシミュレーション フレームワーク。アタエイら。 arXiv。 [紙]
[2024/01] SpecGen: 大規模言語モデルによる正式なプログラム仕様の自動生成。マら。 arXiv。 [論文] [リポジトリ]
[2023/10]生成 AI による要件エンジニアリングの推進: LLM の役割の評価。アローラら。 arXiv。 [紙]
[2024/11]計画駆動型プログラミング: 大規模言語モデルのプログラミング ワークフローLei et al. arXiv [論文]
[2024/11] Chain-of-Programming: Empowering Large Language Models for Geospatial Code Generation Hou et al. arXiv [論文]
[2024/10] LLM のためのマルチプログラミング言語サンドボックスDou et al. arXiv [論文]
[2024/10] SceneGenAgent: コーディング エージェントXia らによる正確な産業シーン生成。 arXiv [論文] [リポジトリ]
[2024/10] MCCoder: LLM 支援コード生成と厳格な検証によるモーション コントロールの合理化Li et al. arXiv [論文] [リポジトリ]
[2024/10] Agents4PLC: LLM ベースのエージェントを使用した産業用制御システムにおける閉ループ PLC コードの生成と検証の自動化Liu et al. arXiv [論文] [リポジトリ]
[2024/10] LLM オプティマイザーを使用した DSL 駆動のコード生成による並列プログラムのパフォーマンスの向上Wei ら。 arXiv。 [紙]
[2024/10] AgentBank: 50000 以上のインタラクション軌跡の微調整による LLM エージェントの一般化に向けてSong et al。 arXiv。 [紙]
[2024/10] RLEF: 強化学習による実行フィードバックにおけるグラウンディング コード LLMS Gehring et al. arXiv。 [紙]
[2024/10]教師よりも優れています: 特権 AI フィードバックから学ぶ LLM エージェントChoudhury らarXiv。 [紙]
[2024/10] AMR-Evol: Adaptive Modular Response Evolution Elicits Better Knowledge Distillation for Large Language Models in Code Generation Luo et al. arXiv。 [論文] [リポジトリ]
[2024/10] RGD: 改良と生成ガイダンスによるマルチ LLM ベースのエージェント デバッガーJin et al. arXiv。 [紙]
[2024/09] AutoSafeCoder: 静的解析とファズ テストを通じて LLM コード生成を保護するためのマルチエージェント フレームワークNunez et al。 arXiv [論文] [リポジトリ]
[2024/09]マルチプラン探索とフィードバック駆動型改良によるコード生成のためのペア プログラミング フレームワークZhang et al. arXiv [論文] [リポジトリ]
[2024/08]もみ殻のふるい分け: 生成されたコード候補をランキングするための実行フィードバックの活用についてSun et al. arXiv [論文]
[2024/08] CODEXGRAPH: コード グラフ データベースを介した大規模言語モデルとコード リポジトリの橋渡しLiu et al. arXiv。 [論文] [リポジトリ]
[2024/07] OPENHANDS: ジェネラリストエージェントとしての AI ソフトウェア開発者のためのオープンプラットフォームWang et al. arXiv [論文] [リポジトリ]
[2024/05]リポジトリを介した反復的なツール強化推論を使用した自然言語からのクラスレベルのコード生成。デシュパンデら。 arXiv。 [紙]
[2024/05] MapCoder: 競争力のある問題解決のためのマルチエージェント コード生成。イスラムなど。 ACL。 [論文] [リポジトリ]
[2024/05] AutoCoder: AIEV-INSTRUCT によるコード大規模言語モデルの強化。レイら。 arXiv。 [論文] [リポジトリ]
[2024/04] 3DGen: AI 支援による証明可能なバイナリ形式パーサーの生成。 Fakhoury et al. arXiv [論文]
[2024/04]自己組織化エージェント: 超大規模コード生成と最適化に向けた LLM マルチエージェント フレームワーク。石橋ら。 arXiv。 [論文] [リポジトリ]
[2024/03] AutoDev: 自動化された AI 主導の開発。トゥファノら。 arXiv [論文]
[2024/03] CoCoST: オンライン検索と正確性テストによる複雑なコードの自動生成。彼らは、 arXiv。 [紙]
[2024/03] RAT: 検索拡張思考はロングホライズン世代における文脈認識推論を引き出す。王ら。 arXiv。 [論文] [リポジトリ]
[2024/02]実行可能コード アクションにより、より優れた LLM エージェントが導き出されます。王ら。 ICML。 [論文] [リポジトリ]
[2024/02]必要なのはエージェントの数だけです。リーら。 arXiv。 [紙]
[2024/02]コード生成のためのテスト駆動開発。マシューズら。 arXiv。 [論文] [リポジトリ]
[2024/02] LDB: ランタイム実行を段階的に検証する大規模言語モデル デバッガー。ゾンら。 arXiv。 [論文] [リポジトリ]
[2024/01] CodeAgent: 現実世界のリポジトリレベルのコーディング課題に対応するツール統合エージェント システムによるコード生成の強化。張ら。 ACL。 [紙]
[2024/01]コード LLM にリポジトリ レベルのコード生成でオートコンプリート ツールを使用するよう指導します。王ら。 arXiv。 [紙]
[2024/01] AlphaCodium によるコード生成: プロンプト エンジニアリングからフロー エンジニアリングへ。リドニクら。 arXiv。 [論文] [リポジトリ]
[2023/12] AgentCoder: 反復テストと最適化によるマルチエージェントベースのコード生成。黄ら。 arXiv。 [紙]
[2023/12] LLM4TDD: 大規模言語モデルを使用したテスト駆動開発のベスト プラクティス。ピヤら。 arXiv。 [論文] [リポジトリ]
[2023/11] INTERVENOR: インタラクティブな修復チェーンによる大規模言語モデルのコーディング能力の向上。王ら。 ACL。 [論文] [リポジトリ]
[2023/10]動的 LLM-エージェント ネットワーク: エージェント チームの最適化を備えた LLM-エージェント コラボレーション フレームワーク。劉ら。 arXiv。 [論文] [リポジトリ]
[2023/10]キツネザル: 言語エージェントのための自然言語とコードの調和。徐ら。 ICLR。 [論文] [リポジトリ]
[2023/10] ClarifyGPT: 意図の明確化による LLM ベースのコード生成の強化。ムーら。 arXiv。 [論文] [リポジトリ]
[2023/10] CODECHAIN: 代表的なサブモジュールによる自己改訂のチェーンによるモジュールコード生成に向けて。ルら。 ICLR。 [論文] [リポジトリ]
[2023/10]言語エージェント ツリー検索により、言語モデルの推論、動作、計画が統合されます。周ら。 ICML。 [論文] [リポジトリ]
[2023/09]ミント: ツールと言語フィードバックを使用したマルチターン インタラクションで LLMS を評価します。王ら。 ICLR。 [論文] [リポジトリ]
[2023/09]より良いコード生成のための大規模言語モデルにおけるテストケース駆動型プログラミングの理解。ティアンら。 arXiv。 [紙]
[2023/09] CodePlan: LLM を使用したリポジトリ レベルのコーディングと計画。バイリら。 FSE。 [論文] [リポジトリ]
[2023/09]誤用から熟練へ: 知識主導型 AI チェーンによるコード生成の強化。レンら。 ASE。 [紙]
[2023/09] Parsel?: 分解の合成による言語モデルによるアルゴリズム推論。ゼリクマンら。 NeurIPS。 [論文] [リポジトリ]
[2023/08] AutoGen: マルチエージェント会話による次世代 LLM アプリケーションの有効化。ウーら。 arXiv。 [論文] [リポジトリ]
[2023/08] Gentopia: ツール拡張 LLM のための共同プラットフォーム。徐ら。 EMNLP。 [論文] [リポジトリ]
[2023/08]フロー: 推論と協調 AI の構築ブロック。ジョシフォスキーら。 arXiv。 [論文] [リポジトリ]
[2023/08] CodeCoT: コード生成のための CoT 推論におけるコード構文エラーへの取り組み。黄ら。 arXiv。 [紙]
[2023/06] SELFEVOLVE: 大規模言語モデルによるコード進化フレームワーク。ジャンら。 arXiv。 [紙]
[2023/06] InterCode: 実行フィードバックを使用したインタラクティブ コーディングの標準化とベンチマーク。ヤンら。 NeurIPS。 [論文] [リポジトリ]
[2023/06]自己修復はコード生成の銀の弾丸ですか?オラウソンら。 ICLR。 [論文] [リポジトリ]
[2023/05] ToolCoder: コード生成モデルに API 検索ツールの使用を教えます。張ら。 arXiv。 [紙]
[2023/05]自己編集: コード生成のための障害認識コード エディター。張ら。 ACL。 [紙]
[2023/04]大規模な言語モデルに自己デバッグを教える。チェンら。 ICLR。 [紙]
[2023/04]大規模な言語モデルによる完全自律型プログラミング。リベンツェフら。ゲッコウ。 [紙]
[2023/03] CAMEL: 大言語モデル社会の「心」探求のためのコミュニケーションエージェント。リーら。 NeurIPS。 [論文] [リポジトリ]
[2023/03]リフレクション: 言語強化学習を備えた言語エージェント。シンら。 NeurIPS。 [論文] [リポジトリ]
[2023/03] SELF-REFINE: 自己フィードバックによる反復的な改良。マダンら。 NeurIPS。 [論文] [リポジトリ]
[2024/10] Self-Evolution Chen らによる Rust コードの自動プルーフ生成。 arXiv [論文]
[2024/09] AutoVerus: Rust コードの自動プルーフ生成Yang et al. arXiv [論文]
[2024/10]効率的かつ正確なスマート コントラクト監査のための微調整された言語モデルの活用Wei et al. arXiv [論文] [リポジトリ]
[2024/10] LLM-SmartAudit: 高度なスマート コントラクトの脆弱性検出Wei et al。 arXiv。 [論文] [リポジトリ]
[2024/05]セキュリティ脆弱性を検出するための LLM 支援静的分析。リーら。 arXiv。 [紙]
[2024/05] PropertyGPT: 検索拡張プロパティ生成による LLM 主導のスマート コントラクトの正式検証。劉ら。 arXiv。 [論文] [リポジトリ]
[2024/03]脆弱性検出のための LLM ディスカッションによるマルチロールのコンセンサス。マオら。 QRS。 [紙]
[2024/03]微調整と LLM ベースのエージェントを組み合わせて、直感的なスマート コントラクト監査と正当化を実現。マら。 arXiv。 [論文] [リポジトリ]
[2024/02]データフロー分析が大規模言語モデルと出会うとき。王ら。 arXiv。 [紙]
[2024/01] LLM4Vuln: LLM の脆弱性推論を分離および強化するための統合評価フレームワーク。サンら。 arXiv。 [論文] [リポジトリ]
[2023/12] E&V: 擬似コードの実行と検証によって大規模な言語モデルに静的分析を実行するよう促す。ハオら。 arXiv。 [紙]
[2023/10]大規模言語モデルを活用したスマート コントラクトの脆弱性検出: 新しい視点。胡ら。 TPS-ISA。 [論文] [リポジトリ]
[2023/10] AI 時代の静的コード分析: インテリジェント コード分析の概念、機能、可能性を徹底的に探ります。ファンら。 arXiv。 [紙]
[2023/08]実用的なバグ検出のための静的解析の強化: LLM 統合アプローチ。リーら。 arXiv。 [論文] [リポジトリ]
[2023/03] ART: 大規模な言語モデルに対する自動マルチステップ推論とツールの使用。パランジャペら。 arXiv。 [論文] [リポジトリ]
[2024/10]裁判官としてのエージェント: エージェントZhuge らによるエージェントの評価arXiv。 [論文] [リポジトリ]
[2024/09]分割統治: ローカリゼーションと改訂によるコード改訂の自動化Wang et al. ACMトランス。ソフトウェア。工学メソドール。 [紙]
[2024/04] LLM を使用した AI を活用したコード レビュー: 初期の結果。ラシードら。 arXiv。 [紙]
[2024/02] CodeAgent: ソフトウェア エンジニアリングのための共同エージェント。タンら。 arXiv。 [論文] [リポジトリ]
[2023/10] AI 時代の静的コード分析: インテリジェント コード分析の概念、機能、可能性を徹底的に探ります。ファンら。 arXiv。 [紙]
[2023/09] CORE: LLM を使用したコード品質の問題の解決。ワドワら。 FSE。 [論文] [リポジトリ]
[2024/11] ReAccept: 動的検証と大規模言語モデルに基づくプロダクション コードとテスト コードの自動共進化Chi et al. arXiv [論文] [リポジトリ]
[2024/09] LLM を利用したコード生成による Python シンボリック実行Wang et al. arXiv [論文]
[2024/06] Mokav: LLM を使用した実行主導の差分テスト。エテマディら。 arXiv。 [論文] [リポジトリ]
[2024/04]プログラム分析による、カバーが難しいブランチに対する LLM ベースのテスト生成を強化します。ヤンら。 arXiv。 [紙]
[2024/03] AutoDev: 自動化された AI 主導の開発。トゥファノら。 arXiv [論文]
[2024/03] COVERUP: カバレッジに基づく LLM ベースのテスト生成。ピッツォルノら。 arXiv。 [論文] [リポジトリ]
[2023/08]事前トレーニングされた大規模言語モデルとミューテーション テストを使用した効果的なテスト生成。ダケルら。情報ソフトウェア。テクノロジー。 。 [論文] [リポジトリ]
[2023/05]手動テストはもう不要ですか?単体テスト生成のための ChatGPT の評価と改善。ユアンら。 arXiv。 [論文] [リポジトリ]
[2023/05] ChatUniTest: LLM ベースのテスト生成のためのフレームワーク。チェンら。 FSE。 [論文] [リポジトリ]
[2023/02]単体テストの自動生成のための大規模言語モデルの使用に関する実証的評価。シェーファーら。 IEEEトランス。ソフトウェア工学.. [論文] [リポジトリ]
[2024/11] A Code Knowledge Graph-Enhanced System for LLM-Based Fuzz Driver Generation Xu et al. arXiv。 [紙]
[2024/07]マルチモーダル大規模言語モデルによるビジョン主導の自動モバイル GUI テスト。劉ら。 arXiv。 [論文] [リポジトリ]
[2024/04] LLM エージェントは 1 日限りの脆弱性を自律的に悪用できる。ファングら。 arXiv。 [紙]
[2024/02]今すぐ REST できます: 大規模な言語モデルを使用した RESTful API の自動仕様推論とブラック ボックス テスト。デクロップら。 arXiv。 [論文] [リポジトリ]
[2024/01] XUAT-Copilot: 大規模言語モデルを使用した自動ユーザー受け入れテストのためのマルチエージェント協調システム。王ら。 arXiv。 [紙]
[2024/01] KernelGPT: 大規模言語モデルによるカーネル ファジングの強化。ヤンら。 arXiv。 [紙]
[2023/11]自律型大規模言語モデル エージェントを使用したインテント駆動型モバイル GUI テスト。ユンら。 ICST。 [論文] [リポジトリ]
[2023/10] LLM をテストのエキスパートにする: 機能を意識した意思決定により、モバイル GUI テストに人間のようなインタラクションをもたらします。劉ら。 ICSE。 [紙]
[2023/10] AXNav: 自然言語からのアクセシビリティ テストの再生。テイブら。ち。 [紙]
[2023/10]大規模な言語モデルによって強化されたホワイトボックス コンパイラーのファジング。ヤンら。 arXiv。 [論文] [リポジトリ]
[2023/10]限界のテスト: 大規模な言語モデルを使用したモバイル アプリのクラッシュ検出のための異常なテキスト入力の生成。劉ら。 ICSE。 [論文] [リポジトリ]
[2023/08] PENTESTGPT: LLM を利用した自動侵入テスト ツール。デンら。 arXiv。 [論文] [リポジトリ]
[2023/08] Fuzz4All: 大規模な言語モデルを使用したユニバーサル ファジング。シアら。 ICSE。 [論文] [リポジトリ]
[2023/07]大規模な言語モデルを使用して効果的な監視プログラムを生成することでコンパイラのバグを分離します。トゥーら。 IEEEトランス。ソフトウェア工学[論文] [リポジトリ]
[2023/06]必要なのはプロンプトだけです: 大規模な言語モデルを使用した自動 Android バグ リプレイ。フェンら。 ICSE。 [論文] [リポジトリ]
[2024/11] FlexFL: オープンソースの大規模言語モデルを使用した柔軟で効果的な障害位置特定Xu et al. arXiv [論文]
[2024/09] LLM エージェントと自己リフレクションを使用した順序付きコード分析による障害位置特定の強化Rafi ら。 arXiv [論文]
[2024/03] AGENTFL: LLM ベースの障害位置特定をプロジェクト レベルのコンテキストに拡張。秦ら。 arXiv。 [紙]
[2023/10] RCAgent: ツール拡張された大規模言語モデルを使用した自律エージェントによるクラウド根本原因分析。王ら。 arXiv。 [紙]
[2023/08] LLM ベースの説明可能な故障位置特定の定量的および定性的評価。カンら。 FSE。 [紙]
[2024/07] OPENHANDS: ジェネラリストエージェントとしての AI ソフトウェア開発者のためのオープンプラットフォームWang et al. arXiv [論文] [リポジトリ]
[2024/10]大規模言語モデルを使用した効率的なプログラム修復のためのセマンティックガイド検索Thanh et al. arXiv [論文]
[2024/09]テストの不安定性の神経象徴的修復。チェンら。イスタ。 [紙]
[2024/04]実用的な関数レベルのプログラム修復でどこまでできるか?翔ら。 arXiv。 [論文] [リポジトリ]
[2024/03] RepairAgent: プログラム修復のための自律的な LLM ベースのエージェント。ブゼニアら。 arXiv。 [紙]
[2024/03] ACFIX: スマート コントラクトのアクセス制御の脆弱性をコンテキスト認識して修復するためのマイニングされた共通 RBAC プラクティスを使用して LLM をガイドします。張ら。 arXiv。 [紙]
[2024/02] CigaR: LLM を使用したコスト効率の高いプログラム修復。ヒドヴェギら。 arXiv。 [論文] [リポジトリ]
[2023/04]大規模言語モデル駆動の科学的デバッグによる説明可能な自動デバッグ。カンら。 arXiv。 [紙]
[2023/04]会話を続けましょう: ChatGPT を使用して 337 件のバグのうち 162 件を 1 件あたり 0.42 ドルで修正します。シアら。 arXiv。 [紙]
[2023/01]会話型自動プログラム改修。シアら。 arXiv。 [紙]
[2024/04] LLM ベースのマルチエージェント シナジーによる統合デバッグ アプローチ。リーら。 arXiv。 [論文] [リポジトリ]
[2024/02] LDB: ランタイム実行を段階的に検証する大規模言語モデル デバッガー。ゾンら。 arXiv。 [論文] [リポジトリ]
[2024/08] GoNoGo: 自動車ソフトウェアのリリース意思決定を合理化するための効率的な LLM ベースのマルチエージェント システムKhoee et al. arXiv [論文]
[2024/09] ChatGPT ZhaoらとペアリングするJavaコードを生成。理論コンピュータサイエンス[論文]
[2024/07]人間と AI のチームワークによるアジャイルベースの生成的ソフトウェア開発の強化Zhang et al. TOSEM [論文] [リポジトリ]
[2024/06]マルチエージェント ソフトウェア開発の実験: 統合プラットフォームに向けてSami et al. arXiv。 [紙]
[2024/06]大言語モデルベースのマルチエージェントコラボレーションのスケーリングQian et al. arXiv。 [論文] [リポジトリ]
[2024/06]チーム間のコラボレーションによるマルチエージェント ソフトウェア開発。デュら。 arXiv。 [論文] [リポジトリ]
[2024/06] AgileCoder: アジャイル手法に基づいたソフトウェア開発のための動的協調エージェント。グエンら。 arXiv。 [論文] [リポジトリ]
[2024/05]ソフトウェア開発エージェントの反復エクスペリエンスの改良。銭ら。 arXiv。 [紙]
[2024/03] LLM ベースのコード生成がソフトウェア開発プロセスに適合するとき。リンら。 arXiv。 [論文] [リポジトリ]
[2024/03] CodeS: マルチレイヤースケッチを介した自然言語からコードリポジトリへ。ザンら。 arXiv。 [論文] [リポジトリ]
[2024/02] CodePori: マルチエージェントを使用した自律ソフトウェア開発のための大規模モデル。ラシードら。 arXiv。 [紙]
[2024/01] LLM を使用した新しいプログラミングの実践を実験します。張ら。 arXiv。 [論文] [リポジトリ]
[2024/01] LLM4PLC: 産業用制御システムにおける PLC の検証可能なプログラミングのための大規模言語モデルの利用。ファキら。 ICSE。 [論文] [リポジトリ]
[2023/12]ソフトウェア開発エージェントの体験型共同学習。銭ら。 ACL。 [論文] [リポジトリ]
[2023/11]ソフトウェア開発における自律エージェント: ビジョン論文Rasheed et al. arXiv。 [紙]
[2023/09] AutoAgents: エージェントを自動生成するためのフレームワーク。チェンら。 arXiv。 [論文] [リポジトリ]
[2023/08] AgentVerse: マルチエージェントのコラボレーションを促進し、緊急の動作を探索します。チェンら。 ICLR。 [論文] [リポジトリ]
[2023/08] METAGPT: マルチエージェントの協調フレームワークのためのメタ プログラミング。ホンら。 ICLR。 [論文] [リポジトリ]
[2023/07]ソフトウェア開発のためのコミュニケーションエージェント。銭ら。 ACL。 [論文] [リポジトリ]
[2023/06]マルチエージェントのコラボレーション: インテリジェント LLM エージェントの力を活用。タレビラドら。 arXiv。 [紙]
[2023/06] Prompt Sapper: AI ネイティブ サービスのための LLM を活用したソフトウェア エンジニアリング インフラストラクチャ。シンら。 arXiv。 [紙]
[2023/04] ChatGPT によるセルフコラボレーションコード生成。ドンら。 arXiv。 [論文] [リポジトリ]
[2023/04]ローコード LLM: LLM を介したビジュアル プログラミング。蔡ら。 arXiv。 [論文] [リポジトリ]
[2024/11]継続学習者としての LLM: ソフトウェア問題における欠陥コードの再現の改善Lin et al. arXiv [論文]
[2024/11] Human-In-the-Loop ソフトウェア開発エージェントTakerngsaksiri ら。 arXiv [論文]
[2024/11] Lingma SWE-GPT: 自動化されたソフトウェア改善のためのオープンな開発プロセス中心の言語モデルMa et al。 arXiv [論文] [リポジトリ]
[2024/10] RepoGraph: リポジトリ レベルのコード グラフによる AI ソフトウェア エンジニアリングの強化Ouyang et al. arXiv [論文] [リポジトリ]
[2024/09] MarsCode Agent: AI ネイティブの自動バグ修正Liu ら。 arXiv。 [紙]
[2024/08] CODEXGRAPH: コード グラフ データベースを介した大規模言語モデルとコード リポジトリの橋渡しLiu et al. arXiv。 [論文] [リポジトリ]
[2024/08]多様性がインテリジェンスを強化: ソフトウェア エンジニアリング エージェントの専門知識の統合Zhang et al. arXiv。 [紙]
[2024/08] SpecRover: LLM によるコード意図の抽出Ruan et al. arXiv。 [論文] [リポジトリ]
[2024/07] OPENHANDS: ジェネラリストエージェントとしての AI ソフトウェア開発者のためのオープンプラットフォームWang et al. arXiv [論文] [リポジトリ]
[2024/07]エージェントレス: LLM ベースのソフトウェア エンジニアリング エージェントをわかりやすく説明します。シアら。 arXiv。 [論文] [リポジトリ]
[2024/06]ソフトウェア リポジトリ全体を理解するにはどうすればよいですか?マら。 arXiv。 [論文] [リポジトリ]
[2024/06] CODER: マルチエージェントとタスク グラフによる問題解決。チェンら。 arXiv。 [論文] [リポジトリ]
[2024/06] MASAI: ソフトウェア エンジニアリング AI エージェント用のモジュラー アーキテクチャ。アローラら。 arXiv。 [紙]
[2024/05] SWE-Agent: エージェントとコンピューターのインターフェイスにより、自動化されたソフトウェア エンジニアリングが可能になります。ヤンら。 arXiv。 [論文] [リポジトリ]
[2024/04] AutoCodeRover: 自律的なプログラム改善。張ら。イスタ。 [論文] [リポジトリ]
[2024/03] MAGIS: GitHub の問題解決のための LLM ベースのマルチエージェント フレームワーク。タオら。 arXiv。 [紙]
ベンチマーク
[2024/10] SWE-Bench+: LLM の拡張コーディング ベンチマークAleithan et al. arXiv。 [紙]
[2024/10] SWE ベンチ マルチモーダル: AI システムはビジュアル ソフトウェア ドメインに一般化しますか?ヤンら。 arXiv。 [論文] [リポジトリ]
[2024/08] SWE-bench-java: Java Zan らの GitHub 問題解決ベンチマークarXiv [論文] [リポジトリ]
[2024/07]エージェントレス: LLM ベースのソフトウェア エンジニアリング エージェントをわかりやすく説明します。シアら。 arXiv。 [論文] [リポジトリ]
[2023/10] Swe-bench: 言語モデルは現実世界の github の問題を解決できますか?ヒメネスら。 ICLR [論文] [リポジトリ]
シングルターン計画
[2024/06] AgileCoder: アジャイル手法に基づいたソフトウェア開発のための動的協調エージェント。グエンら。 arXiv。 [論文] [リポジトリ]
[2024/06]チーム間のコラボレーションによるマルチエージェント ソフトウェア開発。デュら。 arXiv。 [論文] [リポジトリ]
[2024/05] MapCoder: 競争力のある問題解決のためのマルチエージェント コード生成。イスラムなど。 ACL。 [論文] [リポジトリ]
[2024/03] MAGIS: GitHub の問題解決のための LLM ベースのマルチエージェント フレームワーク。タオら。 arXiv。 [紙]
[2024/03] CodeS: マルチレイヤースケッチを介した自然言語からコードリポジトリへ。ザンら。 arXiv。 [論文] [リポジトリ]
[2024/03] CoCoST: オンライン検索と正確性テストによる複雑なコードの自動生成。彼らは、 arXiv。 [紙]
[2024/02] CodePori: マルチエージェントを使用した自律ソフトウェア開発のための大規模モデル。ラシードら。 arXiv。 [紙]
[2024/01] CodeAgent: 現実世界のリポジトリレベルのコーディング課題に対応するツール統合エージェント システムによるコード生成の強化。張ら。 ACL。 [紙]
[2024/01] LLM4PLC: 産業用制御システムにおける PLC の検証可能なプログラミングのための大規模言語モデルの利用。ファキら。 ICSE。 [論文] [リポジトリ]
[2024/01] LLM を使用した新しいプログラミングの実践を実験します。張ら。 arXiv。 [論文] [リポジトリ]
[2023/11]ソフトウェア開発における自律エージェント: ビジョン論文Rasheed et al. arXiv。 [紙]
[2023/10] AI 時代の静的コード分析: インテリジェント コード分析の概念、機能、可能性を徹底的に探ります。ファンら。 arXiv。 [紙]
[2023/09] Parsel?: 分解の合成による言語モデルによるアルゴリズム推論。ゼリクマンら。 NeurIPS。 [論文] [リポジトリ]
[2023/08] PENTESTGPT: LLM を利用した自動侵入テスト ツール。デンら。 arXiv。 [論文] [リポジトリ]
[2023/08]フロー: 推論と協調 AI の構築ブロック。ジョシフォスキーら。 arXiv。 [論文] [リポジトリ]
[2023/08] METAGPT: マルチエージェントの協調フレームワークのためのメタ プログラミング。ホンら。 ICLR。 [論文] [リポジトリ]
[2023/07]ソフトウェア開発のためのコミュニケーションエージェント。銭ら。 ACL。 [論文] [リポジトリ]
[2023/04] ChatGPT によるセルフコラボレーションコード生成。ドンら。 arXiv。 [論文] [リポジトリ]
[2023/04]ローコード LLM: LLM を介したビジュアル プログラミング。蔡ら。 arXiv。 [論文] [リポジトリ]
マルチターンプランニング
[2024/03] RAT: 検索拡張思考はロングホライズン世代における文脈認識推論を引き出す。王ら。 arXiv。 [論文] [リポジトリ]
反応っぽい
[2024/06] MASAI: ソフトウェア エンジニアリング AI エージェント用のモジュラー アーキテクチャ。アローラら。 arXiv。 [紙]
[2024/02]実行可能コード アクションにより、より優れた LLM エージェントが導き出されます。王ら。 ICML。 [論文] [リポジトリ]
[2024/01] CodeAgent: 現実世界のリポジトリレベルのコーディング課題に対応するツール統合エージェント システムによるコード生成の強化。張ら。 ACL。 [紙]
[2024/01] XUAT-Copilot: 大規模言語モデルを使用した自動ユーザー受け入れテストのためのマルチエージェント協調システム。王ら。 arXiv。 [紙]
[2023/11]自律型大規模言語モデル エージェントを使用したインテント駆動型モバイル GUI テスト。ユンら。 ICST。 [論文] [リポジトリ]
[2023/10] RCAgent: ツール拡張された大規模言語モデルを使用した自律エージェントによるクラウド根本原因分析。王ら。 arXiv。 [紙]
[2023/10]言語エージェント ツリー検索により、言語モデルの推論、動作、計画が統合されます。周ら。 ICML。 [論文] [リポジトリ]
[2023/10] AXNav: 自然言語からのアクセシビリティ テストの再生。テイブら。ち。 [紙]
[2023/09] CodePlan: LLM を使用したリポジトリ レベルのコーディングと計画。バイリら。 FSE。 [論文] [リポジトリ]
レイヤード
[2024/04]自己組織化エージェント: 超大規模コード生成と最適化に向けた LLM マルチエージェント フレームワーク。石橋ら。 arXiv。 [論文] [リポジトリ]
長期記憶
[2024/06]大言語モデルベースのマルチエージェントコラボレーションのスケーリングQian et al. arXiv。 [論文] [リポジトリ]
[2024/06]チーム間のコラボレーションによるマルチエージェント ソフトウェア開発。デュら。 arXiv。 [論文] [リポジトリ]
[2024/05]ソフトウェア開発エージェントの反復エクスペリエンスの改良。銭ら。 arXiv。 [紙]
[2023/12]ソフトウェア開発エージェントの体験型共同学習。銭ら。 ACL。 [論文] [リポジトリ]
[2023/11]自律型大規模言語モデル エージェントを使用したインテント駆動型モバイル GUI テスト。ユンら。 ICST。 [論文] [リポジトリ]
[2023/09] AutoAgents: エージェントを自動生成するためのフレームワーク。チェンら。 arXiv。 [論文] [リポジトリ]
[2023/08] METAGPT: マルチエージェントの協調フレームワークのためのメタ プログラミング。ホンら。 ICLR。 [論文] [リポジトリ]
[2023/07]ソフトウェア開発のためのコミュニケーションエージェント。銭ら。 ACL。 [論文] [リポジトリ]
[2023/03]リフレクション: 言語強化学習を備えた言語エージェント。シンら。 NeurIPS。 [論文] [リポジトリ]
短期記憶
[2024/07]マルチモーダル大規模言語モデルによるビジョン主導の自動モバイル GUI テスト。劉ら。 arXiv。 [論文] [リポジトリ]
[2024/06]大言語モデルベースのマルチエージェントコラボレーションのスケーリングQian et al. arXiv。 [論文] [リポジトリ]
[2024/06]チーム間のコラボレーションによるマルチエージェント ソフトウェア開発。デュら。 arXiv。 [論文] [リポジトリ]
[2024/06] AgileCoder: アジャイル手法に基づいたソフトウェア開発のための動的協調エージェント。グエンら。 arXiv。 [論文] [リポジトリ]
[2024/04]自己組織化エージェント: 超大規模コード生成と最適化に向けた LLM マルチエージェント フレームワーク。石橋ら。 arXiv。 [論文] [リポジトリ]
[2024/03] MAGIS: GitHub の問題解決のための LLM ベースのマルチエージェント フレームワーク。タオら。 arXiv。 [紙]
[2024/01] XUAT-Copilot: 大規模言語モデルを使用した自動ユーザー受け入れテストのためのマルチエージェント協調システム。王ら。 arXiv。 [紙]
[2023/12] E&V: 擬似コードの実行と検証によって大規模な言語モデルに静的分析を実行するよう促す。ハオら。 arXiv。 [紙]
[2023/11]自律型大規模言語モデル エージェントを使用したインテント駆動型モバイル GUI テスト。ユンら。 ICST。 [論文] [リポジトリ]
[2023/10] RCAgent: ツール拡張された大規模言語モデルを使用した自律エージェントによるクラウド根本原因分析。王ら。 arXiv。 [紙]
[2023/10] AI 時代の静的コード分析: インテリジェント コード分析の概念、機能、可能性を徹底的に探ります。ファンら。 arXiv。 [紙]
[2023/10] LLM をテストのエキスパートにする: 機能を意識した意思決定により、モバイル GUI テストに人間のようなインタラクションをもたらします。劉ら。 ICSE。 [紙]
[2023/09] CodePlan: LLM を使用したリポジトリ レベルのコーディングと計画。バイリら。 FSE。 [論文] [リポジトリ]
[2023/09] AutoAgents: エージェントを自動生成するためのフレームワーク。チェンら。 arXiv。 [論文] [リポジトリ]
[2023/08] METAGPT: マルチエージェントの協調フレームワークのためのメタ プログラミング。ホンら。 ICLR。 [論文] [リポジトリ]
[2023/07]ソフトウェア開発のためのコミュニケーションエージェント。銭ら。 ACL。 [論文] [リポジトリ]
[2023/03]リフレクション: 言語強化学習を備えた言語エージェント。シンら。 NeurIPS。 [論文] [リポジトリ]
共有記憶: 特殊な種類の短期記憶
[2024/06] AgileCoder: アジャイル手法に基づいたソフトウェア開発のための動的協調エージェント。グエンら。 arXiv。 [論文] [リポジトリ]
[2024/05] MARE: 要件エンジニアリングのためのマルチエージェント コラボレーション フレームワーク。ジンら。 arXiv。 [紙]
[2024/03] LLM ベースのコード生成がソフトウェア開発プロセスに適合するとき。リンら。 arXiv。 [論文] [リポジトリ]
[2024/03] AGENTFL: LLM ベースの障害位置特定をプロジェクト レベルのコンテキストに拡張。秦ら。 arXiv。 [紙]
[2023/08] METAGPT: マルチエージェントの協調フレームワークのためのメタ プログラミング。ホンら。 ICLR。 [論文] [リポジトリ]
[2023/04] ChatGPT によるセルフコラボレーションコード生成。ドンら。 arXiv。 [論文] [リポジトリ]
視覚的入力
[2024/10] SWE ベンチ マルチモーダル: AI システムはビジュアル ソフトウェア ドメインに一般化しますか?ヤンら。 arXiv。 [論文] [リポジトリ]
[2024/07]マルチモーダル大規模言語モデルによるビジョン主導の自動モバイル GUI テスト。劉ら。 arXiv。 [論文] [リポジトリ]
[2024/06]マルチエージェント ソフトウェア開発の実験: 統合プラットフォームに向けてSami et al. arXiv。 [紙]
[2024/01] XUAT-Copilot: 大規模言語モデルを使用した自動ユーザー受け入れテストのためのマルチエージェント協調システム。王ら。 arXiv。 [紙]
[2023/10] AXNav: 自然言語からのアクセシビリティ テストの再生。テイブら。ち。 [紙]
[2023/10]限界のテスト: 大規模な言語モデルを使用したモバイル アプリのクラッシュ検出のための異常なテキスト入力の生成。劉ら。 ICSE。 [論文] [リポジトリ]
[2023/08] METAGPT: マルチエージェントの協調フレームワークのためのメタ プログラミング。ホンら。 ICLR。 [論文] [リポジトリ]
検索ツール
[2024/05]リポジトリを介した反復的なツール強化推論を使用した自然言語からのクラスレベルのコード生成。デシュパンデら。 arXiv。 [紙]
[2024/04] LLM エージェントは 1 日限りの脆弱性を自律的に悪用できる。ファングら。 arXiv。 [紙]
[2024/03] AutoDev: 自動化された AI 主導の開発。トゥファノら。 arXiv [論文]
[2024/03] RepairAgent: プログラム修復のための自律的な LLM ベースのエージェント。ブゼニアら。 arXiv。 [紙]
[2024/03] CoCoST: オンライン検索と正確性テストによる複雑なコードの自動生成。彼らは、 arXiv。 [紙]
[2024/03] RAT: 検索拡張思考はロングホライズン世代における文脈認識推論を引き出す。王ら。 arXiv。 [論文] [リポジトリ]
[2024/02] CodePori: マルチエージェントを使用した自律ソフトウェア開発のための大規模モデル。ラシードら。 arXiv。 [紙]
[2024/01] LLM4Vuln: LLM の脆弱性推論を分離および強化するための統合評価フレームワーク。サンら。 arXiv。 [論文] [リポジトリ]
[2024/01] CodeAgent: 現実世界のリポジトリレベルのコーディング課題に対応するツール統合エージェント システムによるコード生成の強化。張ら。 ACL。 [紙]
[2023/12] E&V: 擬似コードの実行と検証によって大規模な言語モデルに静的分析を実行するよう促す。ハオら。 arXiv。 [紙]
[2023/12]ソフトウェア開発エージェントの体験型共同学習。銭ら。 ACL。 [論文] [リポジトリ]
[2023/11]自律型大規模言語モデル エージェントを使用したインテント駆動型モバイル GUI テスト。ユンら。 ICST。 [論文] [リポジトリ]
[2023/10]キツネザル: 言語エージェントのための自然言語とコードの調和。徐ら。 ICLR。 [論文] [リポジトリ]
[2023/10] RCAgent: ツール拡張された大規模言語モデルを使用した自律エージェントによるクラウド根本原因分析。王ら。 arXiv。 [紙]
[2023/10] AI 時代の静的コード分析: インテリジェント コード分析の概念、機能、可能性を徹底的に探ります。ファンら。 arXiv。 [紙]
[2023/08] METAGPT: マルチエージェントの協調フレームワークのためのメタ プログラミング。ホンら。 ICLR。 [論文] [リポジトリ]
[2023/08] PENTESTGPT: LLM を利用した自動侵入テスト ツール。デンら。 arXiv。 [論文] [リポジトリ]
[2023/08] AgentVerse: マルチエージェントのコラボレーションを促進し、緊急の動作を探索します。チェンら。 ICLR。 [論文] [リポジトリ]
[2023/08] Gentopia: ツール拡張 LLM のための共同プラットフォーム。徐ら。 EMNLP。 [論文] [リポジトリ]
[2023/08] AutoGen: マルチエージェント会話による次世代 LLM アプリケーションの有効化。ウーら。 arXiv。 [論文] [リポジトリ]
[2023/05] ToolCoder: コード生成モデルに API 検索ツールの使用を教えます。張ら。 arXiv。 [紙]
[2023/03] ART: 大規模な言語モデルに対する自動マルチステップ推論とツールの使用。パランジャペら。 arXiv。 [論文] [リポジトリ]
ファイル操作
[2024/08] SpecRover: LLM によるコード意図の抽出Ruan et al. arXiv。 [論文] [リポジトリ]
[2024/06] MASAI: ソフトウェア エンジニアリング AI エージェント用のモジュラー アーキテクチャ。アローラら。 arXiv。 [紙]
[2024/05]セキュリティ脆弱性を検出するための LLM 支援静的分析。リーら。 arXiv。 [紙]
[2024/05] SWE-Agent: エージェントとコンピューターのインターフェイスにより、自動化されたソフトウェア エンジニアリングが可能になります。ヤンら。 arXiv。 [論文] [リポジトリ]
[2024/04] LLM エージェントは 1 日限りの脆弱性を自律的に悪用できる。ファングら。 arXiv。 [紙]
[2024/03] RepairAgent: プログラム修復のための自律的な LLM ベースのエージェント。ブゼニアら。 arXiv。 [紙]
[2024/03] AutoDev: 自動化された AI 主導の開発。トゥファノら。 arXiv [論文]
[2023/04]大規模言語モデル駆動の科学的デバッグによる説明可能な自動デバッグ。カンら。 arXiv。 [紙]
GUI操作
[2024/07]マルチモーダル大規模言語モデルによるビジョン主導の自動モバイル GUI テスト。劉ら。 arXiv。 [論文] [リポジトリ]
[2024/01] XUAT-Copilot: 大規模言語モデルを使用した自動ユーザー受け入れテストのためのマルチエージェント協調システム。王ら。 arXiv。 [紙]
[2023/10] LLM をテストのエキスパートにする: 機能を意識した意思決定により、モバイル GUI テストに人間のようなインタラクションをもたらします。劉ら。 ICSE。 [紙]
[2023/10] AXNav: 自然言語からのアクセシビリティ テストの再生。テイブら。ち。 [紙]
[2023/10]限界のテスト: 大規模な言語モデルを使用したモバイル アプリのクラッシュ検出のための異常なテキスト入力の生成。劉ら。 ICSE。 [論文] [リポジトリ]
[2023/06]必要なのはプロンプトだけです: 大規模な言語モデルを使用した自動 Android バグ リプレイ。フェンら。 ICSE。 [論文] [リポジトリ]
静的プログラム解析
[2024/06]チーム間のコラボレーションによるマルチエージェント ソフトウェア開発。デュら。 arXiv。 [論文] [リポジトリ]
[2024/06] AgileCoder: アジャイル手法に基づいたソフトウェア開発のための動的協調エージェント。グエンら。 arXiv。 [論文] [リポジトリ]
[2024/06] MASAI: ソフトウェア エンジニアリング AI エージェント用のモジュラー アーキテクチャ。アローラら。 arXiv。 [紙]
[2024/05]リポジトリを介した反復的なツール強化推論を使用した自然言語からのクラスレベルのコード生成。デシュパンデら。 arXiv。 [紙]
[2024/05]セキュリティ脆弱性を検出するための LLM 支援静的分析。リーら。 arXiv。 [紙]
[2024/04] AutoCodeRover: 自律的なプログラム改善。張ら。イスタ。 [論文] [リポジトリ]
[2024/04]プログラム分析による、カバーが難しいブランチに対する LLM ベースのテスト生成を強化します。ヤンら。 arXiv。 [紙]
[2024/04] 3DGen: AI 支援による証明可能なバイナリ形式パーサーの生成。 Fakhoury et al. arXiv [論文]
[2024/03] AutoDev: 自動化された AI 主導の開発。トゥファノら。 arXiv [論文]
[2024/03] RepairAgent: プログラム修復のための自律的な LLM ベースのエージェント。ブゼニアら。 arXiv。 [紙]
[2024/03] COVERUP: カバレッジに基づく LLM ベースのテスト生成。ピッツォルノら。 arXiv。 [論文] [リポジトリ]
[2024/03] ACFIX: スマート コントラクトのアクセス制御の脆弱性をコンテキスト認識して修復するためのマイニングされた共通 RBAC プラクティスを使用して LLM をガイドします。張ら。 arXiv。 [紙]
[2024/03] AGENTFL: LLM ベースの障害位置特定をプロジェクト レベルのコンテキストに拡張。秦ら。 arXiv。 [紙]
[2024/02]データフロー分析が大規模言語モデルと出会うとき。王ら。 arXiv。 [紙]
[2024/02] LDB: ランタイム実行を段階的に検証する大規模言語モデル デバッガー。ゾンら。 arXiv。 [論文] [リポジトリ]
[2024/01]コード LLM にリポジトリ レベルのコード生成でオートコンプリート ツールを使用するよう指導します。王ら。 arXiv。 [紙]
[2024/01] CodeAgent: 現実世界のリポジトリレベルのコーディング課題に対応するツール統合エージェント システムによるコード生成の強化。張ら。 ACL。 [紙]
[2024/01] LLM4PLC: 産業用制御システムにおける PLC の検証可能なプログラミングのための大規模言語モデルの利用。ファキら。 ICSE。 [論文] [リポジトリ]
[2023/12] E&V: 擬似コードの実行と検証によって大規模な言語モデルに静的分析を実行するよう促す。ハオら。 arXiv。 [紙]
[2023/09] CodePlan: LLM を使用したリポジトリ レベルのコーディングと計画。バイリら。 FSE。 [論文] [リポジトリ]
[2023/08] CodeCoT: コード生成のための CoT 推論におけるコード構文エラーへの取り組み。黄ら。 arXiv。 [紙]
[2023/07]大規模な言語モデルを使用して効果的な監視プログラムを生成することでコンパイラのバグを分離します。トゥーら。 IEEEトランス。ソフトウェア工学.. [論文] [リポジトリ]
[2023/06]必要なのはプロンプトだけです: 大規模な言語モデルを使用した自動 Android バグ リプレイ。フェンら。 ICSE。 [論文] [リポジトリ]
動的解析
[2024/04]プログラム分析による、カバーが難しいブランチに対する LLM ベースのテスト生成を強化します。ヤンら。 arXiv。 [紙]
[2024/03] COVERUP: カバレッジに基づく LLM ベースのテスト生成。ピッツォルノら。 arXiv。 [論文] [リポジトリ]
[2024/03] AGENTFL: LLM ベースの障害位置特定をプロジェクト レベルのコンテキストに拡張。秦ら。 arXiv。 [紙]
[2024/02] LDB: ランタイム実行を段階的に検証する大規模言語モデル デバッガー。ゾンら。 arXiv。 [論文] [リポジトリ]
[2023/07]大規模な言語モデルを使用して効果的な監視プログラムを生成することでコンパイラのバグを分離します。トゥーら。 IEEEトランス。ソフトウェア工学.. [論文] [リポジトリ]
[2023/04]大規模言語モデル駆動の科学的デバッグによる説明可能な自動デバッグ。カンら。 arXiv。 [紙]
テストツール
[2024/09]テストの不安定性の神経象徴的修復。チェンら。イスタ。 [紙]
[2024/08] SpecRover: LLM によるコード意図の抽出Ruan et al. arXiv。 [論文] [リポジトリ]
[2024/06] AgileCoder: アジャイル手法に基づいたソフトウェア開発のための動的協調エージェント。グエンら。 arXiv。 [論文] [リポジトリ]
[2024/06] MASAI: ソフトウェア エンジニアリング AI エージェント用のモジュラー アーキテクチャ。アローラら。 arXiv。 [紙]
[2024/05] AutoCoder: AIEV-INSTRUCT によるコード大規模言語モデルの強化。レイら。 arXiv。 [論文] [リポジトリ]
[2024/05] MapCoder: 競争力のある問題解決のためのマルチエージェント コード生成。イスラムなど。 ACL。 [論文] [リポジトリ]
[2024/04]自己組織化エージェント: 超大規模コード生成と最適化に向けた LLM マルチエージェント フレームワーク。石橋ら。 arXiv。 [論文] [リポジトリ]
[2024/04] LLM ベースのマルチエージェント シナジーによる統合デバッグ アプローチ。リーら。 arXiv。 [論文] [リポジトリ]
[2024/04] LLM エージェントは 1 日限りの脆弱性を自律的に悪用できる。ファングら。 arXiv。 [紙]
[2024/04]プログラム分析による、カバーが難しいブランチに対する LLM ベースのテスト生成を強化します。ヤンら。 arXiv。 [紙]
[2024/04] 3DGen: AI 支援による証明可能なバイナリ形式パーサーの生成。 Fakhoury et al. arXiv [論文]
[2024/04] AutoCodeRover: 自律的なプログラム改善。張ら。イスタ。 [論文] [リポジトリ]
[2024/03] AutoDev: 自動化された AI 主導の開発。トゥファノら。 arXiv [論文]
[2024/03] LLM ベースのコード生成がソフトウェア開発プロセスに適合するとき。リンら。 arXiv。 [論文] [リポジトリ]
[2024/03] RepairAgent: プログラム修復のための自律的な LLM ベースのエージェント。ブゼニアら。 arXiv。 [紙]
[2024/03] CoCoST: オンライン検索と正確性テストによる複雑なコードの自動生成。彼らは、 arXiv。 [紙]
[2024/02]実行可能コード アクションにより、より優れた LLM エージェントが導き出されます。王ら。 ICML。 [論文] [リポジトリ]
[2024/02]コード生成のためのテスト駆動開発。マシューズら。 arXiv。 [論文] [リポジトリ]
[2024/01] AlphaCodium によるコード生成: プロンプト エンジニアリングからフロー エンジニアリングへ。リドニクら。 arXiv。 [論文] [リポジトリ]
[2024/01] LLM を使用した新しいプログラミングの実践を実験します。張ら。 arXiv。 [論文] [リポジトリ]
[2024/01] CodeAgent: 現実世界のリポジトリレベルのコーディング課題に対応するツール統合エージェント システムによるコード生成の強化。張ら。 ACL。 [紙]
[2023/12] AgentCoder: 反復テストと最適化によるマルチエージェントベースのコード生成。黄ら。 arXiv。 [紙]
[2023/12] LLM4TDD: 大規模言語モデルを使用したテスト駆動開発のベスト プラクティス。ピヤら。 arXiv。 [論文] [リポジトリ]
[2023/11] INTERVENOR: インタラクティブな修復チェーンによる大規模言語モデルのコーディング能力の向上。王ら。 ACL。 [論文] [リポジトリ]
[2023/10] ClarifyGPT: 意図の明確化による LLM ベースのコード生成の強化。ムーら。 arXiv。 [論文] [リポジトリ]
[2023/10]キツネザル: 言語エージェントのための自然言語とコードの調和。徐ら。 ICLR。 [論文] [リポジトリ]
[2023/10]大規模な言語モデルによって強化されたホワイトボックス コンパイラーのファジング。ヤンら。 arXiv。 [論文] [リポジトリ]
[2023/09]より良いコード生成のための大規模言語モデルにおけるテストケース駆動型プログラミングの理解。ティアンら。 arXiv。 [紙]
[2023/09]ミント: ツールと言語フィードバックを使用したマルチターン インタラクションで LLMS を評価します。王ら。 ICLR。 [論文] [リポジトリ]
[2023/08] METAGPT: マルチエージェントの協調フレームワークのためのメタ プログラミング。ホンら。 ICLR。 [論文] [リポジトリ]
[2023/08]事前トレーニングされた大規模言語モデルとミューテーション テストを使用した効果的なテスト生成。ダケルら。情報ソフトウェア。テクノロジー。 。 [論文] [リポジトリ]
[2023/08] AgentVerse: マルチエージェントのコラボレーションを促進し、緊急の動作を探索します。チェンら。 ICLR。 [論文] [リポジトリ]
[2023/08] AutoGen: マルチエージェント会話による次世代 LLM アプリケーションの有効化。ウーら。 arXiv。 [論文] [リポジトリ]
[2023/08]フロー: 推論と協調 AI の構築ブロック。ジョシフォスキーら。 arXiv。 [論文] [リポジトリ]
[2023/06] SELFEVOLVE: 大規模言語モデルによるコード進化フレームワーク。ジャンら。 arXiv。 [紙]
[2023/06] InterCode: 実行フィードバックを使用したインタラクティブ コーディングの標準化とベンチマーク。ヤンら。 NeurIPS。 [論文] [リポジトリ]
[2023/06]自己修復はコード生成の銀の弾丸ですか?オラウソンら。 ICLR。 [論文] [リポジトリ]
[2023/05]手動テストはもう不要ですか?単体テスト生成のための ChatGPT の評価と改善。ユアンら。 arXiv。 [論文] [リポジトリ]
[2023/04]大規模な言語モデルによる完全自律型プログラミング。リベンツェフら。ゲッコウ。 [紙]
[2023/04]大規模言語モデル駆動の科学的デバッグによる説明可能な自動デバッグ。カンら。 arXiv。 [紙]
[2023/03] ART: 大規模な言語モデルに対する自動マルチステップ推論とツールの使用。パランジャペら。 arXiv。 [論文] [リポジトリ]
[2023/03]リフレクション: 言語強化学習を備えた言語エージェント。シンら。 NeurIPS。 [論文] [リポジトリ]
[2023/02]単体テストの自動生成のための大規模言語モデルの使用に関する実証的評価。シェーファーら。 IEEEトランス。ソフトウェア工学.. [論文] [リポジトリ]
[2023/01]会話型自動プログラム改修。シアら。 arXiv。 [紙]
障害位置特定ツール
[2024/04] AutoCodeRover: 自律的なプログラム改善。張ら。イスタ。 [論文] [リポジトリ]
[2024/03] RepairAgent: プログラム修復のための自律的な LLM ベースのエージェント。ブゼニアら。 arXiv。 [紙]
マネージャーの役割
[2024/06] AgileCoder: アジャイル手法に基づいたソフトウェア開発のための動的協調エージェント。グエンら。 arXiv。 [論文] [リポジトリ]
[2024/05]ソフトウェア開発エージェントの反復エクスペリエンスの改良。銭ら。 arXiv。 [紙]
[2024/05] MapCoder: 競争力のある問題解決のためのマルチエージェント コード生成。イスラムなど。 ACL。 [論文] [リポジトリ]
[2024/04]自己組織化エージェント: 超大規模コード生成と最適化に向けた LLM マルチエージェント フレームワーク。石橋ら。 arXiv。 [論文] [リポジトリ]
[2024/04] 3DGen: AI 支援による証明可能なバイナリ形式パーサーの生成。 Fakhoury et al. arXiv [論文]
[2024/03] MAGIS: GitHub の問題解決のための LLM ベースのマルチエージェント フレームワーク。タオら。 arXiv。 [紙]
[2024/03] LLM ベースのコード生成がソフトウェア開発プロセスに適合するとき。リンら。 arXiv。 [論文] [リポジトリ]
[2024/02] CodeAgent: ソフトウェア エンジニアリングのための共同エージェント。タンら。 arXiv。 [論文] [リポジトリ]
[2024/02] CodePori: マルチエージェントを使用した自律ソフトウェア開発のための大規模モデル。ラシードら。 arXiv。 [紙]
[2023/12]ソフトウェア開発エージェントの体験型共同学習。銭ら。 ACL。 [論文] [リポジトリ]
[2023/11]ソフトウェア開発における自律エージェント: ビジョン論文Rasheed et al. arXiv。 [紙]
[2023/11]自律型大規模言語モデル エージェントを使用したインテント駆動型モバイル GUI テスト。ユンら。 ICST。 [論文] [リポジトリ]
[2023/10] AXNav: 自然言語からのアクセシビリティ テストの再生。テイブら。ち。 [紙]
[2023/10] RCAgent: ツール拡張された大規模言語モデルを使用した自律エージェントによるクラウド根本原因分析。王ら。 arXiv。 [紙]
[2023/09] AutoAgents: エージェントを自動生成するためのフレームワーク。チェンら。 arXiv。 [論文] [リポジトリ]
[2023/08] METAGPT: マルチエージェントの協調フレームワークのためのメタ プログラミング。ホンら。 ICLR。 [論文] [リポジトリ]
[2023/04]ローコード LLM: LLM を介したビジュアル プログラミング。蔡ら。 arXiv。 [論文] [リポジトリ]
[2023/03] CAMEL: 大言語モデル社会の「心」探求のためのコミュニケーションエージェント。リーら。 NeurIPS。 [論文] [リポジトリ]
要件分析の役割
[2024/06]マルチエージェント ソフトウェア開発の実験: 統合プラットフォームに向けてSami et al. arXiv。 [紙]
[2024/06] AgileCoder: アジャイル手法に基づいたソフトウェア開発のための動的協調エージェント。グエンら。 arXiv。 [論文] [リポジトリ]
[2024/05] MARE: 要件エンジニアリングのためのマルチエージェント コラボレーション フレームワーク。ジンら。 arXiv。 [紙]
[2024/04] Elicitron: 設計要件抽出のための LLM エージェントベースのシミュレーション フレームワーク。アタエイら。 arXiv。 [紙]
[2024/03] LLM ベースのコード生成がソフトウェア開発プロセスに適合するとき。リンら。 arXiv。 [論文] [リポジトリ]
[2024/01] LLM を使用した新しいプログラミングの実践を実験します。張ら。 arXiv。 [論文] [リポジトリ]
[2023/11]ソフトウェア開発における自律エージェント: ビジョン論文Rasheed et al. arXiv。 [紙]
[2023/10] AI 時代の静的コード分析: インテリジェント コード分析の概念、機能、可能性を徹底的に探ります。ファンら。 arXiv。 [紙]
[2023/08] METAGPT: マルチエージェントの協調フレームワークのためのメタ プログラミング。ホンら。 ICLR。 [論文] [リポジトリ]
[2023/06]マルチエージェントのコラボレーション: インテリジェント LLM エージェントの力を活用。タレビラドら。 arXiv。 [紙]
[2023/04] ChatGPT によるセルフコラボレーションコード生成。ドンら。 arXiv。 [論文] [リポジトリ]
[2023/03] CAMEL: 大言語モデル社会の「心」探求のためのコミュニケーションエージェント。リーら。 NeurIPS。 [論文] [リポジトリ]
デザイナーの役割
[2024/06]マルチエージェント ソフトウェア開発の実験: 統合プラットフォームに向けてSami et al. arXiv。 [紙]
[2024/03] LLM ベースのコード生成がソフトウェア開発プロセスに適合するとき。リンら。 arXiv。 [論文] [リポジトリ]
[2024/01] LLM を使用した新しいプログラミングの実践を実験します。張ら。 arXiv。 [論文] [リポジトリ]
[2023/11]ソフトウェア開発における自律エージェント: ビジョン論文Rasheed et al. arXiv。 [紙]
[2023/08] METAGPT: マルチエージェントの協調フレームワークのためのメタ プログラミング。ホンら。 ICLR。 [論文] [リポジトリ]
[2023/08] AgentVerse: マルチエージェントのコラボレーションを促進し、緊急の動作を探索します。チェンら。 ICLR。 [論文] [リポジトリ]
[2023/07]ソフトウェア開発のためのコミュニケーションエージェント。銭ら。 ACL。 [論文] [リポジトリ]
[2023/06]マルチエージェントのコラボレーション: インテリジェント LLM エージェントの力を活用。タレビラドら。 arXiv。 [紙]
開発者の役割
[2024/06]マルチエージェント ソフトウェア開発の実験: 統合プラットフォームに向けてSami et al. arXiv。 [紙]
[2024/06] AgileCoder: アジャイル手法に基づいたソフトウェア開発のための動的協調エージェント。グエンら。 arXiv。 [論文] [リポジトリ]
[2024/05] AutoCoder: AIEV-INSTRUCT によるコード大規模言語モデルの強化。レイら。 arXiv。 [論文] [リポジトリ]
[2024/05] MapCoder: 競争力のある問題解決のためのマルチエージェント コード生成。イスラムなど。 ACL。 [論文] [リポジトリ]
[2024/04]自己組織化エージェント: 超大規模コード生成と最適化に向けた LLM マルチエージェント フレームワーク。石橋ら。 arXiv。 [論文] [リポジトリ]
[2024/04] 3DGen: AI 支援による証明可能なバイナリ形式パーサーの生成。 Fakhoury et al. arXiv [論文]
[2024/03] CodeS: マルチレイヤースケッチを介した自然言語からコードリポジトリへ。ザンら。 arXiv。 [論文] [リポジトリ]
[2024/03] MAGIS: GitHub の問題解決のための LLM ベースのマルチエージェント フレームワーク。タオら。 arXiv。 [紙]
[2024/03] LLM ベースのコード生成がソフトウェア開発プロセスに適合するとき。リンら。 arXiv。 [論文] [リポジトリ]
[2024/02]コード生成のためのテスト駆動開発。マシューズら。 arXiv。 [論文] [リポジトリ]
[2024/02] CodePori: マルチエージェントを使用した自律ソフトウェア開発のための大規模モデル。ラシードら。 arXiv。 [紙]
[2024/01] LLM を使用した新しいプログラミングの実践を実験します。張ら。 arXiv。 [論文] [リポジトリ]
[2023/12] AgentCoder: 反復テストと最適化によるマルチエージェントベースのコード生成。黄ら。 arXiv。 [紙]
[2023/11]ソフトウェア開発における自律エージェント: ビジョン論文Rasheed et al. arXiv。 [紙]
[2023/11] INTERVENOR: インタラクティブな修復チェーンによる大規模言語モデルのコーディング能力の向上。王ら。 ACL。 [論文] [リポジトリ]
[2023/08] AutoGen: マルチエージェント会話による次世代 LLM アプリケーションの有効化。ウーら。 arXiv。 [論文] [リポジトリ]
[2023/08] METAGPT: マルチエージェントの協調フレームワークのためのメタ プログラミング。ホンら。 ICLR。 [論文] [リポジトリ]
[2023/08] AgentVerse: マルチエージェントのコラボレーションを促進し、緊急の動作を探索します。チェンら。 ICLR。 [論文] [リポジトリ]
[2023/07]ソフトウェア開発のためのコミュニケーションエージェント。銭ら。 ACL。 [論文] [リポジトリ]
[2023/06]自己修復はコード生成の銀の弾丸ですか?オラウソンら。 ICLR。 [論文] [リポジトリ]
[2023/06]マルチエージェントのコラボレーション: インテリジェント LLM エージェントの力を活用。タレビラドら。 arXiv。 [紙]
[2023/05]自己編集: コード生成のための障害認識コード エディター。張ら。 ACL。 [紙]
[2023/04] ChatGPT によるセルフコラボレーションコード生成。ドンら。 arXiv。 [論文] [リポジトリ]
[2023/03] CAMEL: 大言語モデル社会の「心」探求のためのコミュニケーションエージェント。リーら。 NeurIPS。 [論文] [リポジトリ]
ソフトウェア品質保証の役割
[2024/08] SpecRover: LLM によるコード意図の抽出Ruan et al. arXiv。 [論文] [リポジトリ]
[2024/07]マルチモーダル大規模言語モデルによるビジョン主導の自動モバイル GUI テスト。劉ら。 arXiv。 [論文] [リポジトリ]
[2024/06]マルチエージェント ソフトウェア開発の実験: 統合プラットフォームに向けてSami et al. arXiv。 [紙]
[2024/06]チーム間のコラボレーションによるマルチエージェント ソフトウェア開発。デュら。 arXiv。 [論文] [リポジトリ]
[2024/06] AgileCoder: アジャイル手法に基づいたソフトウェア開発のための動的協調エージェント。グエンら。 arXiv。 [論文] [リポジトリ]
[2024/06] MASAI: ソフトウェア エンジニアリング AI エージェント用のモジュラー アーキテクチャ。アローラら。 arXiv。 [紙]
[2024/05] AutoCoder: AIEV-INSTRUCT によるコード大規模言語モデルの強化。レイら。 arXiv。 [論文] [リポジトリ]
[2024/05] MapCoder: 競争力のある問題解決のためのマルチエージェント コード生成。イスラムなど。 ACL。 [論文] [リポジトリ]
[2024/04] LLM を使用した AI を活用したコード レビュー: 初期の結果。ラシードら。 arXiv。 [紙]
[2024/04] 3DGen: AI 支援による証明可能なバイナリ形式パーサーの生成。 Fakhoury et al. arXiv [論文]
[2024/04] LLM ベースのマルチエージェント シナジーによる統合デバッグ アプローチ。リーら。 arXiv。 [論文] [リポジトリ]
[2024/04]実用的な関数レベルのプログラム修復でどこまでできるか?翔ら。 arXiv。 [論文] [リポジトリ]
[2024/03] MAGIS: GitHub の問題解決のための LLM ベースのマルチエージェント フレームワーク。タオら。 arXiv。 [紙]
[2024/03] AGENTFL: LLM ベースの障害位置特定をプロジェクト レベルのコンテキストに拡張。秦ら。 arXiv。 [紙]
[2024/03]微調整と LLM ベースのエージェントを組み合わせて、直感的なスマート コントラクト監査と正当化を実現。マら。 arXiv。 [論文] [リポジトリ]
[2024/03] LLM ベースのコード生成がソフトウェア開発プロセスに適合するとき。リンら。 arXiv。 [論文] [リポジトリ]
[2024/03] ACFIX: スマート コントラクトのアクセス制御の脆弱性をコンテキスト認識して修復するためのマイニングされた共通 RBAC プラクティスを使用して LLM をガイドします。張ら。 arXiv。 [紙]
[2024/02] CodeAgent: ソフトウェア エンジニアリングのための共同エージェント。タンら。 arXiv。 [論文] [リポジトリ]
[2024/02]コード生成のためのテスト駆動開発。マシューズら。 arXiv。 [論文] [リポジトリ]
[2024/02] CodePori: マルチエージェントを使用した自律ソフトウェア開発のための大規模モデル。ラシードら。 arXiv。 [紙]
[2024/01] XUAT-Copilot: 大規模言語モデルを使用した自動ユーザー受け入れテストのためのマルチエージェント協調システム。王ら。 arXiv。 [紙]
[2023/12] AgentCoder: 反復テストと最適化によるマルチエージェントベースのコード生成。黄ら。 arXiv。 [紙]
[2023/11]ソフトウェア開発における自律エージェント: ビジョン論文Rasheed et al. arXiv。 [紙]
[2023/11]自律型大規模言語モデル エージェントを使用したインテント駆動型モバイル GUI テスト。ユンら。 ICST。 [論文] [リポジトリ]
[2023/10]大規模言語モデルを活用したスマート コントラクトの脆弱性検出: 新しい視点。胡ら。 TPS-ISA。 [論文] [リポジトリ]
[2023/10] AI 時代の静的コード分析: インテリジェント コード分析の概念、機能、可能性を徹底的に探ります。ファンら。 arXiv。 [紙]
[2023/10]大規模な言語モデルによって強化されたホワイトボックス コンパイラーのファジング。ヤンら。 arXiv。 [論文] [リポジトリ]
[2023/10] AXNav: 自然言語からのアクセシビリティ テストの再生。テイブら。ち。 [紙]
[2023/08] AutoGen: マルチエージェント会話による次世代 LLM アプリケーションの有効化。ウーら。 arXiv。 [論文] [リポジトリ]
[2023/08] METAGPT: マルチエージェントの協調フレームワークのためのメタ プログラミング。ホンら。 ICLR。 [論文] [リポジトリ]
[2023/07]ソフトウェア開発のためのコミュニケーションエージェント。銭ら。 ACL。 [論文] [リポジトリ]
[2023/06]自己修復はコード生成の銀の弾丸ですか?オラウソンら。 ICLR。 [論文] [リポジトリ]
[2023/06]マルチエージェントのコラボレーション: インテリジェント LLM エージェントの力を活用。タレビラドら。 arXiv。 [紙]
[2023/05]自己編集: コード生成のための障害認識コード エディター。張ら。 ACL。 [紙]
[2023/03] CAMEL: 大言語モデル社会の「心」探求のためのコミュニケーションエージェント。リーら。 NeurIPS。 [論文] [リポジトリ]
アシスタントの役割
[2024/08]多様性がインテリジェンスを強化: ソフトウェア エンジニアリング エージェントの専門知識の統合Zhang et al. arXiv。 [紙]
[2024/08] SpecRover: LLM によるコード意図の抽出Ruan et al. arXiv。 [論文] [リポジトリ]
[2024/06] MASAI: ソフトウェア エンジニアリング AI エージェント用のモジュラー アーキテクチャ。アローラら。 arXiv。 [紙]
[2024/05] MapCoder: 競争力のある問題解決のためのマルチエージェント コード生成。イスラムなど。 ACL。 [論文] [リポジトリ]
[2024/03] MAGIS: GitHub の問題解決のための LLM ベースのマルチエージェント フレームワーク。タオら。 arXiv。 [紙]
[2024/03] CodeS: マルチレイヤースケッチを介した自然言語からコードリポジトリへ。ザンら。 arXiv。 [論文] [リポジトリ]
[2024/03]微調整と LLM ベースのエージェントを組み合わせて、直感的なスマート コントラクト監査と正当化を実現。マら。 arXiv。 [論文] [リポジトリ]
[2023/10] AI 時代の静的コード分析: インテリジェント コード分析の概念、機能、可能性を徹底的に探ります。ファンら。 arXiv。 [紙]
層状構造
[2024/08]多様性がインテリジェンスを強化: ソフトウェア エンジニアリング エージェントの専門知識の統合Zhang et al. arXiv。 [紙]
[2024/08] SpecRover: LLM によるコード意図の抽出Ruan et al. arXiv。 [論文] [リポジトリ]
[2024/06]マルチエージェント ソフトウェア開発の実験: 統合プラットフォームに向けてSami et al. arXiv。 [紙]
[2024/06]大言語モデルベースのマルチエージェントコラボレーションのスケーリングQian et al. arXiv。 [論文] [リポジトリ]
[2024/06]チーム間のコラボレーションによるマルチエージェント ソフトウェア開発。デュら。 arXiv。 [論文] [リポジトリ]
[2024/06] AgileCoder: アジャイル手法に基づいたソフトウェア開発のための動的協調エージェント。グエンら。 arXiv。 [論文] [リポジトリ]
[2024/05] MapCoder: 競争力のある問題解決のためのマルチエージェント コード生成。イスラムなど。 ACL。 [論文] [リポジトリ]
[2024/05] MARE: 要件エンジニアリングのためのマルチエージェント コラボレーション フレームワーク。ジンら。 arXiv。 [紙]
[2024/04] AutoCodeRover: 自律的なプログラム改善。張ら。イスタ。 [論文] [リポジトリ]
[2024/04]実用的な関数レベルのプログラム修復でどこまでできるか?翔ら。 arXiv。 [論文] [リポジトリ]
[2024/03] CodeS: マルチレイヤースケッチを介した自然言語からコードリポジトリへ。ザンら。 arXiv。 [論文] [リポジトリ]
[2024/03] LLM ベースのコード生成がソフトウェア開発プロセスに適合するとき。リンら。 arXiv。 [論文] [リポジトリ]
[2024/03] AGENTFL: LLM ベースの障害位置特定をプロジェクト レベルのコンテキストに拡張。秦ら。 arXiv。 [紙]
[2024/02]データフロー分析が大規模言語モデルと出会うとき。王ら。 arXiv。 [紙]
[2024/02] CodeAgent: ソフトウェア エンジニアリングのための共同エージェント。タンら。 arXiv。 [論文] [リポジトリ]
[2024/02]必要なのはエージェントの数だけです。リーら。 arXiv。 [紙]
[2024/01] LLM を使用した新しいプログラミングの実践を実験します。張ら。 arXiv。 [論文] [リポジトリ]
[2023/11]ソフトウェア開発における自律エージェント: ビジョン論文Rasheed et al. arXiv。 [紙]
[2023/10] AI 時代の静的コード分析: インテリジェント コード分析の概念、機能、可能性を徹底的に探ります。ファンら。 arXiv。 [紙]
[2023/10]大規模言語モデルを活用したスマート コントラクトの脆弱性検出: 新しい視点。胡ら。 TPS-ISA。 [論文] [リポジトリ]
[2023/10]大規模な言語モデルによって強化されたホワイトボックス コンパイラーのファジング。ヤンら。 arXiv。 [論文] [リポジトリ]
[2023/10]動的 LLM-エージェント ネットワーク: エージェント チームの最適化を備えた LLM-エージェント コラボレーション フレームワーク。劉ら。 arXiv。 [論文] [リポジトリ]
[2023/08] METAGPT: マルチエージェントの協調フレームワークのためのメタ プログラミング。ホンら。 ICLR。 [論文] [リポジトリ]
[2023/08]フロー: 推論と協調 AI の構築ブロック。ジョシフォスキーら。 arXiv。 [論文] [リポジトリ]
[2023/07]ソフトウェア開発のためのコミュニケーションエージェント。銭ら。 ACL。 [論文] [リポジトリ]
[2023/05]自己編集: コード生成のための障害認識コード エディター。張ら。 ACL。紙
[2023/04]ローコード LLM: LLM を介したビジュアル プログラミング。蔡ら。 arXiv。 [論文] [リポジトリ]
円形構造
[2024/05] AutoCoder: AIEV-INSTRUCT によるコード大規模言語モデルの強化。レイら。 arXiv。 [論文] [リポジトリ]
[2024/04] LLM ベースのマルチエージェント シナジーによる統合デバッグ アプローチ。リーら。 arXiv。 [論文] [リポジトリ]
[2024/03] ACFIX: スマート コントラクトのアクセス制御の脆弱性をコンテキスト認識して修復するためのマイニングされた共通 RBAC プラクティスを使用して LLM をガイドします。張ら。 arXiv。 [紙]
[2024/03]脆弱性検出のための LLM ディスカッションによるマルチロールのコンセンサス。マオら。 QRS。 [紙]
[2024/03]微調整と LLM ベースのエージェントを組み合わせて、直感的なスマート コントラクト監査と正当化を実現。マら。 arXiv。 [論文] [リポジトリ]
[2024/02]コード生成のためのテスト駆動開発。マシューズら。 arXiv。 [論文] [リポジトリ]
[2024/02] CodePori: マルチエージェントを使用した自律ソフトウェア開発のための大規模モデル。ラシードら。 arXiv。 [紙]
[2023/12]ソフトウェア開発エージェントの体験型共同学習。銭ら。 ACL。 [論文] [リポジトリ]
[2023/12] AgentCoder: 反復テストと最適化によるマルチエージェントベースのコード生成。黄ら。 arXiv。 [紙]
[2023/11] INTERVENOR: インタラクティブな修復チェーンによる大規模言語モデルのコーディング能力の向上。王ら。 ACL。 [論文] [リポジトリ]
[2023/11]自律型大規模言語モデル エージェントを使用したインテント駆動型モバイル GUI テスト。ユンら。 ICST。 [論文] [リポジトリ]
[2023/10] AXNav: 自然言語からのアクセシビリティ テストの再生。テイブら。ち。 [紙]
[2023/06]自己修復はコード生成の銀の弾丸ですか?オラウソンら。 ICLR。 [論文] [リポジトリ]
[2023/03] CAMEL: 大言語モデル社会の「心」探求のためのコミュニケーションエージェント。リーら。 NeurIPS。 [論文] [リポジトリ]
[2023/03]リフレクション: 言語強化学習を備えた言語エージェント。シンら。 NeurIPS。 [論文] [リポジトリ]
木のような構造
[2024/06]大言語モデルベースのマルチエージェントコラボレーションのスケーリングQian et al. arXiv。 [論文] [リポジトリ]
[2024/06] MASAI: ソフトウェア エンジニアリング AI エージェント用のモジュラー アーキテクチャ。アローラら。 arXiv。 [紙]
[2024/04]自己組織化エージェント: 超大規模コード生成と最適化に向けた LLM マルチエージェント フレームワーク。石橋ら。 arXiv。 [論文] [リポジトリ]
星状構造
[2024/06]大言語モデルベースのマルチエージェントコラボレーションのスケーリングQian et al. arXiv。 [論文] [リポジトリ]
[2024/03] AutoDev: 自動化された AI 主導の開発。トゥファノら。 arXiv [論文]
[2024/01] XUAT-Copilot: 大規模言語モデルを使用した自動ユーザー受け入れテストのためのマルチエージェント協調システム。王ら。 arXiv。 [紙]
[2023/10] RCAgent: ツール拡張された大規模言語モデルを使用した自律エージェントによるクラウド根本原因分析。王ら。 arXiv。 [紙]
[2023/08] AutoGen: マルチエージェント会話による次世代 LLM アプリケーションの有効化。ウーら。 arXiv。 [論文] [リポジトリ]
メッシュ構造
[2024/06]大言語モデルベースのマルチエージェントコラボレーションのスケーリングQian et al. arXiv。 [論文] [リポジトリ]
[2024/04] 3DGen: AI 支援による証明可能なバイナリ形式パーサーの生成。 Fakhoury et al. arXiv [論文]
[2024/01] LLM を使用した新しいプログラミングの実践を実験します。張ら。 arXiv。 [論文] [リポジトリ]
[2024/01] LLM4PLC: 産業用制御システムにおける PLC の検証可能なプログラミングのための大規模言語モデルの利用。ファキら。 ICSE。 [論文] [リポジトリ]
[2023/10] AI 時代の静的コード分析: インテリジェント コード分析の概念、機能、可能性を徹底的に探ります。ファンら。 arXiv。 [紙]
[2023/04]ローコード LLM: LLM を介したビジュアル プログラミング。蔡ら。 arXiv。 [論文] [リポジトリ]
[2024/05] MARE: 要件エンジニアリングのためのマルチエージェント コラボレーション フレームワーク。ジンら。 arXiv。 [紙]
[2024/02]実行可能コード アクションにより、より優れた LLM エージェントが導き出されます。王ら。 ICML。 [論文] [リポジトリ]
[2024/01] LLM を使用した新しいプログラミングの実践を実験します。張ら。 arXiv。 [論文] [リポジトリ]
[2023/10] ClarifyGPT: 意図の明確化による LLM ベースのコード生成の強化。ムーら。 arXiv。 [論文] [リポジトリ]
[2023/06] Prompt Sapper: AI ネイティブ サービスのための LLM を活用したソフトウェア エンジニアリング インフラストラクチャ。シンら。 arXiv。 [紙]
[2024/03] CodeS: マルチレイヤースケッチを介した自然言語からコードリポジトリへ。ザンら。 arXiv。 [論文] [リポジトリ]
[2024/01] LLM4PLC: 産業用制御システムにおける PLC の検証可能なプログラミングのための大規模言語モデルの利用。ファキら。 ICSE。 [論文] [リポジトリ]
[2023/09]ミント: ツールと言語フィードバックを使用したマルチターン インタラクションで LLMS を評価します。王ら。 ICLR。 [論文] [リポジトリ]
[2023/08]フロー: 推論と協調 AI の構築ブロック。ジョシフォスキーら。 arXiv。 [論文] [リポジトリ]
[2023/08] AutoGen: マルチエージェント会話による次世代 LLM アプリケーションの有効化。ウーら。 arXiv。 [論文] [リポジトリ]
[2024/01] LLM を使用した新しいプログラミングの実践を実験します。張ら。 arXiv。 [論文] [リポジトリ]
[2023/08] Gentopia: ツール拡張 LLM のための共同プラットフォーム。徐ら。 EMNLP。 [論文] [リポジトリ]
[2023/06] Prompt Sapper: AI ネイティブ サービスのための LLM を活用したソフトウェア エンジニアリング インフラストラクチャ。シンら。 arXiv。 [紙]
[2023/03] ART: 大規模な言語モデルに対する自動マルチステップ推論とツールの使用。パランジャペら。 arXiv。 [論文] [リポジトリ]
@misc{Agent4SE, title={ソフトウェア エンジニアリング向けの大規模言語モデル ベースのエージェント: 調査}, author={Junwei Liu、Kaixin Wang、Yixuan Chen、Xin Peng、Zhenpeng Chen、Lingming Zhang、Yiling Lou}、year={2024}、eprint={2409.02977}、archivePrefix={arXiv}、primaryClass={cs.SE} 、 URL={https://arxiv.org/abs/2409.02977}、 }
リュウ・ジュンウェイ @To-D
王凱新 @wkx228
チェン・イーシュアン @FloridaSpidee
ご質問やご提案がございましたら、以下の方法でお気軽にお問い合わせください。
リュウ・ジュンウェイ: [email protected]