![](https://images.downcodes.com/uploads/20250114/img_67861855d3ed430.png)
멋진-논문-자율-에이전트
자율 에이전트에 초점을 맞춘 최근 논문 모음입니다. Wikipedia에서 Agent를 정의하는 방법은 다음과 같습니다.
인공 지능에서 지능형 에이전트는 지능적인 방식으로 행동하는 에이전트입니다. 환경을 인지하고, 목표를 달성하기 위해 자율적으로 행동하며, 학습이나 지식 습득을 통해 성과를 향상시킬 수 있습니다. 지능형 에이전트는 단순할 수도 있고 복잡할 수도 있습니다. 온도 조절기 기타 제어 시스템은 인간과 마찬가지로 회사, 상태 또는 생물 군계와 같이 정의를 충족하는 모든 시스템과 마찬가지로 지능형 에이전트의 예로 간주됩니다.
따라서 에이전트의 핵심은 목표를 달성 하고 지식을 습득하며 지속적으로 개선 할 수 있다는 것입니다. RL 연구의 전통적인 에이전트는 이 컬렉션에서 고려되지 않습니다. 최근 연구에서 LLM 기반 에이전트가 사람들의 시선을 사로잡았지만 RL 기반 에이전트도 특별한 위치를 차지하고 있습니다. 특히 이 저장소는 RL 기반 에이전트와 LLM 기반 에이전트라는 두 가지 유형의 에이전트에 관심이 있습니다.
이 논문 목록은 현재 활발히 관리 되고 있습니다. 주제에 맞는 누락된 논문을 발견한 경우 무료로 이슈를 열 수 있습니다.
업데이트 내역
- 2024/01/31: 자율 에이전트 설문조사 특별 목록을 추가합니다.
- 2023/12/08: ICML'23 및 ICLR'23에서 승인된 논문 추가
- 2023/11/08: NeurIPS'23에서 승인된 논문을 추가합니다. 승인된 논문에 관련 링크(프로젝트 페이지 또는 github)를 추가하시겠습니까?
- 2023/10/25: 연구 주제에 따라 모든 논문을 분류합니다. 분류 기준은 ToC를 확인하세요.
- 2023/10/18: ICLR 2024에 제출된 논문을 포함하여 컬렉션의 첫 번째 버전 출시
목차
- 설문조사
- RL 기반 에이전트
- 다음 지시사항
- 월드 모델을 기반으로 에이전트 구축
- 지식으로서의 언어
- 도구로서의 LLM
- 작업 전반에 걸친 일반화
- 지속적인 학습
- RL과 LLM 결합
- Transformer 기반 정책
- 언어의 궤적
- 궤적 예측
- 기타
- LLM 기반 에이전트
- 다중 모드
- 일반화 및 적응을 위한 LLM 교육
- 작업별 설계
- 다중 에이전트(예: 사회, 협력)
- 실험적 분석
- 벤치마크 및 데이터 세트
- 응용
- 알고리즘 설계
- RL과 결합
- 기타
설문조사
- 대규모 언어 모델 기반 자율 에이전트에 대한 설문 조사
- 대규모 언어 모델 기반 에이전트의 부상과 잠재력: 설문 조사
RL 기반 에이전트
다음 지시 사항
- [NeurIPS'23] 내부 작업 언어 개발 및 번역을 통한 자연어 조건 강화 학습
- [NeurIPS'23] 적응형 다중 모달 보상으로 에이전트 안내 [프로젝트]
- 언어 모델 및 강화 학습을 따르는 작문 수업
- RT-1: 대규모 실제 제어를 위한 로봇공학 변압기 [블로그]
- RT-2: 비전-언어-액션 모델은 웹 지식을 로봇 제어로 전송합니다. [블로그]
- Open X-Embodiment: 로봇 학습 데이터 세트 및 RT-X 모델 [블로그]
- [NeurIPS'23] 적응형 다중 모달 보상으로 에이전트 안내 [프로젝트]
- LEO: 3D 세계의 구체화된 일반 에이전트 [프로젝트]
월드 모델을 기반으로 에이전트 구축
- [ICLR'23 Oral] 변환기는 샘플 효율적인 세계 모델입니다. [코드]
- 언어로 세상을 모델링하는 법 배우기
- MAMBA: 메타 강화 학습을 위한 효과적인 세계 모델 접근 방식
지식으로서의 언어
- 언어 추론을 통한 학습 및 지속적인 강화 학습을 위한 팁
- Markov 결정 프로세스에 자연어를 기반으로 강화 학습 에이전트에 정보 제공
- 사전 훈련 강화 학습을 위한 언어 보상 변조
도구로서의 LLM
- [NeurIPS'23] 구체화된 에이전트를 위한 대조 프롬프트 앙상블을 통한 효율적인 정책 적응
- [ICLR'23] 언어 모델을 사용한 보상 설계 [코드]
- [ICML'23] RLang: 강화 학습 에이전트에 부분적인 세계 지식을 설명하기 위한 선언적 언어 [포스터]
- [ICML'23] 구체화된 에이전트가 픽셀화된 양을 꿈꾸는가: 언어 안내 세계 모델링을 사용한 구체화된 의사결정 [프로젝트][코드]
- [ICML'23] 온라인 강화 학습을 통해 대화형 환경에서 대규모 언어 모델 기반 구축
- 텍스트 다중 에이전트 강화 학습에서 최적화된 조정을 위해 대규모 언어 모델 활용
- Text2Reward: 강화 학습을 위한 언어 모델을 사용한 밀집된 보상 생성
- 로봇 기술 합성에 대한 보상 언어
- 유레카: 대규모 언어 모델 코딩을 통한 인간 수준의 보상 설계
- STARLING: 대규모 언어 모델을 사용한 텍스트 기반 강화 학습 에이전트의 자가 지도 교육
작업 전반에 걸친 일반화
- 일반 에이전트
- AMAGO: 적응형 에이전트를 위한 확장 가능한 상황 내 강화 학습
지속적인 학습
- ADAPTER-RL: 강화 학습을 사용한 모든 에이전트의 적응
- 에이전트를 따라가는 대화형 교육을 위한 온라인 지속적인 학습
- [NeurIPS'23] 지속적인 강화 학습의 정의
RL과 LLM 결합
- [NeurIPS'23] 대규모 언어 모델은 반모수적 강화 학습 에이전트입니다.
- RoboGPT: 일일 교육 작업에 대해 구체화된 장기 결정을 내리는 지능형 에이전트
- 언어 에이전트가 RL 성능에 접근할 수 있습니까? OpenAI 체육관에 대한 실증적 연구
- RLAdapter: 대규모 언어 모델을 개방형 세계의 강화 학습에 연결
Transformer 기반 정책
- [NeurIPS'23] 트랜스포머 에이전트를 위한 교차 에피소드 커리큘럼. [프로젝트]
언어의 궤적
- [NeurIPS'23] State2Explanation: 에이전트 학습 및 사용자 이해에 도움이 되는 개념 기반 설명
- [NeurIPS'23] 시맨틱 HELM: 강화 학습을 위한 사람이 읽을 수 있는 메모리
- [ICML'23] 인터넷 규모의 비전 언어 모델을 구체화된 에이전트로 정제
- 에이전트 이해: 행동 설명을 위한 대규모 언어 모델 활용
궤적 예측
- 확장 가능한 확산 변환기를 사용한 다중 에이전트 궤적 예측
기타
- 인간-에이전트 협업에서 인간 경험 향상: 긍정적인 인간 이득을 기반으로 한 인간 중심 모델링 접근 방식
- microRTS의 경쟁에서 승리한 심층 강화 학습 에이전트
- 대규모 언어 모델과 같은 에이전트 정렬
LLM 기반 에이전트
다중 모드
- [ICML'23] PaLM-E: 구현된 다중 모드 언어 모델
- Steve-Eye: 오픈 월드에서 시각적 인식을 갖춘 LLM 기반 구현 에이전트 장착
- 명령어에 따라 조정된 기초 모델을 사용한 다중 모드 웹 탐색
- 화면만 보면 됩니다: 다중 모드 연쇄 행위 에이전트
- 교육, 탐색 및 환경 피드백을 통해 구현된 비전 언어 프로그래밍 학습
- 3D 세계의 구체화된 일반 에이전트
- JARVIS-1: 메모리 증강 다중 모달 언어 모델을 갖춘 오픈 월드 다중 작업 에이전트
일반화 및 적응을 위한 LLM 교육
- FireAct: 언어 에이전트 미세 조정을 향하여
- 커뮤니케이션을 통해 LLM 에이전트 적응
- AgentTuning: LLM에 대한 일반화된 에이전트 기능 활성화
- Retroformer: 정책 그라데이션 최적화를 갖춘 회고적 대형 언어 에이전트
작업별 설계
- [NeurIPS'23] 설명, 설명, 계획 및 선택: LLM을 사용한 대화형 계획으로 오픈 월드 다중 작업 에이전트 가능
- [NeurIPS'23] SwiftSage: 복잡한 대화형 작업을 위해 빠르고 느린 사고를 갖춘 생성 에이전트 [Github]
- 언어 에이전트를 통한 정보 시장의 구매자 검사 역설 재고
- 형식적 정리 증명을 위한 언어 에이전트 접근 방식
- 에이전트는 대규모 언어 모델에 일반 제로샷 추론자가 되도록 지시합니다.
- Minecraft의 유령: 텍스트 기반 지식과 메모리를 갖춘 대규모 언어 모델을 통한 Minecraft용 계층적 에이전트
- PaperQA: 과학 연구를 위한 검색 증강 생성 에이전트
- 대규모 텍스트-이미지 모델에서 암시적 고정관념을 탐지하기 위한 언어 에이전트
- 의심 에이전트: 마음 이론 인식 GPT-4를 사용하여 불완전한 정보 게임하기
다중 에이전트(예: 사회, 협력)
- CoMM: 복잡한 문제 해결을 위한 협업 다중 에이전트, 다중 추론 경로 프롬프트
- 대규모 언어 모델을 사용하여 모듈식으로 협력적으로 구현된 에이전트 구축
- OKR 에이전트: 계층적 자체 협업 및 자체 평가 기능을 갖춘 개체 및 주요 결과 기반 에이전트 시스템
- MetaGPT: 다중 에이전트 협업 프레임워크를 위한 메타 프로그래밍
- AutoAgents: 자동 에이전트 생성을 위한 프레임워크
- 동적 LLM-에이전트 네트워크: 에이전트 팀 최적화를 갖춘 LLM-에이전트 협업 프레임워크
- AgentVerse: 다중 에이전트 협업 촉진 및 새로운 동작 탐색
- LLM 에이전트를 위한 협업 메커니즘 탐색: 사회 심리학적 관점
- REX: AI 에이전트를 위한 신속한 탐색 및 활용
- 대형 언어 모델 기반 에이전트 사회에서 사회적 규범의 출현
실험적 분석
- LM 에뮬레이트 샌드박스를 통해 LM 에이전트의 위험 식별
- 대규모 언어 모델에서 다중 에이전트 조정 능력 평가
- 게임 에이전트로서의 대규모 언어 모델
- AI 연구 에이전트로서 대규모 언어 모델 벤치마킹
- 작업 지향 언어 에이전트를 위한 적응형 환경 모델링
- CLIN: 신속한 작업 적응 및 일반화를 위한 지속적 학습 언어 에이전트
벤치마크 및 데이터세트
- [ACL'24] AppWorld: 대화형 코딩 에이전트 벤치마킹을 위해 제어 가능한 앱과 사람의 세계 [웹사이트][블로그]
- [ICLR'23] 인간과 언어 모델의 작업 모호성 [코드]
- SmartPlay: 지능형 에이전트인 LLM을 위한 벤치마크
- AgentBench: LLM을 에이전트로 평가
- 입이 있는 곳에 돈을 투자하세요: 경매장에서 LLM 에이전트의 전략적 계획 및 실행 평가
- SOTOPIA: 언어 에이전트의 사회 지능에 대한 대화형 평가
- SocioDojo: 실제 텍스트 및 시계열을 사용하여 평생 분석 에이전트 구축
- WebArena: 자율 에이전트 구축을 위한 현실적인 웹 환경
- LLM 심의: 대화형 다중 에이전트 협상 게임을 통한 LLM 평가
- 다음 명령 평가 시 대규모 언어 모델 평가
- CivRealm: 의사결정 에이전트를 위한 학습 및 추론 오디세이
응용
- Lyfe Agents: 저비용의 실시간 사회적 상호작용을 위한 생성 에이전트
- AutoGen: 다중 에이전트 대화를 통해 차세대 LLM 애플리케이션 활성화
알고리즘 설계
- [ICLR'23 구두] ReAct: 언어 모델에서 추론과 행동의 시너지 효과 [코드]
- [NeurIPS'23] AdaPlanner: 언어 모델을 통한 피드백을 통한 적응형 계획 [github]
- Prospector: 자기 질문 및 궤적 순위 지정을 통해 LLM 에이전트 개선
- LLM 기반 에이전트의 상위 수준 동작을 공식적으로 지정
- 대규모 언어 모델을 사용한 누적 추론
RL과 결합
- [NeurIPS'23] 반사: 언어 강화 학습을 통한 언어 에이전트 [코드]
- 강화 학습을 통해 LLM에게 더 나은 지침을 스스로 가르치도록 교육
- 늑대인간 게임의 전략적 플레이를 위한 강화 학습을 갖춘 언어 에이전트
기타
- [NeurIPS'24] 그래프 학습이 LLM 기반 에이전트의 계획을 개선할 수 있습니까? [코드] [중국 블로그] [영어 블로그]
- AgentSquare: 모듈형 디자인 공간에서 자동 LLM 에이전트 검색[프로젝트 페이지][Github]
- LUMOS: 통합, 모듈형, 오픈 소스 언어 에이전트를 향하여
- 여우원숭이: 언어 에이전트를 위한 자연어와 코드의 조화
- 언어 에이전트 트리 검색은 언어 모델에서 추론 행동과 계획을 통합합니다.