Agen-Makalah-Otonomi yang Luar Biasa
Ini adalah kumpulan makalah terbaru yang berfokus pada agen otonom. Berikut adalah cara Wikipedia mendefinisikan Agen:
Dalam kecerdasan buatan, agen cerdas adalah agen yang bertindak dengan cara yang cerdas; Ia memahami lingkungannya, mengambil tindakan secara mandiri untuk mencapai tujuan, dan dapat meningkatkan kinerjanya dengan belajar atau memperoleh pengetahuan. Agen cerdas mungkin sederhana atau kompleks: Termostat atau sistem kontrol lainnya dianggap sebagai contoh agen cerdas, seperti halnya manusia, seperti halnya sistem apa pun yang memenuhi definisi, seperti perusahaan, negara bagian, atau bioma.
Jadi, kunci dari seorang agen adalah ia dapat mencapai tujuan , memperoleh pengetahuan dan terus berkembang . Agen tradisional dalam penelitian RL tidak akan dipertimbangkan dalam koleksi ini. Meskipun agen berbasis LLM telah menarik perhatian banyak orang dalam penelitian terbaru, agen berbasis RL juga mengambil posisi khusus mereka. Secara khusus, repo ini tertarik pada dua jenis agen: agen berbasis RL dan agen berbasis LLM.
Perhatikan bahwa daftar makalah ini sedang dalam pemeliharaan aktif . Bebas bebas untuk membuka terbitan jika Anda menemukan makalah yang terlewat dan sesuai dengan topik.
Perbarui riwayat
- 31/01/2024: Tambahkan daftar khusus untuk survei tentang agen otonom.
- 2023/12/08: Tambahkan makalah yang diterima oleh ICML'23 dan ICLR'23
- 2023/11/08: Tambahkan makalah yang diterima oleh NeurIPS'23. Tambahkan tautan terkait (halaman proyek atau github) ke makalah yang diterima ini?
- 25/10/2023: Klasifikasi semua makalah berdasarkan topik penelitiannya. Periksa ToC untuk standar klasifikasi?
- 2023/10/18: Rilis koleksi versi pertama, termasuk makalah yang diserahkan ke ICLR 2024
Daftar isi
- Survei
- Agen berbasis RL
- Instruksi berikut
- Membangun agen berdasarkan model Dunia
- Bahasa sebagai pengetahuan
- LLM sebagai alat
- Generalisasi antar tugas
- Pembelajaran terus menerus
- Gabungkan RL dan LLM
- Kebijakan berbasis transformator
- Lintasan ke bahasa
- Prediksi lintasan
- Yang lain
- Agen berbasis LLM
- Multimoda
- Latih LLM untuk generalisasi & adaptasi
- Perancangan khusus tugas
- Multi-agen (misalnya, masyarakat, kerja sama)
- Analisis eksperimental
- Tolok Ukur & Kumpulan Data
- Aplikasi
- Desain algoritma
- Dikombinasikan dengan RL
- Yang lain
Survei
- Survei Agen Otonom berbasis Model Bahasa Besar
- Kebangkitan dan Potensi Agen Berbasis Model Bahasa Besar: Sebuah Survei
Agen berbasis RL
Instruksi berikut
- [NeurIPS'23] Pembelajaran Penguatan Berkondisi Bahasa Alami dengan Pengembangan dan Terjemahan Bahasa Tugas Luar-dalam
- [NeurIPS'23] Pandu Agen Anda dengan Hadiah Multimodal Adaptif [proyek]
- Pengikutan Instruksi Komposisi dengan Model Bahasa dan Pembelajaran Penguatan
- RT-1: Transformator Robotika untuk Pengendalian Dunia Nyata dalam Skala Besar [blog]
- RT-2: Model Visi-Bahasa-Tindakan Mentransfer Pengetahuan Web ke Kontrol Robot [blog]
- Perwujudan X Terbuka: Kumpulan Data Pembelajaran Robotik dan Model RT-X [blog]
- [NeurIPS'23] Pandu Agen Anda dengan Hadiah Multimodal Adaptif [proyek]
- LEO: Agen Generalis yang Terwujud dalam Dunia 3D [proyek]
Membangun agen berdasarkan model Dunia
- [ICLR'23 Lisan] Transformer adalah Model Dunia yang Efisien Sampel [kode]
- Belajar Memodelkan Dunia dengan Bahasa
- MAMBA: Pendekatan Model Dunia yang Efektif untuk Pembelajaran Penguatan Meta
Bahasa sebagai pengetahuan
- Belajar dengan Inferensi Bahasa dan Tips Pembelajaran Penguatan Berkelanjutan
- Menginformasikan Agen Pembelajaran Penguatan dengan Membumikan Bahasa Alami pada Proses Keputusan Markov
- Modulasi Penghargaan Bahasa untuk Pembelajaran Penguatan Pra-Pelatihan
LLM sebagai alat
- [NeurIPS'23] Adaptasi Kebijakan yang Efisien dengan Ansambel Prompt Kontrasif untuk Agen yang Terwujud
- [ICLR'23] Desain Hadiah dengan Model Bahasa [kode]
- [ICML'23] RLang: Bahasa Deklaratif untuk Menjelaskan Sebagian Pengetahuan Dunia kepada Agen Pembelajaran Penguatan [Poster]
- [ICML'23] Apakah Agen yang Terwujud Memimpikan Domba Piksel: Pengambilan Keputusan yang Terwujud menggunakan Pemodelan Dunia yang Dipandu Bahasa [Proyek] [Kode]
- [ICML'23] Mendasarkan Model Bahasa Besar di Lingkungan Interaktif dengan Pembelajaran Penguatan Online
- Memanfaatkan Model Bahasa Besar untuk Koordinasi yang Optimal dalam Pembelajaran Penguatan Multi-Agen Tekstual
- Text2Reward: Pembuatan Hadiah Padat dengan Model Bahasa untuk Pembelajaran Penguatan
- Bahasa untuk Hadiah untuk Sintesis Keterampilan Robot
- Eureka: Desain Penghargaan Tingkat Manusia melalui Pengkodean Model Bahasa Besar
- STARLING: Pelatihan Agen Pembelajaran Penguatan Berbasis Teks dengan Pengawasan Mandiri dengan Model Bahasa Besar
Generalisasi antar tugas
- Agen Generalis
- AMAGO: Pembelajaran Penguatan Dalam Konteks yang Dapat Diskalakan untuk Agen Adaptif
Pembelajaran terus menerus
- ADAPTER-RL: Adaptasi Agen Apa Pun menggunakan Reinforcement Learning
- Pembelajaran Berkelanjutan Online untuk Agen Pengikut Instruksi Interaktif
- [NeurIPS'23] Definisi Pembelajaran Penguatan Berkelanjutan
Gabungkan RL dan LLM
- [NeurIPS'23] Model Bahasa Besar Adalah Agen Pembelajaran Penguatan Semi-Parametrik
- RoboGPT : Agen cerdas yang membuat keputusan jangka panjang untuk tugas instruksi sehari-hari
- Bisakah Agen Bahasa Mendekati Kinerja RL? Studi Empiris Tentang OpenAI Gym
- RLAdapter: Menjembatani Model Bahasa Besar ke Pembelajaran Penguatan di Dunia Terbuka
Kebijakan berbasis transformator
- [NeurIPS'23] Kurikulum Lintas Episodik untuk Agen Transformer. [proyek]
Lintasan ke bahasa
- [NeurIPS'23] State2Explanation: Penjelasan Berbasis Konsep untuk Menguntungkan Pembelajaran Agen dan Pemahaman Pengguna
- [NeurIPS'23] HELM Semantik: Memori yang Dapat Dibaca Manusia untuk Pembelajaran Penguatan
- [ICML'23] Menyaring Model Bahasa Visi Skala Internet menjadi Agen yang Terwujud
- Memahami Agen Anda: Memanfaatkan Model Bahasa Besar untuk Penjelasan Perilaku
Prediksi lintasan
- Prediksi Lintasan Multi-agen dengan Transformator Difusi Scalable
Yang lain
- Meningkatkan Pengalaman Manusia dalam Kolaborasi Manusia-Agen: Pendekatan Pemodelan yang Berpusat pada Manusia Berdasarkan Keuntungan Manusia yang Positif
- Agen Pembelajaran Penguatan Mendalam Pemenang Kompetisi di microRTS
- Menyelaraskan Agen seperti Model Bahasa Besar
Agen berbasis LLM
Multimoda
- [ICML'23] PaLM-E: Model Bahasa Multimodal yang Terwujud
- Steve-Eye: Melengkapi Agen Terwujud berbasis LLM dengan Persepsi Visual di Dunia Terbuka
- Navigasi Web Multimodal dengan Model Fondasi yang Diselesaikan dengan Instruksi
- Anda Hanya Melihat Layar: Agen Rantai Aksi Multimodal
- Mempelajari Pemrograman Bahasa Visi yang Terwujud Dari Instruksi, Eksplorasi, dan Umpan Balik Lingkungan
- Agen Generalis yang Terwujud di Dunia 3D
- JARVIS-1: Agen Multi-tugas Dunia Terbuka dengan Model Bahasa Multimodal yang Ditambah Memori
Latih LLM untuk generalisasi & adaptasi
- FireAct: Menuju Penyempurnaan Agen Bahasa
- Mengadaptasi Agen LLM Melalui Komunikasi
- AgentTuning: Mengaktifkan Kemampuan Agen Umum untuk LLM
- Retroformer: Agen Bahasa Besar Retrospektif dengan Optimasi Gradien Kebijakan
Perancangan khusus tugas
- [NeurIPS'23] Jelaskan, Jelaskan, Rencanakan, dan Pilih: Perencanaan Interaktif dengan LLM Memungkinkan Agen Multi-Tugas Dunia Terbuka
- [NeurIPS'23] SwiftSage: Agen Generatif dengan Pemikiran Cepat dan Lambat untuk Tugas Interaktif Kompleks [Github]
- Memikirkan Kembali Paradoks Inspeksi Pembeli di Pasar Informasi dengan Agen Bahasa
- Pendekatan Agen Bahasa untuk Pembuktian Teorema Formal
- Agen Menginstruksikan Model Bahasa Besar untuk Menjadi Pemikir Nol-Shot yang Umum
- Hantu di Minecraft: Agen Hirarki untuk Minecraft melalui Model Bahasa Besar dengan Pengetahuan dan Memori Berbasis Teks
- PaperQA: Agen Generatif Augmented Pengambilan untuk Penelitian Ilmiah
- Agen Bahasa untuk Mendeteksi Stereotip Implisit dalam Model Teks-ke-gambar dalam Skala Besar
- Agen Kecurigaan: Memainkan Permainan Informasi yang Tidak Sempurna dengan Teori Sadar Pikiran GPT-4
Multi-agen (misalnya, masyarakat, kerja sama)
- CoMM: Multi-Agen Kolaboratif, Jalur Multi-Penalaran yang Mendorong Pemecahan Masalah Kompleks
- Membangun Agen yang Terwujud Koperasi Secara Modular dengan Model Bahasa Besar
- OKR-Agent: Sistem Agen Berbasis Objek dan Hasil Utama dengan Kolaborasi Mandiri dan Evaluasi Diri Hierarki
- MetaGPT: Pemrograman Meta untuk Kerangka Kerja Kolaboratif Multi-Agen
- AutoAgents: Kerangka Kerja untuk Pembuatan Agen Otomatis
- Jaringan Agen LLM Dinamis: Kerangka Kerja Kolaborasi Agen LLM dengan Optimasi Tim Agen
- AgentVerse: Memfasilitasi Kolaborasi Multi-Agen dan Menjelajahi Perilaku yang Muncul
- Menjelajahi Mekanisme Kolaborasi Agen LLM: Pandangan Psikologi Sosial
- REX: Eksplorasi Cepat dan eXploitasi untuk agen AI
- Munculnya Norma Sosial dalam Masyarakat Agen Berbasis Model Bahasa Besar
Analisis eksperimental
- Mengidentifikasi Risiko Agen LM dengan Sandbox yang Ditiru LM
- Mengevaluasi Kemampuan Koordinasi Multi-Agen dalam Model Bahasa Besar
- Model Bahasa Besar sebagai Agen Permainan
- Membandingkan Model Bahasa Besar sebagai Agen Riset AI
- Pemodelan Lingkungan Adaptif untuk Agen Bahasa Berorientasi Tugas
- CLIN: Agen Bahasa yang Terus Belajar untuk Adaptasi dan Generalisasi Tugas Cepat
Tolok Ukur & Kumpulan Data
- [ACL'24] AppWorld: Dunia Aplikasi dan Orang yang Dapat Dikendalikan untuk Membandingkan Agen Pengkodean Interaktif [situs web] [blog]
- [ICLR'23] Ambiguitas Tugas pada Model Manusia dan Bahasa [kode]
- SmartPlay: Tolok Ukur LLM sebagai Agen Cerdas
- AgentBench: Mengevaluasi LLM sebagai Agen
- Letakkan Uang Anda Di Mana Mulut Anda Berada: Mengevaluasi Perencanaan Strategis dan Eksekusi Agen LLM di Arena Lelang
- SOTOPIA: Evaluasi Interaktif Kecerdasan Sosial pada Agen Bahasa
- SocioDojo: Membangun Agen Analitik Seumur Hidup dengan Teks Dunia Nyata dan Rangkaian Waktu
- WebArena: Lingkungan Web yang Realistis untuk Membangun Agen Otonom
- Permusyawaratan LLM: Mengevaluasi LLM dengan Permainan Negosiasi Multi-Agen Interaktif
- Mengevaluasi Model Bahasa Besar pada Mengevaluasi Pengikut Instruksi
- CivRealm: Pengembaraan Pembelajaran dan Penalaran bagi Agen Pengambil Keputusan
Aplikasi
- Agen Lyfe: agen generatif untuk interaksi sosial real-time berbiaya rendah
- AutoGen: Mengaktifkan Aplikasi LLM Generasi Berikutnya melalui Percakapan Multi-Agen
Desain algoritma
- [ICLR'23 Lisan] ReAct: Mensinergikan Penalaran dan Tindakan dalam Model Bahasa [kode]
- [NeurIPS'23] AdaPlanner: Perencanaan Adaptif dari Umpan Balik dengan Model Bahasa [github]
- Prospector: Meningkatkan Agen LLM dengan Self-Asking dan Trajectory Ranking
- Secara Formal Menentukan Perilaku Tingkat Tinggi Agen Berbasis LLM
- Penalaran Kumulatif Dengan Model Bahasa Besar
Dikombinasikan dengan RL
- [NeurIPS'23] Refleksi: agen bahasa dengan pembelajaran penguatan verbal [kode]
- Mengajar LLM untuk Mengajari Diri Sendiri Instruksi yang Lebih Baik melalui Pembelajaran Penguatan
- Agen Bahasa dengan Pembelajaran Penguatan untuk Permainan Strategis di Game Werewolf
Yang lain
- [NeurIPS'24] Dapatkah Pembelajaran Grafik Meningkatkan Perencanaan di Agen berbasis LLM? [kode] [blog berbahasa Mandarin] [blog berbahasa Inggris]
- AgentSquare: Pencarian Agen LLM Otomatis di Ruang Desain Modular[Halaman proyek][Github]
- LUMOS: Menuju Agen Bahasa yang Terpadu, Modular, dan Open Source
- Lemur: Harmonisasi Bahasa Alami dan Kode untuk Agen Bahasa
- Pencarian Pohon Agen Bahasa Menyatukan Penalaran Akting dan Perencanaan dalam Model Bahasa