Kumpulkan beberapa makalah Model Dunia (untuk Mengemudi Otonom).
Jika Anda menemukan beberapa makalah yang diabaikan, jangan ragu untuk membuat permintaan penarikan , membuka terbitan , atau mengirim email kepada saya/ Qi Wang . Kontribusi dalam bentuk apa pun untuk membuat daftar ini lebih komprehensif sangat kami harapkan.
Jika Anda merasa repositori ini bermanfaat, mohon pertimbangkan untuk memberi kami bintang ?.
Jangan ragu untuk membagikan daftar ini dengan orang lain! ???
CVPR 2024 Workshop & Challenge | OpenDriveLab
Track #4: Model Dunia Prediktif.
Berfungsi sebagai representasi realitas spatio-temporal yang abstrak, model dunia dapat memprediksi keadaan masa depan berdasarkan keadaan saat ini. Proses pembelajaran model dunia berpotensi meningkatkan model dasar yang telah dilatih sebelumnya ke tingkat berikutnya. Dengan masukan yang hanya berupa penglihatan, keluaran jaringan neural menunjukkan awan di masa depan untuk membuktikan kemampuan prediktifnya terhadap dunia.
CVPR 2023 Workshop on Autonomous Driving
CHALLENGE 3: ARGOVERSE CHALLENGES, 3D Occupancy Forecasting menggunakan Dataset Sensor Argoverse 2. Memprediksi hunian ruangwaktu dunia selama 3 detik berikutnya.
Yann LeCun
: Jalan Menuju Kecerdasan Mesin Otonom [makalah] [Video]CVPR'23 WAD
- Ashok Elluswamy, Tesla [Video]Wayve
Memperkenalkan GAIA-1: Model AI Generatif Mutakhir untuk Otonomi [blog]Model dunia adalah dasar bagi kemampuan untuk memprediksi apa yang mungkin terjadi selanjutnya, yang pada dasarnya penting untuk pengemudian otonom. Mereka dapat bertindak sebagai simulator yang dipelajari, atau eksperimen pemikiran mental “bagaimana jika” untuk pembelajaran atau perencanaan penguatan berbasis model. Dengan memasukkan model dunia ke dalam model mengemudi kita, kita dapat memungkinkan mereka memahami keputusan manusia dengan lebih baik dan pada akhirnya melakukan generalisasi ke situasi yang lebih nyata.
WACVW 2024
[Kertas] [Kode]ISSREW
[KertasarXiv 2024.11
[Makalah]arXiv 2024.11
[Makalah]arXiv 2024.7
[Kertas] [Kode]arXiv 2024.5
[Kertas] [Kode]2024.3, arxiv
[Kertas]TITS
[Kertas]NeurIPS 2024
[Makalah] [Kode]NeurIPS 2024
[Makalah] [Proyek]ECCV 2024
[Makalah]ECCV 2024
[Makalah] [Kode]ECCV 2024
[Makalah] [Kode]ECCV 2024
[Makalah] [Kode]ECCV 2024
[Makalah] [Kode]ECCV 2024
[Makalah]ECCV 2024
[Makalah] [Kode]ECCV 2024
[Kode]ECCV 2024
[Makalah] [Kode]ECCV 2024
[Makalah] [Kode]ICML 2024
[Makalah]CVPR 2024
[Makalah] [Kode]CVPR 2024
[Makalah] [Data]CVPR 2024
[Makalah] [Kode]CVPR 2024
[Makalah] [Kode]CVPR 2024
[Makalah]CVPR 2024
[Makalah] [Kode]CVPR 2024
[Makalah] [Kode]ICLR 2024
[Makalah] [Kode]ICLR 2024
[Makalah]ICLR 2024
[Makalah] [Kode]arXiv 2024.12
[Kertas] [Kode]arXiv 2024.12
[Makalah] [Proyek]arXiv 2024.12
[Makalah]arXiv 2024.12
[Makalah] [Proyek]arXiv 2024.12
[Kertas] [Kode]arXiv 2024.12
[Kertas] [Kode]arXiv 2024.12
[Kertas] [Kode]arXiv 2024.12
[Makalah]arXiv 2024.12
[Makalah] [Halaman Proyek]arXiv 2024.11
[Kertas] [Kode]arXiv 2024.11
[Makalah]arXiv 2024.11
[Makalah] [Halaman Proyek]arXiv 2024.10
[Makalah] [Halaman Proyek]arXiv 2024.10
[Makalah] [Halaman Proyek]arXiv 2024.10
[Makalah] [Halaman Proyek]arXiv 2024.9
[Kertas] [Kode]arXiv 2024.9
[Makalah]arXiv 2024.9
[Kertas] [Kode]arXiv 2024.9
[Makalah]arXiv 2024.9
[Makalah]arXiv 2024.8
[Makalah]arXiv 2024.8
[Makalah]arXiv 2024.7
[Kertas] [Kode]arXiv 2024.7
[Makalah]arXiv 2024.6
[Makalah]arXiv 2024.6
[Kertas] [Kode]arXiv 2024.6
[Kertas] [Kode]arXiv 2024.6
[Kertas] [Kode]arXiv 2024.6
[Kertas] [Kode]arXiv 2024.5
[Kertas] [Kode]arXiv 2024.5
[Kertas] [Kode]arXiv 2024.5
[Kertas] [Kode]arXiv 2024.5
[Kertas] [Kode]arXiv 2024.4
[Kertas] [Kode]arXiv 2024.3
[Makalah] [Proyek]arXiv 2024.3
[Kertas] [Kode]ICRA 2023
[Makalah] [Kode]arXiv 2023.12
[Kertas] [Kode]arXiv 2023.11
[Makalah]arXiv 2023.11
[Makalah]arXiv 2023.9
[Makalah]arXiv 2023.9
[Makalah]arXiv 2023.8
[Kertas] [Kode]NeurIPS 2022
[Makalah] [Kode]NeurIPS 2022 Spotlight
[Kertas] [Kode]ICRA 2022
[Makalah]IROS 2022
[Makalah]NeurIPS 2022 workshop
[Makalah] NVIDIA
[Kertas] [Kode] [ SMAC ] Jawaban Beralas untuk Masalah Pengambilan Keputusan Multi-agen melalui Model Dunia Generatif. NeurIPS 2024
[Makalah]
[ CoWorld ] Membuat RL Offline Online: Model Dunia Kolaboratif untuk Pembelajaran Penguatan Visual Offline. NeurIPS 2024
[Makalah] [Situs Web] [Kode Obor]
[ Berlian ] Difusi untuk Pemodelan Dunia: Detail Visual Penting di Atari. NeurIPS 2024
[Makalah] [Kode]
PIVOT-R : Model Dunia Sadar Titik Arah Berbasis Primitif untuk Manipulasi Robot. NeurIPS 2024
[Makalah]
[ MUN ]Mempelajari Model Dunia untuk Navigasi Sasaran Tanpa Batas. NeurIPS 2024
[Makalah] [Kode]
VidMan : Memanfaatkan Dinamika Implisit dari Model Difusi Video untuk Manipulasi Robot yang Efektif. NeurIPS 24
[Kertas]
Model Dunia Adaptif : Perilaku Belajar dengan Imajinasi Laten dalam Non-Stasionaritas. NeurIPSW 2024
[Makalah]
Munculnya Model Dunia Implisit dari Agen Fana. NeurIPSW 2024
[Makalah]
Representasi Dunia Kausal dalam Model GPT. NeurIPSW 2024
[Makalah]
PreLAR : Pra-pelatihan Model Dunia dengan Representasi Tindakan yang Dapat Dipelajari. ECCV 2024
[Makalah] [Kode]
[ CWM ] Memahami Dinamika Fisik dengan Pemodelan Dunia Kontrafaktual. ECCV 2024
[Makalah] [Kode]
ManiGaussian : Percikan Gaussian Dinamis untuk Manipulasi Robot Multi-tugas. ECCV 2024
[Makalah] [Kode]
[ DWL ] Memajukan Penggerak Humanoid: Menguasai Medan Menantang dengan Pembelajaran Model Dunia yang Menolak. RSS 2024 (Best Paper Award Finalist)
[Makalah]
[ LLM-Sim ] Bisakah Model Bahasa Berfungsi sebagai Simulator Dunia Berbasis Teks? ACL
[Kertas] [Kode]
RoboDreamer : Mempelajari Model Dunia Komposisi untuk Imajinasi Robot. ICML 2024
[Makalah] [Kode]
[ Δ-IRIS ] Model Dunia yang Efisien dengan Tokenisasi Sadar Konteks. ICML 2024
[Makalah] [Kode]
AD3 : Tindakan Implisit adalah Kunci Model Dunia untuk Membedakan Beragam Pengalih Visual. ICML 2024
[Makalah]
Hieros : Imajinasi Hirarki pada Model Dunia Urutan Ruang Negara Terstruktur. ICML 2024
[Makalah]
[ HRSSM ] Mempelajari Representasi Kuat Dinamis Laten untuk Model Dunia. ICML 2024
[Makalah] [Kode]
HarmonyDream : Harmonisasi Tugas Dalam Model Dunia. ICML 2024
[Makalah] [Kode]
[ REM ] Meningkatkan Model Dunia Berbasis Token dengan Prediksi Observasi Paralel. ICML 2024
[Makalah] [Kode]
Apakah Model Dunia Transformer Memberikan Gradien Kebijakan yang Lebih Baik? ICML 2024
[Makalah]
TD-MPC2 : Model Dunia yang Skalabel dan Kuat untuk Kontrol Berkelanjutan. ICLR 2024
[Makalah] [Kode Obor]
DreamSmooth : Meningkatkan Pembelajaran Penguatan Berbasis Model melalui Reward Smoothing. ICLR 2024
[Makalah]
[ R2I ] Menguasai Tugas Memori dengan Model Dunia. ICLR 2024
[Makalah] [Kode JAX]
MAMBA : Pendekatan Model Dunia yang Efektif untuk Pembelajaran Penguatan Meta. ICLR 2024
[Makalah] [Kode]
Pembelajaran Armada Robot Interaktif Multi-Tugas dengan Model Dunia Visual. CoRL 2024
[Kertas] [Kode]
Menuju Model Dunia yang Dapat Ditafsirkan Secara Fisik : Representasi yang Bermakna dengan Pengawasan Lemah untuk Prediksi Lintasan Visual. arXiv 2024.12
[Makalah]
Mimpi Memanipulasi : Model Dunia Komposisi yang Memberdayakan Pembelajaran Imitasi Robot dengan Imajinasi. arXiv 2024.12
[Makalah] [Proyek]
Transformers Menggunakan Model Dunia Kausal dalam Tugas Pemecahan Labirin. arXiv 2024.12
[Makalah]
Owl-1 : Model Omni World untuk Pembuatan Video Panjang yang Konsisten. arXiv 2024.12
[Kertas] [Kode]
StoryWeaver : Model Dunia Terpadu untuk Kustomisasi Karakter Cerita yang Ditingkatkan Pengetahuan. arXiv 2024.12
[Kertas] [Kode]
SimuDICE : Optimalisasi Kebijakan Offline Melalui Pembaruan Model Dunia dan Estimasi DICE. BNAIC 2024
[Makalah]
Eksplorasi Terikat dengan Ketidakpastian Model Dunia dalam Algoritma Pembelajaran Penguatan Aktor-Kritik Lunak. arXiv 2024.12
[Makalah]
Genie 2 : Model dunia yayasan berskala besar. 2024.12
Google DeepMind
[Blog]
[ NWM ] Model Dunia Navigasi. arXiv 2024.12
Yann LeCun
[Makalah] [Proyek]
Matriks : Generasi Dunia Cakrawala Tak Terbatas dengan Kontrol Pergerakan Waktu Nyata. arXiv 2024.12
[Makalah] [Proyek]
Perintah Gerakan : Mengontrol Pembuatan Video dengan Lintasan Gerakan. arXiv 2024.12
[Makalah] [Proyek]
Penjelajah Dunia Generatif. arXiv 2024.11
[Makalah] [Proyek]
[ WebDreamer ] Apakah LLM Anda Diam-diam Merupakan Model Dunia Internet? Perencanaan Berbasis Model untuk Agen Web. arXiv 2024.11
[Kertas] [Kode]
WHALE : Menuju Model Dunia yang Dapat Digeneralisasikan dan Dapat Diskalakan untuk Pengambilan Keputusan yang Terwujud. arXiv 2024.11
[Makalah]
DINO-WM : Model Dunia dengan Fitur Visual Terlatih yang memungkinkan Perencanaan Zero-shot. arXiv 2024.11
Yann LeCun
[Kertas]
Hukum Penskalaan untuk Agen Pra-pelatihan dan Model Dunia. arXiv 2024.11
[Makalah]
[ Phyworld ] Seberapa Jauh Pembuatan Video dari Model Dunia: Perspektif Hukum Fisika. arXiv 2024.11
[Makalah] [Proyek]
IGOR : Representasi Image-GOal adalah Unit Kontrol Atom untuk Model Fondasi dalam AI yang Terwujud. arXiv 2024.10
[Makalah] [Proyek]
EVA : Model Dunia yang Terwujud untuk Antisipasi Video Masa Depan. arXiv 2024.10
[Makalah]
VisualPredicator : Pembelajaran Model Dunia Abstrak dengan Predikat Neuro-Simbolis untuk Perencanaan Robot. arXiv 2024.10
[Makalah]
[ LLMCWM ] Agen Bahasa Bertemu Kausalitas -- Menjembatani LLM dan Model Dunia Kausal. arXiv 2024.10
[Kertas] [Kode]
Model Dunia Tanpa Hadiah untuk Pembelajaran Imitasi Online. arXiv 2024.10
[Makalah]
Agen Web dengan Model Dunia : Mempelajari dan Memanfaatkan Dinamika Lingkungan dalam Navigasi Web. arXiv 2024.10
[Makalah]
[ GLIMO ] Mendasarkan Model Bahasa Besar dalam Lingkungan yang Terwujud dengan Model Dunia yang Tidak Sempurna. arXiv 2024.10
[Makalah]
AVID : Mengadaptasi Model Difusi Video dengan Model Dunia. arXiv 2024.10
[Kertas] [Kode]
[ WMP ] Persepsi Berbasis Model Dunia untuk Penggerak Visual Berkaki. arXiv 2024.9
[Makalah] [Proyek]
[ OSWM ] Model Dunia Sekali Pakai Menggunakan Transformator yang Dilatih pada Prior Sintetis. arXiv 2024.9
[Makalah]
R-AIF : Menyelesaikan Tugas Robotik Berhadiah Jarang dari Piksel dengan Inferensi Aktif dan Model Dunia. arXiv 2024.9
[Makalah]
Mewakili Informasi Posisi dalam Model Dunia Generatif untuk Manipulasi Objek. arXiv 2024.9
[Makalah]
Membuat Model Bahasa Besar menjadi Model Dunia dengan Pengetahuan Prakondisi dan Efek. arXiv 2024.9
[Makalah]
DexSim2Real$^2$ : Membangun Model Dunia Eksplisit untuk Manipulasi Cekatan Objek Artikulasi yang Tepat. arXiv 2024.9
[Makalah]
Eksplorasi Efisien dan Pembelajaran Model Dunia Diskriminatif dengan Abstraksi Berpusat pada Objek. arXiv 2024.8
[Makalah]
[ MoReFree ] Model Dunia Meningkatkan Otonomi dalam Pembelajaran Penguatan. arXiv 2024.8
[Makalah] [Proyek]
UrbanWorld : Model Dunia Perkotaan untuk Generasi Kota 3D. arXiv 2024.7
[Makalah]
PWM : Pembelajaran Kebijakan dengan Model Dunia Besar. arXiv 2024.7
[Kertas] [Kode]
Memprediksi vs. Bertindak : Pertukaran Antara Pemodelan Dunia dan Pemodelan Agen. arXiv 2024.7
[Makalah]
[ GenRL ] Model dunia landasan multimodal untuk agen yang diwujudkan secara generalis. arXiv 2024.6
[Kertas] [Kode]
[ DLLM ] Model Dunia dengan Petunjuk Model Bahasa Besar untuk Pencapaian Tujuan. arXiv 2024.6
[Makalah]
Peta Kognitif untuk Model Bahasa: Perencanaan Optimal melalui Model Representasi Dunia Secara Verbal. arXiv 2024.6
[Makalah]
CityBench : Mengevaluasi Kemampuan Model Bahasa Besar sebagai Model Dunia. arXiv 2024.6
[Kertas] [Kode]
CoDreamer : Model Dunia Terdesentralisasi Berbasis Komunikasi. arXiv 2024.6
[Makalah]
[ EBWM ] Model Dunia Berbasis Energi yang Terinspirasi Secara Kognitif. arXiv 2024.6
[Makalah]
Mengevaluasi Model Dunia yang Tersirat dalam Model Generatif. arXiv 2024.6
[Kertas] [Kode]
Transformers dan Pengkodean Slot untuk Contoh Pemodelan Dunia Fisik yang Efisien. arXiv 2024.5
[Kertas] [Kode]
[ Dalang ] Model Dunia Hierarki sebagai Pengendali Humanoid Visual Seluruh Tubuh. arXiv 2024.5
Yann LeCun
[Kertas] [Kode]
Model BWArea : Model Dunia Pembelajaran, Dinamika Invers, dan Kebijakan Generasi Bahasa Terkendali. arXiv 2024.5
[Makalah]
Pandora : Menuju Model Dunia Umum dengan Tindakan Bahasa Alami dan Status Video. [Kertas] [Kode]
[ WKM ] Perencanaan Agen dengan Model Pengetahuan Dunia. arXiv 2024.5
[Kertas] [Kode]
Newton ™ – model dasar pertama untuk memahami dunia fisik. Archetype AI
[Blog]
Bersaing dan Menulis : Mempelajari Mekanisme Independen untuk Model Dunia Modular. arXiv 2024.4
[Makalah]
MagicTime : Model Pembuatan Video Selang Waktu sebagai Simulator Metamorf. arXiv 2024.4
[Kertas] [Kode]
Memimpikan Banyak Dunia : Mempelajari Model Dunia Kontekstual Membantu Generalisasi Zero-Shot. arXiv 2024.3
[Kertas] [Kode]
ManiGaussian : Percikan Gaussian Dinamis untuk Manipulasi Robot Multi-tugas. arXiv 2024.3
[Kertas] [Kode]
V-JEPA : Arsitektur Prediktif Penyematan Sambungan Video. Meta AI
Yann LeCun
[Blog] [Kertas] [Kode]
[ IWM ] Pembelajaran dan Memanfaatkan Model Dunia dalam Pembelajaran Representasi Visual. Meta AI
[Kertas]
Genie : Lingkungan Interaktif Generatif. DeepMind
[Kertas] [Blog]
[ Sora ] Model pembuatan video sebagai simulator dunia. OpenAI
[Laporan teknis]
[ LWM ] Model Dunia pada Video dan Bahasa Berdurasi Jutaan Dengan RingAttention. arXiv 2024.2
[Kertas] [Kode]
Perencanaan dengan Ensemble Model Dunia. OpenReview
[Makalah]
WorldDreamer : Menuju Model Dunia Umum untuk Pembuatan Video melalui Memprediksi Token Bertopeng. arXiv 2024.1
[Kertas] [Kode]
ICLR 2023 Oral
[Kertas] [Kode Obor]NIPS 2023
[Kertas] [Kode Obor]ICLR 2023
[Makalah] [Kode Obor]arXiv 2023.8
[Kertas] [Kode JAX]arXiv 2023.1
[Kertas] [Kode JAX] [Kode Obor]ICML 2022
[Kertas] [Kode Obor]ICML 2022
[Makalah] [Kode TF]CoRL 2022
[Makalah] [Kode TF]NIPS 2022
[Kertas] [Kode TF]NIPS 2022 Spotlight
[Kertas] [Kode Obor]arXiv 2022.3
[Makalah]ICLR 2021
[Kertas] [Kode TF] [Kode Obor]ICRA 2021
[Makalah]ICLR 2020
[Kertas] [Kode TF] [Kode Obor]ICML 2020
[Kertas] [Kode TF] [Kode Obor]NIPS 2018 Oral
[Kertas]