Awesome World Modelダウンロード - Awesome World Modelソースコードのダウンロード

Awesome World Model

AI ソースコード

1.0.0

ダウンロード

自動運転のための素晴らしい世界モデル

世界モデル（自動運転用）の論文をいくつか集めてください。

無視された論文を見つけた場合は、お気軽にプルリクエストを作成するか、問題をオープンするか、私 / Qi Wang に電子メールを送信してください。このリストをより包括的なものにするための、あらゆる形式での貢献を歓迎します。

このリポジトリが役立つと思われる場合は、スターを付けることを検討してください。

このリストを他の人と自由に共有してください。 ???

ワークショップ＆チャレンジ

CVPR 2024 Workshop & Challenge | OpenDriveLabトラック #4: 予測世界モデル。
世界モデルは現実の抽象的な時空間表現として機能し、現在の状態に基づいて将来の状態を予測できます。ワールドモデルの学習プロセスには、事前トレーニングされた基礎モデルを次のレベルに引き上げる可能性があります。視覚のみの入力が与えられると、ニューラルネットワークは世界の予測能力を証明するために将来の点群を出力します。
CVPR 2023 Workshop on Autonomous Driving : ARGOVERSE チャレンジ、Argoverse 2 センサーデータセットを使用した 3D 占有率予測。次の 3 秒間の世界の時空占有を予測します。

論文

ワールドモデルオリジナルペーパー

移動ロボットの知覚とナビゲーションのための占有グリッドの使用 [論文]

技術ブログまたはビデオ

Yann LeCun : 自律型マシンインテリジェンスへの道 [論文] [ビデオ]
CVPR'23 WAD基調講演 - Ashok Elluswamy、Tesla [ビデオ]
Wayve GAIA-1 の紹介: 自律性のための最先端の生成 AI モデル [ブログ]
世界モデルは、次に何が起こるかを予測する能力の基礎であり、これは自動運転にとって基本的に重要です。これらは、学習済みシミュレーターとして機能したり、モデルベースの強化学習 (RL) や計画のための精神的な「もしも」の思考実験として機能したりできます。世界モデルを運転モデルに組み込むことで、人間の意思決定をよりよく理解できるようになり、最終的にはより現実世界の状況に一般化できるようになります。

調査

自動運転のためのマルチモーダル大規模言語モデルに関する調査。 WACVW 2024 [論文] [コード]
ワールドモデル: 安全性の観点。 ISSREW [論文]
世界を理解するのか、それとも未来を予測するのか?世界モデルの包括的な調査。 arXiv 2024.11 [論文]
自動運転におけるビデオ生成と世界モデル間の相互作用の探索: 調査。 arXiv 2024.11 [論文]
サイバー空間と物理世界の調整: 身体化された AI に関する包括的な調査。 arXiv 2024.7 [論文] [コード]
ソラはワールドシミュレーターですか？一般的な世界モデルとその先のモデルに関する包括的な調査。 arXiv 2024.5 [論文] [コード]
自動運転の世界モデル: 初期調査。 2024.3, arxiv [論文]

2024年

[ SEM2 ] セマンティックマスクワールドモデルを介して、エンドツーエンドの都市自動運転のサンプル効率と堅牢性を強化します。 TITS [紙]
Vista : 高い再現性と多彩な制御性を備えた汎用化可能なドライビングワールドモデル。 NeurIPS 2024 [論文] [コード]
DrivingDojo データセット: インタラクティブで知識が豊富な運転世界モデルを推進します。 NeurIPS 2024 [論文] [プロジェクト]
Think2Drive : 準現実的な自動運転のための潜在世界モデルで考えることによる効率的な強化学習。 ECCV 2024 [論文]
[ MARL-CCE ] 生成世界モデルに基づく自動運転における競争行動のモデル化。 ECCV 2024 [論文] [コード]
DriveDreamer : 自動運転のための現実世界主導の世界モデルに向けて。 ECCV 2024 [論文] [コード]
GenAD : 生成的なエンドツーエンドの自動運転。 ECCV 2024 [論文] [コード]
OccWorld : 自動運転のための 3D 占有世界モデルを学習します。 ECCV 2024 [論文] [コード]
[ NeMo ] 自動運転用のニューラルボリュームワールドモデル。 ECCV 2024 [論文]
CarFormer : 学習されたオブジェクト中心の表現による自動運転。 ECCV 2024 [論文] [コード]
[ MARL-CCE ] 生成世界モデルの下での自動運転における競争行動のモデリング。 ECCV 2024 [コード]
[ GUMP ] スケーラブルな生成モデルによる動作計画タスクの解決。 ECCV 2024 [論文] [コード]
DrivingDiffusion : 潜在拡散モデルを使用したレイアウトガイド付きマルチビュー運転シーンビデオ生成。 ECCV 2024 [論文] [コード]
3D-VLA : 3D 視覚、言語、アクションの生成世界モデル。 ICML 2024 [論文]
[ ViDAR ] ビジュアル点群予測により、スケーラブルな自動運転が可能になります。 CVPR 2024 [論文] [コード]
[ GenAD ] 自動運転のための一般化された予測モデル。 CVPR 2024 [論文] [データ]
Cam4DOCC : 自動運転アプリケーションにおけるカメラのみの 4D 占有予測のベンチマーク。 CVPR 2024 [論文] [コード]
[ Drive-WM ] 未来への運転: 自動運転の世界モデルを使用したマルチビューのビジュアル予測と計画。 CVPR 2024 [論文] [コード]
DriveWorld : 自動運転用のワールドモデルを介した 4D 事前トレーニング済みシーンの理解。 CVPR 2024 [論文]
Panacea : 自動運転向けのパノラマで制御可能なビデオ生成。 CVPR 2024 [論文] [コード]
UnO : 知覚と予測のための教師なし占有フィールド。 CVPR 2024 [論文] [コード]
MagicDrive : 多様な 3D ジオメトリ制御によるストリートビューの生成。 ICLR 2024 [論文] [コード]
Copilot4D : 離散拡散による自動運転のための教師なし世界モデルの学習。 ICLR 2024 [論文]
SafeDreamer : ワールドモデルを使用した安全な強化学習。 ICLR 2024 [論文] [コード]
DrivingWorld : ビデオ GPT による自動運転の世界モデルの構築。 arXiv 2024.12 [論文] [コード]
DrivingGPT : マルチモーダル自己回帰トランスフォーマーを使用して、運転世界のモデリングと計画を統合します。 arXiv 2024.12 [論文] [プロジェクト]
分離された動的フローと画像支援トレーニングによる効率的な占有世界モデル。 arXiv 2024.12 [論文]
GEM : きめの細かいエゴモーション、オブジェクトダイナミクス、およびシーン構成制御のための一般化可能なエゴビジョンマルチモーダルワールドモデル。 arXiv 2024.12 [論文] [プロジェクト]
GaussianWorld : ストリーミング 3D 占有予測用のガウスワールドモデル。 arXiv 2024.12 [論文] [コード]
Doe-1 : 大規模な世界モデルによる閉ループ自動運転。 arXiv 2024.12 [論文] [コード]
[ DrivePhysica ] 物理情報に基づいた運転世界モデル。 arXiv 2024.12 [論文] [コード]
HoloDrive : 自動運転のための総合的な 2D-3D マルチモーダルストリートシーンの生成。 arXiv 2024.12 [論文]
InfinityDrive : 世界モデルの運転における時間制限を打ち破る。 arXiv 2024.12 [論文] [プロジェクトページ]
ReconDreamer : オンライン復元による運転シーンの再構築のための世界モデルの作成。 arXiv 2024.11 [論文] [コード]
言語モデルを使用した配布外シナリオの生成。 arXiv 2024.11 [論文]
Imagine-2-Drive : 自動運転車用の CARLA での高忠実度ワールドモデリング。 arXiv 2024.11 [論文] [プロジェクトページ]
WorldSimBench : ワールドシミュレータとしてのビデオ生成モデルに向けて。 arXiv 2024.10 [論文] [プロジェクトページ]
DriveDreamer4D : ワールドモデルは 4D ドライビングシーン表現のための効果的なデータマシンです。 arXiv 2024.10 [論文] [プロジェクトページ]
DOME : 拡散モデルを忠実度の高い制御可能な占有世界モデルに飼いならす。 arXiv 2024.10 [論文] [プロジェクトページ]
[ SSR ] エンドツーエンドの自動運転には本当に知覚タスクが必要ですか? arXiv 2024.9 [論文] [コード]
潜在空間生成世界モデルを使用した自動運転車の模倣学習における共変量シフトの緩和。 arXiv 2024.9 [論文]
[ LatentDriver ] 自動運転における潜在世界モデルから複数の確率的決定を学習します。 arXiv 2024.9 [論文] [コード]
RenderWorld : 自己監視型 3D ラベルを持つワールドモデル。 arXiv 2024.9 [論文]
OccLLaMA : 自動運転のための占有-言語-アクション生成世界モデル。 arXiv 2024.9 [論文]
DriveGenVLM : ビジョン言語モデルベースの自動運転のための現実世界のビデオ生成。 arXiv 2024.8 [論文]
[ Drive-OccWorld ] 占有世界の運転: 自動運転の世界モデルを使用したビジョン中心の 4D 占有予測と計画。 arXiv 2024.8 [論文]
BEVWorld : 統合された BEV 潜在空間を介した自動運転のためのマルチモーダルな世界モデル。 arXiv 2024.7 [論文] [コード]
[ TOKEN ] 自動運転におけるロングテールイベントに対処するために、世界をオブジェクトレベルの知識にトークン化します。 arXiv 2024.7 [論文]
UMAD : 自動運転のための教師なしマスクレベルの異常検出。 arXiv 2024.6 [論文]
SimGen : シミュレータ条件付き運転シーン生成。 arXiv 2024.6 [論文] [コード]
[ AdaptiveDriver ] 自動運転のためのアダプティブワールドモデルを使用した計画。 arXiv 2024.6 [論文] [コード]
[ LAW ] 潜在世界モデルによるエンドツーエンドの自動運転の強化。 arXiv 2024.6 [論文] [コード]
[ Delphi ] 制御可能な長時間ビデオ生成により、エンドツーエンドの自動運転の一般化を解き放つ。 arXiv 2024.6 [論文] [コード]
OccSora : 自動運転の世界シミュレーターとしての 4D 占有生成モデル。 arXiv 2024.5 [論文] [コード]
MagicDrive3D : ストリートシーンでの任意のビューレンダリングのための制御可能な 3D 生成。 arXiv 2024.5 [論文] [コード]
CarDreamer : ワールドモデルベースの自動運転のためのオープンソース学習プラットフォーム。 arXiv 2024.5 [論文] [コード]
[ DriveSim ] 運転のための世界モデルとしてマルチモーダル LLM を調査します。 arXiv 2024.5 [論文] [コード]
LidarDM : 生成された世界での生成 LiDAR シミュレーション。 arXiv 2024.4 [論文] [コード]
SubjectDrive : Subject Control を介した自動運転における生成データのスケーリング。 arXiv 2024.3 [論文] [プロジェクト]
DriveDreamer-2 : 多様な運転ビデオ生成のための LLM 拡張ワールドモデル。 arXiv 2024.3 [論文] [コード]

2023年

TrafficBots : 自動運転シミュレーションと動作予測の世界モデルに向けて。 ICRA 2023 [論文] [コード]
WoVoGen : 制御可能なマルチカメラ運転シーン生成のための世界的なボリュームを意識した普及。 arXiv 2023.12 [論文] [コード]
[ CTT ] カテゴリカルトラフィックトランスフォーマー: トークン化された潜在性を使用した、解釈可能で多様な動作の予測。 arXiv 2023.11 [論文]
MUVO : 幾何学的表現を使用した自動運転のためのマルチモーダル生成世界モデル。 arXiv 2023.11 [論文]
GAIA-1 : 自動運転のための生成世界モデル。 arXiv 2023.9 [論文]
ADriver-I : 自動運転の一般的な世界モデル。 arXiv 2023.9 [論文]
UniWorld : 世界モデルによる自動運転事前トレーニング。 arXiv 2023.8 [論文] [コード]

2022年

[ MILE ] 都市部の運転のためのモデルベースの模倣学習。 NeurIPS 2022 [論文] [コード]
Iso-Dream : ワールドモデルにおける制御不可能なビジュアルダイナミクスを分離して活用します。 NeurIPS 2022 Spotlight [論文] [コード]
Symphony : 自動運転シミュレーションのための現実的で多様なエージェントの学習。 ICRA 2022 [論文]
自動運転計画のための階層モデルベースの模倣学習。 IROS 2022 [紙]
[ SEM2 ] セマンティックマスクワールドモデルを介して、エンドツーエンドの都市自動運転のサンプル効率と堅牢性を強化します。 NeurIPS 2022 workshop [論文]

異世界モデルペーパー

2025年

Cosmos World Foundation 物理 AI 用モデルプラットフォーム。 NVIDIA [論文] [コード]

2024年

[ SMAC ] 生成世界モデルによるマルチエージェント意思決定問題に対する根拠のある答え。 NeurIPS 2024 [論文]
[ CoWorld ] オフライン RL をオンラインにする: オフラインの視覚強化学習のための共同世界モデル。 NeurIPS 2024 [論文] [ウェブサイト] [トーチコード]
[ダイヤモンド] ワールドモデリングの普及: Atari では視覚的な詳細が重要です。 NeurIPS 2024 [論文] [コード]
PIVOT-R : ロボット操作のためのプリミティブ駆動のウェイポイント認識世界モデル。 NeurIPS 2024 [論文]
[ MUN ] 制約のない目標ナビゲーションのための学習世界モデル。 NeurIPS 2024 [論文] [コード]
VidMan : ビデオ拡散モデルから暗黙的なダイナミクスを活用して効果的なロボット操作を実現します。 NeurIPS 24 [論文]
適応世界モデル: 非定常性下での潜在的な想像力による学習行動。 NeurIPSW 2024 [論文]
定命のエージェントからの暗黙の世界モデルの出現。 NeurIPSW 2024 [論文]
GPT モデルにおける因果世界表現。 NeurIPSW 2024 [論文]
PreLAR : 学習可能なアクション表現を使用したワールドモデルの事前トレーニング。 ECCV 2024 [論文] [コード]
[ CWM ] 反事実世界モデリングによる物理力学の理解。 ECCV 2024 [論文] [コード]
ManiGaussian : マルチタスクのロボット操作のための動的ガウススプラッティング。 ECCV 2024 [論文] [コード]
[ DWL ] ヒューマノイドの移動の進歩: ノイズ除去ワールドモデル学習による困難な地形の習得。 RSS 2024 (Best Paper Award Finalist) [論文]
[ LLM-Sim ] 言語モデルはテキストベースの世界シミュレータとして機能しますか? ACL [論文] [コード]
RoboDreamer : ロボットの想像力のための構成世界モデルを学習します。 ICML 2024 [論文] [コード]
[ Δ-IRIS ] コンテキストを意識したトークン化による効率的な世界モデル。 ICML 2024 [論文] [コード]
AD3 : 世界モデルが多様な視覚的妨害者を区別するには、暗黙のアクションが鍵となります。 ICML 2024 [論文]
Hieros : 構造化状態空間シーケンス世界モデルに関する階層的想像力。 ICML 2024 [論文]
[ HRSSM ] ワールドモデルの潜在動的ロバスト表現の学習。 ICML 2024 [論文] [コード]
HarmonyDream : ワールドモデル内のタスクの調和。 ICML 2024 [論文] [コード]
[ REM ] 並行観測予測によるトークンベースの世界モデルの改善。 ICML 2024 [論文] [コード]
Transformer World モデルはより良いポリシー勾配を提供しますか? ICML 2024 [論文]
TD-MPC2 : 継続的制御のためのスケーラブルで堅牢なワールドモデル。 ICLR 2024 [論文] [トーチコード]
DreamSmooth : 報酬平滑化によるモデルベースの強化学習の改善。 ICLR 2024 [論文]
[ R2I ] ワールドモデルを使用してメモリタスクをマスターします。 ICLR 2024 [論文] [JAX コード]
MAMBA : メタ強化学習のための効果的な世界モデルアプローチ。 ICLR 2024 [論文] [コード]
ビジュアルワールドモデルを使用したマルチタスク対話型ロボットフリート学習。 CoRL 2024 [論文] [コード]
物理的に解釈可能な世界モデルに向けて: 視覚的な軌道予測のための意味のある弱教師あり表現。 arXiv 2024.12 [論文]
操作する夢: 想像力によるロボットの模倣学習を強化する構成世界モデル。 arXiv 2024.12 [論文] [プロジェクト]
トランスフォーマーは迷路解決タスクで因果世界モデルを使用します。 arXiv 2024.12 [論文]
Owl-1 : 一貫した長時間ビデオ生成のためのオムニワールドモデル。 arXiv 2024.12 [論文] [コード]
StoryWeaver : 知識を強化したストーリーキャラクターのカスタマイズのための統一世界モデル。 arXiv 2024.12 [論文] [コード]
SimuDICE : ワールドモデルの更新と DICE 推定によるオフラインポリシーの最適化。 BNAIC 2024 [論文]
ソフトアクタークリティック強化学習アルゴリズムにおけるワールドモデルの不確実性を伴う境界探索。 arXiv 2024.12 [論文]
Genie 2 : 大規模な財団世界モデル。 2024.12 Google DeepMind [ブログ]
[ NWM ] ナビゲーションワールドモデル。 arXiv 2024.12 Yann LeCun [論文] [プロジェクト]
マトリックス: リアルタイム移動制御による無限の地平線の世界生成。 arXiv 2024.12 [論文] [プロジェクト]
モーションプロンプト: モーション軌跡を使用してビデオ生成を制御します。 arXiv 2024.12 [論文] [プロジェクト]
ジェネレーティブワールドエクスプローラー。 arXiv 2024.11 [論文] [プロジェクト]
[ WebDreamer ] あなたの LLM は密かにインターネットの世界モデルですか? Web エージェントのモデルベースのプランニング。 arXiv 2024.11 [論文] [コード]
WHALE : 身体化された意思決定のための一般化可能かつスケーラブルな世界モデルに向けて。 arXiv 2024.11 [論文]
DINO-WM : 事前トレーニングされたビジュアル機能のワールドモデルにより、ゼロショットプランニングが可能になります。 arXiv 2024.11 Yann LeCun [論文]
事前トレーニングエージェントとワールドモデルのスケーリング則。 arXiv 2024.11 [論文]
[ Phyworld ] ビデオ生成はワールドモデルからどの程度離れているのか: 物理法則の観点。 arXiv 2024.11 [論文] [プロジェクト]
IGOR : Image-GOal Representations は、身体化された AI の基礎モデルの原子制御ユニットです。 arXiv 2024.10 [論文] [プロジェクト]
EVA : 将来のビデオ予測のための具体化された世界モデル。 arXiv 2024.10 [論文]
VisualPredicator : ロボット計画のための神経記号述語を使用した抽象世界モデルの学習。 arXiv 2024.10 [論文]
[ LLMCWM ] 言語エージェントが因果関係を満たす -- LLM と因果世界モデルの橋渡し。 arXiv 2024.10 [論文] [コード]
オンライン模倣学習のための報酬のない世界モデル。 arXiv 2024.10 [論文]
ワールドモデルを備えた Web エージェント: Web ナビゲーションにおける環境ダイナミクスの学習と活用。 arXiv 2024.10 [論文]
[ GLIMO ] 不完全な世界モデルを持つ具体化された環境で大規模な言語モデルを基礎付ける。 arXiv 2024.10 [論文]
AVID : ビデオ拡散モデルを世界モデルに適応させる。 arXiv 2024.10 [論文] [コード]
[ WMP ] 視覚的な脚の移動に対するワールドモデルベースの認識。 arXiv 2024.9 [論文] [プロジェクト]
[ OSWM ] 合成事前学習でトレーニングされたトランスフォーマーを使用したワンショットワールドモデル。 arXiv 2024.9 [論文]
R-AIF : アクティブ推論とワールドモデルを使用して、ピクセルから報酬が少ないロボットタスクを解決します。 arXiv 2024.9 [論文]
オブジェクト操作のための生成世界モデルにおける位置情報の表現。 arXiv 2024.9 [論文]
前提条件と効果の知識を使用して、大規模な言語モデルをワールドモデルに作成します。 arXiv 2024.9 [論文]
DexSim2Real$^2$ : 正確な多関節オブジェクトの器用な操作のための明示的な世界モデルの構築。 arXiv 2024.9 [論文]
オブジェクト中心の抽象化による効率的な探索と識別世界モデル学習。 arXiv 2024.8 [論文]
[ MoReFree ] ワールドモデルは強化学習の自律性を高めます。 arXiv 2024.8 [論文] [プロジェクト]
UrbanWorld : 3D 都市生成のためのアーバンワールドモデル。 arXiv 2024.7 [論文]
PWM : 大規模な世界モデルを使用したポリシー学習。 arXiv 2024.7 [論文] [コード]
予測 vs. 行動: ワールドモデリングとエージェントモデリングのトレードオフ。 arXiv 2024.7 [論文]
[ GenRL ] ジェネラリストの身体化エージェントのためのマルチモーダル基盤世界モデル。 arXiv 2024.6 [論文] [コード]
[ DLLM ] 目標達成のための大規模言語モデルのヒントを含む世界モデル。 arXiv 2024.6 [論文]
言語モデルの認知マップ: 世界モデルを言語的に表現することによる最適な計画。 arXiv 2024.6 [論文]
CityBench : 世界モデルとしての大規模言語モデルの機能の評価。 arXiv 2024.6 [論文] [コード]
CoDreamer : 通信ベースの分散型世界モデル。 arXiv 2024.6 [論文]
[ EBWM ] 認知にインスピレーションを得たエネルギーベースの世界モデル。 arXiv 2024.6 [論文]
生成モデルに暗黙的に含まれる世界モデルの評価。 arXiv 2024.6 [論文] [コード]
効率的な物理世界モデリングのサンプルのためのトランスフォーマーとスロットエンコーディング。 arXiv 2024.5 [論文] [コード]
[ Puppeteer ] 視覚的な全身ヒューマノイドコントローラーとしての階層的世界モデル。 arXiv 2024.5 Yann LeCun [論文] [コード]
BWArea モデル: 学習世界モデル、逆ダイナミクス、および制御可能な言語生成のためのポリシー。 arXiv 2024.5 [論文]
Pandora : 自然言語アクションとビデオ状態を備えた一般的な世界モデルに向けて。 [紙] [コード]
[ WKM ] ワールドナレッジモデルを使用したエージェントプランニング。 arXiv 2024.5 [論文] [コード]
Newton ™ – 物理世界を理解するための、この種では初めての基礎モデル。 Archetype AI [ブログ]
競争して構成する: モジュラー世界モデルの独立したメカニズムを学習します。 arXiv 2024.4 [論文]
MagicTime : メタモーフィックシミュレーターとしてのタイムラプスビデオ生成モデル。 arXiv 2024.4 [論文] [コード]
多くの世界を夢見る: コンテキスト世界モデルの学習は、ゼロショットの一般化に役立ちます。 arXiv 2024.3 [論文] [コード]
ManiGaussian : マルチタスクのロボット操作のための動的ガウススプラッティング。 arXiv 2024.3 [論文] [コード]
V-JEPA : ビデオジョイント埋め込み予測アーキテクチャ。 Meta AI Yann LeCun [ブログ] [論文] [コード]
[ IWM ] 視覚表現学習における世界モデルの学習と活用。 Meta AI [論文]
Genie : 生成的なインタラクティブ環境。 DeepMind [論文] [ブログ]
[ Sora ] ワールドシミュレーターとしてのビデオ生成モデル。 OpenAI 【技術レポート】
[ LWM ] RingAttend による百万長ビデオと言語の世界モデル。 arXiv 2024.2 [論文] [コード]
世界のモデルのアンサンブルとの計画。 OpenReview [論文]
WorldDreamer : マスクされたトークンの予測によるビデオ生成のための一般的な世界モデルに向けて。 arXiv 2024.1 [論文] [コード]

2023年

[ IRIS ] トランスフォーマーはサンプル効率世界モデルです。 ICLR 2023 Oral [論文] [トーチコード]
STORM : 強化学習のための効率的な確率的変換ベースの世界モデル。 NIPS 2023 [論文] [トーチコード]
[ TWM ] トランスフォーマーベースのワールドモデルは 100k のインタラクションに満足しています。 ICLR 2023 [論文] [トーチコード]
[ Dynalang ] 言語で世界をモデル化することを学びます。 arXiv 2023.8 [論文] [JAX コード]
[ DreamerV3 ] Discrete World Model を使用した Atari のマスタリング。 arXiv 2023.1 [論文] [JAX コード] [トーチコード]

2022年

[ TD-MPC ] モデル予測制御のための時間差分学習。 ICML 2022 [論文][トーチコード]
DreamerPro : プロトタイプ表現を使用した再構成不要のモデルベースの強化学習。 ICML 2022 [論文] [TF コード]
DayDreamer : 物理的なロボット学習のための世界モデル。 CoRL 2022 [論文] [TF コード]
ピクセルからの深い階層計画。 NIPS 2022 [論文] [TFコード]
Iso-Dream : ワールドモデルにおける制御不可能なビジュアルダイナミクスを分離して活用します。 NIPS 2022 Spotlight [論文] [トーチコード]
DreamingV2 : 再構成を行わない離散世界モデルによる強化学習。 arXiv 2022.3 [論文]

2021年

[ DreamerV2 ] Discrete World Model を使用した Atari のマスタリング。 ICLR 2021 [論文] [TF コード] [トーチコード]
夢見る: 再構成を伴わない潜在的な想像力によるモデルベースの強化学習。 ICRA 2021 [論文]

2020年

[ DreamerV1 ] コントロールする夢: 潜在的な想像力による学習行動。 ICLR 2020 [論文] [TF コード] [トーチコード]
[ Plan2Explore ] 自己監視世界モデルを介した探索を計画しています。 ICML 2020 [論文] [TF コード] [トーチコード]