dynalangダウンロード - dynalangソースコードのダウンロード

dynalang

AI ソースコード

1.0.0

ダウンロード

言語で世界をモデル化する方法を学ぶ

ダイナランの概要

このリポジトリには、論文「Learning to Model the World with Language」のコードが含まれています。多様な種類の言語を活用してタスクを解決するエージェントである Dynalang を紹介します。言語を使用してマルチモーダルな世界モデルを通じて未来を予測します。

詳細については、以下をご覧ください。

プロジェクトサイト
紙

はじめる

依存関係をインストールします。

 pip install -e .

?ホームグリッド

HomeGrid 環境をインストールし、タスク名 ( homegrid_task 、 homegrid_future 、 homegrid_dynamics 、またはhomegrid_corrections ) でサンプルトレーニングスクリプトを実行します。

pip install homegrid
sh scripts/run_homegrid.sh homegrid_task EXP_NAME GPU_IDS SEED

?メッセンジャー

Messenger 環境の依存関係をインストールします。

sudo apt-get install 
  libsdl-image1.2-dev libsdl-mixer1.2-dev libsdl-ttf2.0-dev 
  libsdl1.2-dev libsmpeg-dev subversion libportmidi-dev ffmpeg 
  libswscale-dev libavformat-dev libavcodec-dev libfreetype6-dev

Messenger 環境のクローンを作成してインストールします。

git clone https://github.com/ahjwang/messenger-emma 
pip install -e messenger-emma

Google ドライブから事前に埋め込まれた文をダウンロードし、 pklファイルをdynalang/embodied/envs/dataに配置します。
s1、s2、または s3 のサンプルトレーニングスクリプトを実行します。

sh scripts/run_messenger_s1.sh EXP_NAME GPU_IDS SEED

? VLN

VLN の依存関係をインストールします。 VLN-CE は古いバージョンの Habitat シミュレーターに依存しているため、固定された依存関係バージョンを含む conda yml ファイルが提供されており、同じバージョンの JAX をインストールすることをお勧めします。

conda create -n dynalang-vln python=3.8
pip install " jax[cuda11_cudnn82]==0.4.8 " -f https://storage.googleapis.com/jax-releases/jax_cuda_releases.html
pip install torch torchvision
conda env update -f env_vln.yml
conda install -c aihabitat -c conda-forge habitat-sim=0.1.7 headless

VLN-CE およびハビタットラボフォークのクローンをこのプロジェクトリポジトリに作成します。

git clone https://github.com/jlin816/VLN-CE VLN_CE
git clone https://github.com/jlin816/habitat-lab habitat_lab

Matterport3D データを VLN-CE ディレクトリにダウンロードします (Python 2.7 が必要): 追加手順

conda create -n py27 python=2.7
conda activate py27
python scripts/download_mp.py --task habitat -o VLN_CE/data/scene_datasets/mp3d/
cd VLN_CE/data/scene_datasets
unzip mp3d/v1/tasks/mp3d_habitat.zip
conda deactivate

これで、シーンがVLN_CE/data/scene_datasets/mp3d/{scene_dir}/...の下のディレクトリに追加されるはずです。

Room-to-Room データセットを VLN_CE ディレクトリにダウンロードする: 追加手順

mkdir -p VLN_CE/data/datasets
cd VLN_CE/data/datasets
gdown https://drive.google.com/uc ? id=1kQ_at68wiK2vAmlWbjJ4EDrLtaM0nfkR
unzip R2R_VLNCE_v1-3_preprocessed.zip

Google ドライブから事前に埋め込まれた文をダウンロードし、 pklファイルをdynalang/embodied/envs/dataに配置します。
サンプルのトレーニングスクリプトを実行します。

sh scripts/run_vln.sh EXP_NAME GPU_IDS SEED

ラングルーム

LangRoom は、移動と会話を同時に行うための LangRoom の辞書アクションスペースをサポートするための変更が含まれているlangroomブランチから実行する必要があります。 LangRoom 環境をインストールし、サンプルトレーニングスクリプトを実行します。

git checkout langroom
pip install langroom
sh run_langroom.sh EXP_NAME GPU_IDS SEED

?テキストの事前トレーニングと微調整

追加の依存関係をインストールし、サンプルトレーニングスクリプトを実行して TinyStories でトレーニングします。デフォルトでは、スクリプトは Messenger S2 タスクの観察およびアクションスペースを使用してモデルを初期化し、トレーニング中にリプレイバッファーでの損失を監視します。同じことを行う場合は、以前の Messenger S2 エージェントの.../episodes/ディレクトリ ( .npzチャンクを含む) へのパスを渡す必要があります。

pip install datasets
sh scripts/pretrain_text.sh EXP_NAME GPU_IDS SEED roneneldan/TinyStories /PATH/TO/EVAL/REPLAY/EPISODES

微調整のために事前トレーニング済みのワールドモデルをエージェントにロードするには、次のフラグを指定してトレーニングスクリプトを実行します ( load_wm_ckptワールドモデルの重みのみをロードし、エージェントの残りの部分を最初から初期化します)。

python dynalang/train.py 
  --load_wm_ckpt True 
  --run.from_checkpoint /path/to/pretraining/checkpoint.pkl 
  ...

トレーニング設定のヒント

論文で行ったのと同じバッチサイズを使用するには、複数の GPU を使用する必要がある場合があることに注意してください。これを行うには、GPU ID のリストを指定してスクリプトを実行し、さらにワールドモデルのトレーニングとポリシーの実行にどの GPU を使用するかを指定します (例: sh run_messenger_s3.sh EXP_NAME 0,1,2,3 SEED --jax.train_devices 0,1,2,3 --jax.policy_devices 0 。
トレーニングを高速化するためにparallelスクリプトを使用することもできます。例については、 scripts/run_vln.sh参照してください。

謝辞

このリポジトリは DreamerV3 から適応されています。

引用

 @article{lin2023learning,
         title={Learning to Model the World with Language},
         author={Jessy Lin and Yuqing Du and Olivia Watkins and Danijar Hafner and Pieter Abbeel and Dan Klein and Anca Dragan},
         year={2023},
         eprint={2308.01399},
         archivePrefix={arXiv},
}

拡大する

追加情報