T2M GPTダウンロード - T2M GPTソースコードのダウンロード

T2M GPT

AI ソースコード

1.0.0

ダウンロード

(CVPR 2023) T2M-GPT

論文「T2M-GPT: Generating Human Motion from Textual descriptions with Discrete Representations」の Pytorch 実装

[プロジェクトページ] [論文] [ノートブックデモ] [HuggingFace] [宇宙デモ] [T2M-GPT+]

ティーザー

私たちのプロジェクトがあなたの研究に役立つ場合は、引用することを検討してください:

 @inproceedings{zhang2023generating,
  title={T2M-GPT: Generating Human Motion from Textual Descriptions with Discrete Representations},
  author={Zhang, Jianrong and Zhang, Yangsong and Cun, Xiaodong and Huang, Shaoli and Zhang, Yong and Zhao, Hongwei and Lu, Hongtao and Shen, Xi},
  booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2023},
}

1. 視覚的な結果 (プロジェクトページでさらに多くの結果を見つけることができます)

テキスト: 男性が前に出て逆立ちをします。
GT	T2M	MDM	モーションディフューズ	私たちのもの

テキスト: 男が地面から立ち上がり、円を描いて歩き、再び地面に座ります。
GT	T2M	MDM	モーションディフューズ	私たちのもの

2. インストール

2.1.環境

私たちのモデルは単一の GPU V100-32Gで学習できます

conda env create -f environment.yml
conda activate T2M-GPT

コードは Python 3.8 と PyTorch 1.8.1 でテストされました。

2.2.依存関係

bash dataset/prepare/download_glove.sh

2.3.データセット

HumanML3D と KIT-ML という 2 つの 3D ヒューマンモーション言語データセットを使用しています。どちらのデータセットについても、詳細とダウンロードリンクが [こちら] にあります。

HumanML3D を例に挙げると、ファイルディレクトリは次のようになります。

 ./dataset/HumanML3D/
├── new_joint_vecs/
├── texts/
├── Mean.npy # same as in [HumanML3D](https://github.com/EricGuo5513/HumanML3D) 
├── Std.npy # same as in [HumanML3D](https://github.com/EricGuo5513/HumanML3D) 
├── train.txt
├── val.txt
├── test.txt
├── train_val.txt
└── all.txt

2.4.モーションおよびテキスト特徴抽出ツール:

生成されたモーションを評価するために、t2m によって提供されるのと同じエクストラクターを使用します。エクストラクターをダウンロードしてください。

bash dataset/prepare/download_extractor.sh

2.5.事前トレーニングされたモデル

事前トレーニングされたモデルファイルは、「pretrained」フォルダーに保存されます。

bash dataset/prepare/download_model.sh

2.6. SMPL メッシュのレンダリング (オプション)

生成されたモーションをレンダリングしたい場合は、以下をインストールする必要があります。

sudo sh dataset/prepare/download_smpl.sh
conda install -c menpo osmesa
conda install h5py
conda install -c conda-forge shapely pyrender trimesh mapbox_earcut

3. クイックスタート

コードの使用方法に関するクイックスタートガイドは、demo.ipynb で入手できます。

4. 電車

キットデータセットの場合は、「--dataname kit」を設定するだけでよいことに注意してください。

4.1. VQ-VAE

結果はフォルダー出力に保存されます。

VQトレーニング

python3 train_vq.py 
--batch-size 256 
--lr 2e-4 
--total-iter 300000 
--lr-scheduler 200000 
--nb-code 512 
--down-t 2 
--depth 3 
--dilation-growth-rate 3 
--out-dir output 
--dataname t2m 
--vq-act relu 
--quantizer ema_reset 
--loss-vel 0.5 
--recons-loss l1_smooth 
--exp-name VQVAE

4.2. GPT

結果はフォルダー出力に保存されます。

GPTトレーニング

python3 train_t2m_trans.py  
--exp-name GPT 
--batch-size 128 
--num-layers 9 
--embed-dim-gpt 1024 
--nb-code 512 
--n-head-gpt 16 
--block-size 51 
--ff-rate 4 
--drop-out-rate 0.1 
--resume-pth output/VQVAE/net_last.pth 
--vq-name VQVAE 
--out-dir output 
--total-iter 300000 
--lr-scheduler 150000 
--lr 0.0001 
--dataname t2m 
--down-t 2 
--depth 3 
--quantizer ema_reset 
--eval-iter 10000 
--pkeep 0.5 
--dilation-growth-rate 3 
--vq-act relu

5. 評価

5.1. VQ-VAE

VQ評価

python3 VQ_eval.py 
--batch-size 256 
--lr 2e-4 
--total-iter 300000 
--lr-scheduler 200000 
--nb-code 512 
--down-t 2 
--depth 3 
--dilation-growth-rate 3 
--out-dir output 
--dataname t2m 
--vq-act relu 
--quantizer ema_reset 
--loss-vel 0.5 
--recons-loss l1_smooth 
--exp-name TEST_VQVAE 
--resume-pth output/VQVAE/net_last.pth

5.2. GPT

GPT 評価

text-to-motion の評価設定に従って、モデルを 20 回評価し、平均結果を報告します。同じテキストから 30 個のモーションを生成する必要があるマルチモダリティの部分により、評価に時間がかかります。

python3 GPT_eval_multi.py  
--exp-name TEST_GPT 
--batch-size 128 
--num-layers 9 
--embed-dim-gpt 1024 
--nb-code 512 
--n-head-gpt 16 
--block-size 51 
--ff-rate 4 
--drop-out-rate 0.1 
--resume-pth output/VQVAE/net_last.pth 
--vq-name VQVAE 
--out-dir output 
--total-iter 300000 
--lr-scheduler 150000 
--lr 0.0001 
--dataname t2m 
--down-t 2 
--depth 3 
--quantizer ema_reset 
--eval-iter 10000 
--pkeep 0.5 
--dilation-growth-rate 3 
--vq-act relu 
--resume-trans output/GPT/net_best_fid.pth

6. SMPL メッシュレンダリング

SMPL メッシュレンダリング

npyフォルダーのアドレスとモーション名を入力する必要があります。以下に例を示します。

python3 render_final.py --filedir output/TEST_GPT/ --motion-list 000019 005485

7. 謝辞

以下の方々のご協力に感謝いたします。

text-to-motion、TM2T、MDM、MotionDiffuse などのパブリックコード。
Mathis Petrovich、Yuming Du、Yingyi Chen、Dexiong Chen、Xuelin Chen には、刺激的なディスカッションと貴重なフィードバックをいただきました。
Minh Chien Vu によるハグフェイススペースデモ。

8. チャンログ

2023/02/19 スケルトンと SMPL メッシュの両方の可視化にハグ顔空間デモを追加しました。

拡大する

追加情報

バージョン 1.0.0
タイプ AI ソースコード
更新時間 2025-01-08
サイズ 13.71MB
から Github

T2M GPT

(CVPR 2023) T2M-GPT

目次

1. 視覚的な結果 (プロジェクトページでさらに多くの結果を見つけることができます)

2. インストール

2.1.環境

2.2.依存関係

2.3.データセット

2.4.モーションおよびテキスト特徴抽出ツール:

2.5.事前トレーニングされたモデル

2.6. SMPL メッシュのレンダリング (オプション)

3. クイックスタート

4. 電車

4.1. VQ-VAE

4.2. GPT

5. 評価

5.1. VQ-VAE

5.2. GPT

6. SMPL メッシュレンダリング

7. 謝辞

8. チャンログ

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

GPT 映画とテレビの最新バージョン

chat.petals.dev

GPT Prompt Templates

GPTyped

node telegram bot api

typebot.io

python wechaty getting started

waymo open dataset

wp functions

termwind

T2M GPT

(CVPR 2023) T2M-GPT

目次

1. 視覚的な結果 (プロジェクト ページでさらに多くの結果を見つけることができます)

2. インストール

2.1.環境

2.2.依存関係

2.3.データセット

2.4.モーションおよびテキスト特徴抽出ツール:

2.5.事前トレーニングされたモデル

2.6. SMPL メッシュのレンダリング (オプション)

3. クイックスタート

4. 電車

4.1. VQ-VAE

4.2. GPT

5. 評価

5.1. VQ-VAE

5.2. GPT

6. SMPL メッシュ レンダリング

7. 謝辞

8. チャンログ

1. 視覚的な結果 (プロジェクトページでさらに多くの結果を見つけることができます)

6. SMPL メッシュレンダリング