cartpoleダウンロード - cartpoleソースコードのダウンロード

日本語

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

ホーム>プログラミング関連>その他のソースコード

cartpole

その他のソースコード

1.0.0

ダウンロード

カートポール

Openaiのカートポールの強化学習ソリューション。

対応する媒体記事をご覧ください：カートポール - 補強学習の紹介（DQN-ディープQラーニング）

について

ポールは、機能していないジョイントによってカートに取り付けられ、摩擦のないトラックに沿って移動します。システムは、+1または-1の力をカートに適用することにより制御されます。振り子は直立して始まり、目標はそれが倒れないようにすることです。ポールが直立したままであるすべてのタイムステップに対して+1の報酬が提供されます。エピソードは、ポールが垂直から15度を超えるか、カートが中央から2.4ユニット以上移動する場合に終了します。ソース

DQN

エクスペリエンスリプレイを備えた標準DQN。

ハイパーパラメーター：

ガンマ= 0.95
Learning_rate = 0.001
memory_size = 1000000
batch_size = 20
Exploration_max = 1.0
Exploration_min = 0.01
Exploration_decay = 0.995

モデル構造：

高密度層 - 入力： 4 、出力： 24 、アクティベーション： relu
密な層 - 入力24 、出力： 24 、アクティベーション： relu
高密度層 - 入力24 、出力： 2 、アクティベーション：線形

MSE損失関数
Adam Optimizer

パフォーマンス

Cartpole-V0は、「解決」を100回の連続した試験で195.0の平均報酬を得ると定義しています。ソース

試験gifの例

試験チャートの例

解決された試行チャート

著者

グレッグ（Grzegorz）Surma

ポートフォリオ

github

ブログ

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-03-02
サイズ 1.05MB
から Github

関連アプリ

waymo open dataset

2024-11-18
chat.petals.dev

2024-11-30
Sunamu

2024-12-14
SmartTube

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15

おすすめ

chat.petals.dev

その他のソースコード

1.0.0
GPT Prompt Templates

その他のソースコード

1.0.0
GPTyped

その他のソースコード

GPTyped 1.0.5
waymo open dataset

その他のソースコード

December 2023 Update
chat.petals.dev

その他のソースコード

1.0.0
Sunamu

その他のソースコード

Release 2.2.0
waymo open dataset

その他のソースコード

December 2023 Update
termwind

その他のカテゴリー

v2.3.0
wp functions

その他のカテゴリー

1.0.0

関連情報すべて