Descarga de cartpole - Descargar el código fuente cartpole

Español

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

Inicio>Relacionado con la programación>Otro código fuente

cartpole

Otro código fuente

1.0.0

Descargar

Carrito

Reforzamiento de la solución de aprendizaje del Cartpole de OpenAI.

Consulte el artículo medio correspondiente: Cartpole - Introducción al aprendizaje de refuerzo (DQN - profundo Q -learning)

Acerca de

Un poste está unido por una articulación no activada a un carro, que se mueve a lo largo de una pista sin fricción. El sistema se controla aplicando una fuerza de +1 o -1 al CART. El péndulo comienza en posición vertical, y el objetivo es evitar que se caiga. Se proporciona una recompensa de +1 para cada paso de tiempo que el poste permanece en posición vertical. El episodio termina cuando el poste está a más de 15 grados de vertical, o el carro mueve más de 2.4 unidades del centro. fuente

Dqn

DQN estándar con repetición de experiencia.

Hyperparameters:

Gamma = 0.95
Learning_Rate = 0.001
Memoria_size = 1000000
Batch_size = 20
Exploración_max = 1.0
Exploration_min = 0.01
Exploration_decay = 0.995

Estructura del modelo:

Capa densa - Entrada: 4 , Salida: 24 , Activación: Relu
Capa densa - Entrada 24 , Salida: 24 , Activación: Relu
Capa densa - Entrada 24 , salida: 2 , activación: lineal

Función de pérdida de MSE
Adam Optimizer

Actuación

Cartpole-V0 define la "resolución" como una recompensa promedio de 195.0 en más de 100 pruebas consecutivas. fuente

Ejemplo de prueba gif

Gráfico de prueba de ejemplo

Cuadro de prueba resuelto

Autor

Greg (Grzegorz) Surma

CARTERA

Github

Blog

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-03-02
tamaño 1.05MB
Proviene de Github

Aplicaciones relacionadas

waymo open dataset

2024-11-18
chat.petals.dev

2024-11-30
Sunamu

2024-12-14
SmartTube

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
waymo open dataset

Otro código fuente

December 2023 Update
chat.petals.dev

Otro código fuente

1.0.0
Sunamu

Otro código fuente

Release 2.2.0
waymo open dataset

Otro código fuente

December 2023 Update
termwind

Otras categorias

v2.3.0
wp functions

Otras categorias

1.0.0

Información relacionada Todo