Скачать cartpole - Скачать исходный код cartpole

Русский

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

Главная страница>Связанные с программированием>Другой исходный код

cartpole

Другой исходный код

1.0.0

Скачать

Кусок

Подкрепление учебного решения для телегора Openai.

Ознакомьтесь с соответствующей статьей: Cartpole - Введение в обучение подкреплению (DQN - Глубокое Q -обучение)

О

Полюс прикреплен к неактизированному соединению к телеге, которая движется вдоль трассы без трения. Система контролируется путем применения силы +1 или -1 к телеге. Маятник запускается в вертикальном положении, и цель состоит в том, чтобы предотвратить его падение. Награда +1 предоставляется за каждый временный шаг, что полюс остается вертикальным. Эпизод заканчивается, когда полюс находится более чем в 15 градусах от вертикальной, или тележка перемещается более чем на 2,4 единицы из центра. источник

Дкн

Стандартный DQN с опытом воспроизведения.

Гиперпараметры:

Гамма = 0,95
Learning_Rate = 0,001
Memory_size = 1000000
Batch_size = 20
Exploration_max = 1,0
Exploration_min = 0,01
Exploration_decay = 0,995

Структура модели:

Плотный слой - вход: 4 , выход: 24 , активация :
Плотный слой - вход 24 , выход: 24 , активация: Relu
Плотный слой - вход 24 , выход: 2 , активация: линейная

Функция потери MSE
Адам оптимизатор

Производительность

Cartpole-V0 определяет «решение» как получение среднего вознаграждения в 195,0 более 100 последовательных испытаний. источник

Пример пробного гиф

Пример пробной диаграммы

Решенная диаграмма испытаний

Автор

Грег (Грегорз) Сурма

ПОРТФЕЛЬ

GitHub

Блог

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-03-02
размер 1.05MB
От Github

Связанные приложения

waymo open dataset

2024-11-18
chat.petals.dev

2024-11-30
Sunamu

2024-12-14
SmartTube

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15

Рекомендуем вам

chat.petals.dev

Другой исходный код

1.0.0
GPT Prompt Templates

Другой исходный код

1.0.0
GPTyped

Другой исходный код

GPTyped 1.0.5
waymo open dataset

Другой исходный код

December 2023 Update
chat.petals.dev

Другой исходный код

1.0.0
Sunamu

Другой исходный код

Release 2.2.0
waymo open dataset

Другой исходный код

December 2023 Update
termwind

Другие категории

v2.3.0
wp functions

Другие категории

1.0.0

Связанные новости Все