تنزيل cartpole - تنزيل رمز مصدر cartpole

العربية

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

الصفحة الرئيسية>المتعلقة بالبرمجة>شفرة المصدر الأخرى

cartpole

شفرة المصدر الأخرى

1.0.0

تنزيل

Cartpole

حل التعلم التعزيز لعرضية Openai.

تحقق من المقالة المتوسطة المقابلة: Cartpole - مقدمة في التعلم التعزيز (DQN - Deep Q -Learning)

عن

يتم إرفاق القطب بواسطة مفصل غير مفعول بعربة ، تتحرك على طول مسار الاحتكاك. يتم التحكم في النظام عن طريق تطبيق قوة +1 أو -1 على العربة. يبدأ البندول في وضع مستقيم ، والهدف من ذلك هو منعه من السقوط. يتم توفير مكافأة +1 لكل مدة توقيت يبقى القطب في وضع مستقيم. تنتهي الحلقة عندما يكون القطب أكثر من 15 درجة من العمودي ، أو تحرك العربة أكثر من 2.4 وحدة من المركز. مصدر

DQN

القياسي DQN مع تجربة تجربة.

أجهزة التقويم:

جاما = 0.95
Learning_rate = 0.001
Memory_size = 1000000
batch_size = 20
exploration_max = 1.0
exploration_min = 0.01
exploration_decay = 0.995

هيكل النموذج:

طبقة كثيفة - الإدخال: 4 ، الإخراج: 24 ، التنشيط: relu
طبقة كثيفة - الإدخال 24 ، الإخراج: 24 ، التنشيط: relu
طبقة كثيفة - الإدخال 24 ، الإخراج: 2 ، التنشيط: خطي

وظيفة فقدان MSE
آدم المحسن

أداء

يعرّف CartPole-V0 "حل" على أنه الحصول على مكافأة متوسط 195.0 على 100 تجربة متتالية. مصدر

مثال GIF التجربة

مثال مخطط تجريبي

مخطط التجارب المحلول

مؤلف

جريج (غرزيغورز) سورما

مَلَفّ

جيثب

مدونة

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-03-02
الحجم 1.05MB
من Github

تطبيقات ذات صلة

waymo open dataset

2024-11-18
Sunamu

2024-12-14
chat.petals.dev

2024-11-30
SmartTube

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
Sunamu

شفرة المصدر الأخرى

Release 2.2.0
chat.petals.dev

شفرة المصدر الأخرى

1.0.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
termwind

فئات أخرى

v2.3.0
wp functions

فئات أخرى

1.0.0

أخبار ذات صلة الكل