يحتوي هذا المستودع على ملاحظات لدورة التعلم المعزز التي أعدها ديفيد سيلفر بالإضافة إلى تنفيذ الخوارزميات المختلفة التي تمت مناقشتها، سواء في Keras (مع واجهة TensorFlow الخلفية) أو إطار عمل الصالة الرياضية الخاص بـ OpenAI.
الأسبوع الأول: مقدمة إلى التعلم المعزز [شريحة] [فيديو]
الأسبوع الثاني: عمليات اتخاذ القرار في ماركوف [شريحة] [فيديو]
الأسبوع الثالث: التخطيط بالبرمجة الديناميكية [شريحة] [فيديو]
الأسبوع الرابع: التنبؤ بدون نماذج [شريحة] [فيديو]
الأسبوع الخامس: التحكم بدون نموذج [شريحة] [فيديو]
الأسبوع السادس: تقريب دالة القيمة [شريحة] [فيديو]
الأسبوع السابع: أساليب تدرج السياسات [شريحة] [فيديو]
الأسبوع الثامن: دمج التعلم والتخطيط [شريحة] [فيديو]
الأسبوع التاسع: الاستكشاف والاستغلال [شريحة] [فيديو]
الأسبوع العاشر: دراسة حالة: RL في الألعاب الكلاسيكية [شريحة] [فيديو]
تثبيتها باستخدام النقطة.
لا تتردد في إنشاء طلب سحب لإضافة تطبيقات الخوارزميات التي تمت مناقشتها في أطر عمل مختلفة مثل PyTorch وCaffe وما إلى ذلك أو تحسين التطبيقات الحالية. إذا كنت مبتدئا، يمكنك الرجوع إلى هذا للبدء.
إذا وجدت هذا مفيدًا، فيرجى التفكير في تمييز (★) الريبو حتى يتمكن من الوصول إلى جمهور أوسع.
هذا المشروع مرخص بموجب ترخيص MIT - راجع ملف الترخيص للحصول على التفاصيل.