اتخاذ قرار رائع / التعلم المعزز
هذه قائمة ورقية بأحدث المواد البحثية المتعلقة باتخاذ القرار وتخطيط الحركة. أتمنى أن يكون مفيدًا لكل من الأوساط الأكاديمية والصناعة. (لا يزال التحديث)
المشرفون : جياتشن لي (جامعة كاليفورنيا، بيركلي)
البريد الإلكتروني : [email protected]
لا تتردد في سحب الطلب لإضافة موارد جديدة أو إرسال رسائل بريد إلكتروني إلينا لطرح الأسئلة والمناقشة والتعاون.
ملحوظة : إليك أيضًا مجموعة من المواد البحثية للتنبؤ بمسار التفاعل (السلوك).
آر إل وإيرل وغيل
- أقصى قدر من الإنتروبيا تعلم التعزيز العكسي العميق، 2015، [ورقة]
- التعلم الموجه للتكلفة: التحكم الأمثل العكسي العميق عبر تحسين السياسات، ICML 2016، [ورقة]
- التعلم بالتقليد التنافسي التوليدي، NIPS 2016، [ورقة]
- العلاقة بين شبكات الخصومة التوليدية، والتعلم المعزز العكسي، والنماذج المعتمدة على الطاقة، NIPS 2016، [ورقة]
- InfoGAIL: التعلم التقليد القابل للتفسير من العروض المرئية، NIPS 2017، [ورقة] [كود]
- التعلم بالتقليد الذاتي، ICML 2018، [ورقة] [كود]
- التعلم المعزز الهرمي الموفر للبيانات، NIPS 2018، [ورقة]
- تعلم المكافآت القوية من خلال التعلم التعزيزي العكسي، ICLR 2018، [ورقة]
- التعلم بتقليد الخصومة التوليدية المتعددة الوكلاء، ICLR 2018، [ورقة]
- تعلم التعزيز العكسي للعدالة المتعددة الوكلاء، ICML 2019، [ورقة]
القيادة الذاتية
- دراسة استقصائية لتطبيقات التعلم العميق للتحكم في المركبات المستقلة، معاملات IEEE على ITS 2019، [ورقة]
- تقليد سلوك السائق باستخدام شبكات الخصومة التوليدية، الرابع 2017، [ورقة] [كود]
- تعلم التقليد متعدد الوكلاء لمحاكاة القيادة، IROS 2018، [ورقة] [كود]
- محاكاة الخصائص الناشئة لسلوك القيادة البشرية باستخدام التعلم المعزز للتقليد متعدد الوكلاء، ICRA 2019، [ورقة] [كود]
- التعلم من المظاهرات في البرية، ICRA 2018، [ورقة]
- القيادة الذاتية المتصلة متعددة العوامل باستخدام التعلم المعزز العميق، NeurIPS 2019، [ورقة] [كود]
- التعلم المعزز العميق الخالي من النماذج للقيادة الذاتية في المناطق الحضرية، ITSC 2019، [ورقة]
- القيادة الشاملة من خلال التعلم بالتقليد المشروط، ICRA 2018، [ورقة]
- CIRL: التعلم المعزز المقلد الذي يمكن التحكم فيه من أجل القيادة الذاتية القائمة على الرؤية، ECCV 2018، [ورقة] [رمز]
- نهج قائم على التعلم المعزز لمناورات تغيير المسار الآلي، الرابع 2018، [ورقة]
- التعلم التعزيزي العكسي لاتخاذ القرار في القيادة الذاتية، ICRA 2020، [ورقة]
- التعلم المعزز الهرمي العميق للقيادة الذاتية بسلوكيات متميزة، الرابع 2018، [ورقة]
- بنية هرمية لاتخاذ القرار المتسلسل في القيادة الذاتية باستخدام التعلم المعزز العميق، ICML 2019، [ورقة]
- مخطط الحركة العصبية القابل للتفسير الشامل، CVPR 2019، [ورقة]
- السلوك القابل للتعلم بشكل مشترك وتخطيط المسار للمركبات ذاتية القيادة، IROS 2019، [ورقة]
- المدخلات الديناميكية للتعلم المعزز العميق في القيادة الذاتية، IROS 2019، [ورقة]
- تعلم التنقل في مدن بدون خريطة، NIPS 2018، [ورقة]
- اختبار شامل وقابل للتطوير للمركبات ذاتية القيادة من خلال محاكاة الأحداث النادرة، NIPS 2018، [ورقة]
- نحو تعلم المفاوضات المتعددة الوكلاء من خلال اللعب الذاتي، ICCV 2019، [ورقة]
المحاكاة ومجموعة البيانات
- كارلا: محاكي القيادة الحضرية المفتوحة، [ورقة]
- توركس: محاكاة سيارات السباق المفتوحة، [ورقة]
- Comma.ai: تعلم محاكاة القيادة، [ورقة]
- NGSIM: مجموعة بيانات الطريق السريع الأمريكي 101، [مستندات]