مرحبًا بك في مستودع GitHub الخاص بنا! هذا المستودع مخصص لتنظيم الأوراق البحثية المهمة في مجال التعلم المعزز (RL) والتي تم قبولها في أهم المؤتمرات الأكاديمية مثل AAAI ، وIJCAI ، وNeurIPS ، وICML ، وICLR ، و ICRA ، و AAMAS والمزيد. نحن نوفر لك مركزًا مناسبًا للموارد لمساعدتك على البقاء على اطلاع بأحدث التطورات في التعلم المعزز والتعمق في اتجاهات البحث واستكشاف الخوارزميات والأساليب المتطورة.
تنسيق تخفيض السعر:
- **Paper Name**.
[[pdf](link)]
[[code](link)]
- Author 1, Author 2, and Author 3. *conference, year*.
الرجاء المساعدة في المساهمة بهذه القائمة عن طريق الاتصال بي أو إضافة طلب سحب.
لأية أسئلة، لا تتردد في الاتصال بي؟.
الضبط عبر الإنترنت للتعلم المعزز اللامركزي متعدد الوكلاء دون الاتصال بالإنترنت. [pdf]
مكافأة هجمات التسمم من خلال التعلم المعزز متعدد الوكلاء دون الاتصال بالإنترنت. [pdf]
النماذج كوكلاء: تحسين التنبؤات متعددة الخطوات للنماذج المحلية التفاعلية في التعلم المعزز متعدد الوكلاء القائم على النموذج. [pdf]
DeCOM: سياسة متحللة للتعلم المعزز التعاوني المقيد متعدد الوكلاء. [pdf]
التعلم المعزز الكمي متعدد العوامل. [pdf]
تعلم التعيين الائتماني الصريح للتعلم المعزز التعاوني متعدد الوكلاء عبر التدرج في سياسة الاستقطاب. [pdf]
التعلم من المسارات الجيدة في التعلم المعزز متعدد الوكلاء دون الاتصال بالإنترنت. [pdf]
DM²: التعلم المعزز اللامركزي متعدد الوكلاء عبر مطابقة التوزيع. [pdf]
التعلم بالإجماع من أجل التعلم المعزز التعاوني متعدد الوكلاء. [pdf]
هافين: التعلم المعزز التعاوني الهرمي متعدد الوكلاء باستخدام آلية التنسيق المزدوجة. [pdf]
DACOM: التواصل المدرك لتأخير التعلم من أجل التعلم المعزز متعدد الوكلاء. [pdf]
تجانس السياسات المعتمد للتعلم المعزز التعاوني متعدد الوكلاء. [pdf]
تعزيز التنقل الذكي والمستدام من خلال نظرية اللعبة والتعلم المعزز متعدد الوكلاء من خلال تطبيقات مشاركة الرحلات. [pdf]
التعامل مع التعلم المعزز الآمن والفعال متعدد الوكلاء من خلال الحماية الديناميكية (ملخص الطالب). [pdf]
التعلم المعزز متعدد الوكلاء لتحسين الشبكة التكيفية. [pdf]
معدلات التعلم التكيفية للتعلم المعزز متعدد الوكلاء. [pdf]
تحليل القيمة التكيفية مع حساب المساهمة الهامشية الجشعة للتعلم المعزز التعاوني متعدد الوكلاء. [pdf]
نهج متغير للتنسيق المتبادل القائم على المعلومات للتعلم المعزز متعدد الوكلاء. [pdf]
التعلم المعزز عبر الوكلاء المتعددين. [pdf]
EXPODE: استغلال تناقض السياسات من أجل الاستكشاف الفعال في التعلم المعزز متعدد الوكلاء. [pdf]
AC2C: اتصال ثنائي القفزات يتم التحكم فيه بشكل متكيف للتعلم المعزز متعدد الوكلاء. [pdf]
تعلم التواصل المنظم للتعلم المعزز متعدد الوكلاء. [pdf]
التواصل المتفرق القائم على النموذج في التعلم المعزز متعدد الوكلاء. [pdf]
التعلم المعزز التعاوني المتسلسل متعدد الوكلاء. [pdf]
التعلم المعزز غير المتزامن متعدد الوكلاء من أجل استكشاف تعاوني فعال للروبوتات المتعددة في الوقت الفعلي. [pdf]
التعلم من العديد من المستشارين المستقلين في التعلم المعزز متعدد الوكلاء. [pdf]
CraftEnv: بيئة بناء روبوتية جماعية مرنة للتعلم المعزز متعدد الوكلاء. [pdf]
التعلم المعزز متعدد العوامل مع طبقة الأمان للتحكم النشط في الجهد. [pdf]
التدريع الديناميكي القائم على النموذج لتعلم تعزيز آمن وفعال متعدد الوكلاء. [pdf]
نحو استكشاف متفائل قائم على المخاطر للتعلم المعزز التعاوني متعدد الوكلاء. [pdf]
تحسين السياسة الموجهة بالأمثلة المضادة في التعلم المعزز متعدد الوكلاء. [pdf]
تعدين المهام ذات الأولوية للتعلم المعزز التعاوني متعدد المهام. [pdf]
TransfQMix: محولات للاستفادة من بنية الرسم البياني لمشكلات التعلم المعززة متعددة العوامل. [pdf]
مشاركة المعلمات مع تقليم الشبكة من أجل التعلم المعزز العميق متعدد الوكلاء والقابل للتطوير. [pdf]
نحو شرح تسلسل الإجراءات في نماذج التعلم المعزز العميق متعددة الوكلاء. [pdf]
التعلم المعزز العميق متعدد الوكلاء لصنع أسواق متعددة عالية التردد. [pdf]
تعلم مكافآت الفروق الفردية في التعلم المعزز متعدد الوكلاء. [pdf]
التعلم المعزز متعدد الوكلاء. [pdf]
تعمل مشاركة الخبرات بشكل انتقائي على تحسين التعلم المعزز متعدد الوكلاء. [pdf]
خارج الشبكة MARL: مجموعات البيانات وخطوط الأساس للتعلم المعزز متعدد الوكلاء دون اتصال بالإنترنت. [pdf]
هجوم الصندوق الرمادي العدائي على التواصل في التعلم المعزز متعدد الوكلاء. [pdf]
التعلم المعزز متعدد الوكلاء للاستجابة السريعة للطلب على نطاق زمني للأحمال السكنية. [pdf]
تعلم إعادة التكوين الذاتي للروبوتات المعيارية ذات الشكل الحر من خلال التعلم المعزز بالإيثار متعدد الوكلاء. [pdf]
العثور على مسار متعدد الوكلاء من خلال التعلم المعزز باستخدام المكافأة المختلطة. [pdf]
حلول التعلم في الشبكات الاقتصادية الكبيرة باستخدام التعلم المعزز العميق متعدد الوكلاء. [pdf]
التعلم المعزز متعدد الوكلاء دون الاتصال بالإنترنت مع تحليل القيمة المقترنة. [pdf]
الكشف عن السببية من أجل التعلم المعزز الفعال متعدد الوكلاء. [pdf]
التكرار القائم على الانتباه للتعلم المعزز متعدد الوكلاء في ظل حالة عدم اليقين. [pdf]
تصميم شبكة النقل العادلة باستخدام التعلم المعزز متعدد الوكلاء. [pdf]
تعزيز التعلم في أنظمة متعددة الأهداف ومتعددة الوكلاء. [pdf]
تعزيز التنقل الذكي والمستدام من خلال نظرية الألعاب والتعلم المعزز متعدد الوكلاء. [pdf]
الميسر النشط ذو الدولة: التنسيق وعدم التجانس البيئي في التعلم المعزز التعاوني متعدد الوكلاء. [pdf]
MACTA: نهج التعلم المعزز متعدد الوكلاء لهجمات توقيت ذاكرة التخزين المؤقت واكتشافها. [pdf]
MAESTRO: تصميم بيئة مفتوحة للتعلم المعزز متعدد الوكلاء. [pdf]
توسيع نطاق القوانين لنموذج التعلم المعزز متعدد الوكلاء. [pdf]
RPM: سياسات متعددة الوكلاء قابلة للتعميم للتعلم المعزز متعدد الوكلاء. [pdf]
اكتشاف المحادثات الرخيصة واستخدامها في التعلم المعزز متعدد الوكلاء. [pdf]
مسائل الطلب: تحسين سياسة كل وكيل على حدة. [pdf]
الأساليب الناقدة للممثل والشبكة الافتراضية المدركة للسياق للتعلم المعزز التعاوني متعدد الوكلاء. [pdf]
مقسم الكيان مع أسس اللغة في التعلم المعزز متعدد الوكلاء. [pdf]
أوراكل وأتباع: توازنات Stackelberg في التعلم المعزز العميق متعدد الوكلاء. [pdf]
إطار تنظيم الإنتروبيا التكيفي للتعلم المعزز متعدد العوامل. [pdf]
العرق: تحسين التعلم المعزز متعدد الوكلاء من خلال عدم تناسق التمثيل والتطور التعاوني. [pdf]
الوكلاء الكسالى: منظور جديد لحل مشكلة المكافأة المتفرقة في التعلم المعزز متعدد الوكلاء. [pdf]
التعلم المعزز التعاوني متعدد الوكلاء: الاتصال غير المتزامن وتقريب الوظائف الخطية. [pdf]
التعلم المعزز متعدد العوامل والقابل للتطوير من خلال تجميع المعلومات الذكي. [pdf]
التكرار القائم على الاهتمام للتعلم المعزز متعدد العوامل في ظل إمكانية الملاحظة الجزئية العشوائية. [pdf]
الاهتمام التكميلي للتعلم المعزز متعدد الوكلاء. [pdf]
يحقق التحسين المحلي التحسين العالمي في التعلم المعزز متعدد الوكلاء. [pdf]
مطاردة متعددة الأهداف بواسطة سرب لامركزي غير متجانس من الطائرات بدون طيار باستخدام التعلم المعزز العميق متعدد الوكلاء. [pdf]
مشورة عملية قابلة للتفسير للتعلم المعزز متعدد الوكلاء. [pdf]
التعلم المعزز الآمن متعدد الوكلاء والمدرك للمكان والزمان للمركبات المستقلة المتصلة في السيناريوهات الصعبة. [pdf]
طريقة التعلم المعززة متعددة الوكلاء المقيدة بالصراع لتخطيط مسار مواقف السيارات. [pdf]
التعلم المعزز متعدد الوكلاء القابل للتفسير للاستعلامات الزمنية. [pdf]
اتصالات قابلة للتطوير للتعلم المعزز متعدد الوكلاء عبر آلية البريد الإلكتروني القائمة على المحولات. [pdf]
تعلم إرسال التعزيزات: تنسيق إرسال دوريات الشرطة الديناميكية متعددة الوكلاء وإعادة جدولتها من خلال تعلم التعزيز. [pdf]
الكشف اللامركزي عن الحالات الشاذة في التعلم المعزز التعاوني متعدد الوكلاء. [pdf]
GPLight: التعلم المعزز المجمع متعدد الوكلاء للتحكم في إشارات المرور على نطاق واسع. [pdf]
رسم بياني عميق للاتصالات الهرمية في التعلم المعزز متعدد الوكلاء. [pdf]
نمذجة الخيارات الأخلاقية في المعضلات الاجتماعية من خلال التعلم المعزز متعدد الوكلاء. [pdf]
تحفيز توازن Stackelberg من خلال اتخاذ القرارات المتسلسلة المكانية والزمانية في التعلم المعزز متعدد الوكلاء. [pdf]
تجزئة الخلايا العصبية ذاتية الإشراف مع التعلم المعزز متعدد العوامل. [pdf]
MA2CL: التعلم المقارن اليقظ المقنع للتعلم المعزز متعدد الوكلاء. [pdf]
التعلم المعزز التنافسي التعاوني متعدد الوكلاء من أجل التعلم الموحد القائم على المزاد. [pdf]
DPMAC: الاتصالات الخاصة التفاضلية للتعلم المعزز التعاوني متعدد الوكلاء. [pdf]
إذا كنت تستخدم صندوق الأدوات هذا في بحثك، فيرجى ذكر هذا المشروع.
@misc{YalunAwesome,
author = {Yalun Wu},
title = {Reinforcement-Learning-Papers},
year = {2023},
howpublished = {url{https://github.com/Allenpandas/Reinforcement-Learning-Papers}}
}