Reinforcement Learning Papers تحميل - Reinforcement Learning Papers تحميل كود المصدر

تعزيز التعلم!

مرحبًا بك في مستودع GitHub الخاص بنا! هذا المستودع مخصص لتنظيم الأوراق البحثية المهمة في مجال التعلم المعزز (RL) والتي تم قبولها في أهم المؤتمرات الأكاديمية مثل AAAI ، وIJCAI ، وNeurIPS ، وICML ، وICLR ، و ICRA ، و AAMAS والمزيد. نحن نوفر لك مركزًا مناسبًا للموارد لمساعدتك على البقاء على اطلاع بأحدث التطورات في التعلم المعزز والتعمق في اتجاهات البحث واستكشاف الخوارزميات والأساليب المتطورة.

أخبار

2023/11/12: أضفت المستودع ذي الصلة.
2023/8/19: أضفت الأوراق المقبولة في AAMAS'23، IJCAI'23، ICRA'23، ICML'23،ICLR'23، AAAI'23، NeurIPS'22 وما إلى ذلك
2023/1/6: لقد قمت بإنشاء المستودع.

المساهمة

نحن بحاجة إليك!

تنسيق تخفيض السعر:

 - **Paper Name**.
  [[pdf](link)]
  [[code](link)]
  - Author 1, Author 2, and Author 3. *conference, year*.

الرجاء المساعدة في المساهمة بهذه القائمة عن طريق الاتصال بي أو إضافة طلب سحب.

لأية أسئلة، لا تتردد في الاتصال بي؟.

جدول المحتويات

1_التعلم المعزز متعدد الوكلاء (MARL)
2_التعلم المعزز ميتا (Meta RL)
3_التعلم المعزز الهرمي (HRL)
4_التعلم المعزز متعدد المهام (RL متعدد المهام)
5_التعلم المعزز دون اتصال بالإنترنت (RL دون الاتصال بالإنترنت)
6_التعلم المعزز العكسي (IRL)
7_ تعزيز التعلم بنماذج لغوية كبيرة

1_التعلم المعزز متعدد الوكلاء

الضبط عبر الإنترنت للتعلم المعزز اللامركزي متعدد الوكلاء دون الاتصال بالإنترنت. [pdf]
- جيتشوان جيانغ، زونغتشينغ لو. AAAI 2023 .
مكافأة هجمات التسمم من خلال التعلم المعزز متعدد الوكلاء دون الاتصال بالإنترنت. [pdf]
- يونغ وو، جيريمي مكماهان، شياو جين تشو، كيومين شيه. AAAI 2023 .
النماذج كوكلاء: تحسين التنبؤات متعددة الخطوات للنماذج المحلية التفاعلية في التعلم المعزز متعدد الوكلاء القائم على النموذج. [pdf]
- زيفان وو، تشاو يو، تشين تشين، جياني هاو، هانكز هانكوي تشو. AAAI 2023 .
DeCOM: سياسة متحللة للتعلم المعزز التعاوني المقيد متعدد الوكلاء. [pdf]
- تشاوشينغ يانغ، هايمينغ جين، رونغ دينغ، هاوي يو، غويون فان، شينبينغ وانغ، تشنغهو تشو. AAAI 2023 .
التعلم المعزز الكمي متعدد العوامل. [pdf]
- وون جون يون، جيهونج بارك، جونجهيون كيم. AAAI 2023 .
تعلم التعيين الائتماني الصريح للتعلم المعزز التعاوني متعدد الوكلاء عبر التدرج في سياسة الاستقطاب. [pdf]
- ووبينغ تشين، وينبين لي، شياو ليو، شانغدونغ يانغ، يانغ غاو. AAAI 2023 .
التعلم من المسارات الجيدة في التعلم المعزز متعدد الوكلاء دون الاتصال بالإنترنت. [pdf]
- تشي تيان، كون كوانغ، فوروي ليو، باوكسيانغ وانغ. AAAI 2023 .
DM²: التعلم المعزز اللامركزي متعدد الوكلاء عبر مطابقة التوزيع. [pdf]
- كارولين وانغ، إيشان دوروغكار، إيلاد ليبمان، بيتر ستون. AAAI 2023 .
التعلم بالإجماع من أجل التعلم المعزز التعاوني متعدد الوكلاء. [pdf]
- Zhiwei Xu، Bin Zhang، Dapeng Li، Zeren Zhang، Guangchong Zhou، Hao Chen، Guoliang Fan. AAAI 2023 .
هافين: التعلم المعزز التعاوني الهرمي متعدد الوكلاء باستخدام آلية التنسيق المزدوجة. [pdf]
- Zhiwei Xu، Yunpeng Bai، Bin Zhang، Dapeng Li، Guoliang Fan. AAAI 2023 .
DACOM: التواصل المدرك لتأخير التعلم من أجل التعلم المعزز متعدد الوكلاء. [pdf]
- تينجتينج يوان، هوي مينج تشونج، جي يوان، شياو مينج فو. AAAI 2023 .
تجانس السياسات المعتمد للتعلم المعزز التعاوني متعدد الوكلاء. [pdf]
- رونغوي مو، وينجي روان، لياندرو سوريانو ماركولينو، جاوجي جين، تشيانغ ني. AAAI 2023 .
تعزيز التنقل الذكي والمستدام من خلال نظرية اللعبة والتعلم المعزز متعدد الوكلاء من خلال تطبيقات مشاركة الرحلات. [pdf]
- لوسيا سيبولينا كون. AAAI 2023 .
التعامل مع التعلم المعزز الآمن والفعال متعدد الوكلاء من خلال الحماية الديناميكية (ملخص الطالب). [pdf]
- وينلي شياو، يوي ليو، جون إم دولان. AAAI 2023 .
التعلم المعزز متعدد الوكلاء لتحسين الشبكة التكيفية. [pdf]
- جياتشن يانغ، كيتان ميتال، طارق دزانيتش، سقراطيس بيتريدس، بريندان كيث، بريندن ك. بيترسن، دانييل إم فيسول، روبرت دبليو أندرسون. أماس 2023 .
معدلات التعلم التكيفية للتعلم المعزز متعدد الوكلاء. [pdf]
- جيتشوان جيانغ، زونغتشينغ لو. أماس 2023 .
تحليل القيمة التكيفية مع حساب المساهمة الهامشية الجشعة للتعلم المعزز التعاوني متعدد الوكلاء. [pdf]
- شانكي ليو، يوجينج هو، رونزي وو، دونغ شينغ، يو شيونغ، تشانغجي فان، كون كوانغ، يونغ ليو. أماس 2023 .
نهج متغير للتنسيق المتبادل القائم على المعلومات للتعلم المعزز متعدد الوكلاء. [pdf]
- ووجون كيم، ويونج جونج، ميونج سيك تشو، يونج تشول سونج. أماس 2023 .
التعلم المعزز عبر الوكلاء المتعددين. [pdf]
- ديمتري إيفانوف، إيليا زيزمان، كيريل تشيرنيشيف. أماس 2023 .
EXPODE: استغلال تناقض السياسات من أجل الاستكشاف الفعال في التعلم المعزز متعدد الوكلاء. [pdf]
- يوكونغ تشانغ، تشاو يو. أماس 2023 .
AC2C: اتصال ثنائي القفزات يتم التحكم فيه بشكل متكيف للتعلم المعزز متعدد الوكلاء. [pdf]
- زويفنغ وانغ، شينران لي، جياوي شاو، جون تشانغ. أماس 2023 .
تعلم التواصل المنظم للتعلم المعزز متعدد الوكلاء. [pdf]
- جونجي شنغ، شيانغفنغ وانغ، بو جين، وينهاو لي، جون وانغ، جونتشي يان، تسونغ هوي تشانغ، هونغ يوان تشا. أماس 2023 .
التواصل المتفرق القائم على النموذج في التعلم المعزز متعدد الوكلاء. [pdf]
- شواي هان، مهدي دستاني، شيهان وانغ. أماس 2023 .
التعلم المعزز التعاوني المتسلسل متعدد الوكلاء. [pdf]
- ييفان زانغ، جينمين هي، كاي لي، هاوبو فو، تشيانغ فو، جونليانغ شينغ. أماس 2023 .
التعلم المعزز غير المتزامن متعدد الوكلاء من أجل استكشاف تعاوني فعال للروبوتات المتعددة في الوقت الفعلي. [pdf]
- تشاو يو، شيني يانغ، جياكسوان جاو، جيايو تشين، يونفي لي، جيجيا ليو، يونفي شيانغ، رويشين هوانغ، هواتشونغ يانغ، يي وو، يو وانغ. أماس 2023 .
التعلم من العديد من المستشارين المستقلين في التعلم المعزز متعدد الوكلاء. [pdf]
- سريرام جاناباثي سوبرامانيان، ماثيو إي. تايلور، كيت لارسون، مارك كراولي. أماس 2023 .
CraftEnv: بيئة بناء روبوتية جماعية مرنة للتعلم المعزز متعدد الوكلاء. [pdf]
- روي تشاو، شو ليو، ييزينج تشانغ، مينغهاو لي، تشينج تشو، شواي لي، لي هان. أماس 2023 .
التعلم المعزز متعدد العوامل مع طبقة الأمان للتحكم النشط في الجهد. [pdf]
- يوفينغ شي، مينغشياو فنغ، مينروي وانغ، وينغانغ تشو، هوكيانغ لي. أماس 2023 .
التدريع الديناميكي القائم على النموذج لتعلم تعزيز آمن وفعال متعدد الوكلاء. [pdf]
- وينلي شياو، يوي ليو، جون إم دولان. أماس 2023 .
نحو استكشاف متفائل قائم على المخاطر للتعلم المعزز التعاوني متعدد الوكلاء. [pdf]
- جيهوان أوه، جونكي كيم، مينشان جيونج، سي يونج يون. أماس 2023 .
تحسين السياسة الموجهة بالأمثلة المضادة في التعلم المعزز متعدد الوكلاء. [pdf]
- بريتي جانجوبادياي، بالاب داسغوبتا، سومياجيت داي. أماس 2023 .
تعدين المهام ذات الأولوية للتعلم المعزز التعاوني متعدد المهام. [pdf]
- يانغ يو، تشيو يين، جونج تشانغ، كايكي هوانغ. أماس 2023 .
TransfQMix: محولات للاستفادة من بنية الرسم البياني لمشكلات التعلم المعززة متعددة العوامل. [pdf]
- ماتيو جاليسي، ماريو مارتن، إيفان ماسميتيا. أماس 2023 .
مشاركة المعلمات مع تقليم الشبكة من أجل التعلم المعزز العميق متعدد الوكلاء والقابل للتطوير. [pdf]
- ووجون كيم، يونج تشول سونج. أماس 2023 .
نحو شرح تسلسل الإجراءات في نماذج التعلم المعزز العميق متعددة الوكلاء. [pdf]
- خاينغ فيو واي، مينغهونغ جينج، بودهيتاما سوباغدجا، شوبهام باتريا، آه هوي تان. أماس 2023 .
التعلم المعزز العميق متعدد الوكلاء لصنع أسواق متعددة عالية التردد. [pdf]
- بانكاج كومار. أماس 2023 .
تعلم مكافآت الفروق الفردية في التعلم المعزز متعدد الوكلاء. [pdf]
- تشن يانغ، جوانجكاي يانج، جونجي تشانغ. أماس 2023 .
التعلم المعزز متعدد الوكلاء. [pdf]
- وي تشيو، ويكسون وانغ، روندونغ وانغ، بو آن، يوجينج هو، سفيتلانا أوبرازتسوفا، زينوفي رابينوفيتش، جياني هاو، ينجفينج تشين، تشانغجي فان. أماس 2023 .
تعمل مشاركة الخبرات بشكل انتقائي على تحسين التعلم المعزز متعدد الوكلاء. [pdf]
- ماتياس غيرستجراسر، توم دانينو، سارة كيرين. أماس 2023 .
خارج الشبكة MARL: مجموعات البيانات وخطوط الأساس للتعلم المعزز متعدد الوكلاء دون اتصال بالإنترنت. [pdf]
- كلود فورمانك، أسد جيوا، جوناثان ب.شوك، أرنو بريتوريوس. أماس 2023 .
هجوم الصندوق الرمادي العدائي على التواصل في التعلم المعزز متعدد الوكلاء. [pdf]
- شياو ما، وو جون لي. أماس 2023 .
التعلم المعزز متعدد الوكلاء للاستجابة السريعة للطلب على نطاق زمني للأحمال السكنية. [pdf]
- فنسنت ماي، فيليب ميسونوف، تيانيو تشانغ، هادي نيكوي، ليام بول، أنطوان ليساج لاندري. أماس 2023 .
تعلم إعادة التكوين الذاتي للروبوتات المعيارية ذات الشكل الحر من خلال التعلم المعزز بالإيثار متعدد الوكلاء. [pdf]
- لي وو، بن قوه، تشيويون تشانغ، تشو صن، جيي تشانغ، زيوين يو. أماس 2023 .
العثور على مسار متعدد الوكلاء من خلال التعلم المعزز باستخدام المكافأة المختلطة. [pdf]
- تشنغ تشاو، ليانشينغ تشوانغ، هاونان ليو، ييهونغ هوانغ، جيان يانغ. أماس 2023 .
حلول التعلم في الشبكات الاقتصادية الكبيرة باستخدام التعلم المعزز العميق متعدد الوكلاء. [pdf]
- مايكل كاري، ألكسندر تروت، سوهام فيد، يو باي، ستيفان زينج. أماس 2023 .
التعلم المعزز متعدد الوكلاء دون الاتصال بالإنترنت مع تحليل القيمة المقترنة. [pdf]
- شيانغسن وانغ، شيانيوان زان. أماس 2023 .
الكشف عن السببية من أجل التعلم المعزز الفعال متعدد الوكلاء. [pdf]
- رافائيل بينا، فارونا دي سيلفا، كورنتين أرتود. أماس 2023 .
التكرار القائم على الانتباه للتعلم المعزز متعدد الوكلاء في ظل حالة عدم اليقين. [pdf]
- تومي فان، فابيان ريتز، جوناس نوسلين، مايكل كول، توماس جابور، كلوديا لينهوف بوبين. أماس 2023 .
تصميم شبكة النقل العادلة باستخدام التعلم المعزز متعدد الوكلاء. [pdf]
- ديميتريس ميخائيليديس. أماس 2023 .
تعزيز التعلم في أنظمة متعددة الأهداف ومتعددة الوكلاء. [pdf]
- ويليم روبكي. أماس 2023 .
تعزيز التنقل الذكي والمستدام من خلال نظرية الألعاب والتعلم المعزز متعدد الوكلاء. [pdf]
- لوسيا سيبولينا كون. أماس 2023 .
الميسر النشط ذو الدولة: التنسيق وعدم التجانس البيئي في التعلم المعزز التعاوني متعدد الوكلاء. [pdf]
- ديانبو ليو، فيدانت شاه، أسامة بوسيف، كريستيان ميو، أنيرود جويال، تيانمين شو، مايكل كيرتس موزير، نيكولاس هيس، يوشوا بنجيو. ICLR 2023 .
MACTA: نهج التعلم المعزز متعدد الوكلاء لهجمات توقيت ذاكرة التخزين المؤقت واكتشافها. [pdf]
- جياكسون كوي، شياو مينج يانج، مولونج لوه، جيونباي لي، بيتر ستون، هسين هسين إس لي، بنيامين لي، جي إدوارد سوه، وينجي شيونغ، يواندونغ تيان. ICLR 2023 .
MAESTRO: تصميم بيئة مفتوحة للتعلم المعزز متعدد الوكلاء. [pdf]
- ميكايل سامفيليان، أكبر خان، مايكل دينيس، مينكي جيانغ، جاك باركر هولدر، جاكوب نيكولاوس فورستر، روبرتا رايليانو، تيم روكتاشيل. ICLR 2023 .
توسيع نطاق القوانين لنموذج التعلم المعزز متعدد الوكلاء. [pdf]
- أورين نيومان، كلوديوس جروس. ICLR 2023 .
RPM: سياسات متعددة الوكلاء قابلة للتعميم للتعلم المعزز متعدد الوكلاء. [pdf]
- وي تشيو، شياو ما، بو آن، سفيتلانا أوبرازتسوفا، شويتشنغ يان، تشونغوين شو. ICLR 2023 .
اكتشاف المحادثات الرخيصة واستخدامها في التعلم المعزز متعدد الوكلاء. [pdf]
- يات لونج لو، كريستيان شرودر دي ويت، صامويل سوكوتا، جاكوب نيكولاوس فورستر، شيمون وايتسون. ICLR 2023 .
مسائل الطلب: تحسين سياسة كل وكيل على حدة. [pdf]
- Xihuai Wang، Zheng Tian، Ziyu Wan، Ying Wen، Jun Wang، Weinan Zhang. ICLR 2023 .
الأساليب الناقدة للممثل والشبكة الافتراضية المدركة للسياق للتعلم المعزز التعاوني متعدد الوكلاء. [pdf]
- دينغيانغ تشن، تشي تشانغ. آي سي إم إل 2023 .
مقسم الكيان مع أسس اللغة في التعلم المعزز متعدد الوكلاء. [pdf]
- زيلو دينغ، وانبينج تشانغ، جونبينج يو، شيانغجون وانغ، تيجون هوانغ، زونغتشينغ لو. آي سي إم إل 2023 .
أوراكل وأتباع: توازنات Stackelberg في التعلم المعزز العميق متعدد الوكلاء. [pdf]
- ماتياس غيرستجراسر، ديفيد سي. باركس. آي سي إم إل 2023 .
إطار تنظيم الإنتروبيا التكيفي للتعلم المعزز متعدد العوامل. [pdf]
- ووجون كيم، يونج تشول سونج. آي سي إم إل 2023 .
العرق: تحسين التعلم المعزز متعدد الوكلاء من خلال عدم تناسق التمثيل والتطور التعاوني. [pdf]
- بينجي لي، جياني هاو، هونغياو تانغ، يان تشنغ، شيان فو. آي سي إم إل 2023 .
الوكلاء الكسالى: منظور جديد لحل مشكلة المكافأة المتفرقة في التعلم المعزز متعدد الوكلاء. [pdf]
- Boyin Liu، Zhiqiang Pu، Yi Pan، Jianqiang Yi، Yanyan Liang، Du Zhang. آي سي إم إل 2023 .
التعلم المعزز التعاوني متعدد الوكلاء: الاتصال غير المتزامن وتقريب الوظائف الخطية. [pdf]
- ييفي مين، جيافان هي، تيانهاو وانغ، كوان تشيوان جو. آي سي إم إل 2023 .
التعلم المعزز متعدد العوامل والقابل للتطوير من خلال تجميع المعلومات الذكي. [pdf]
- سيدهارث ناياك، كينيث تشوي، وينكي دينغ، سيدني دولان، كارثيك جوبالاكريشنان، همسة بالاكريشنان. آي سي إم إل 2023 .
التكرار القائم على الاهتمام للتعلم المعزز متعدد العوامل في ظل إمكانية الملاحظة الجزئية العشوائية. [pdf]
- تومي فان، فابيان ريتز، فيليب ألتمان، ماكسيميليان زورن، جوناس نوسلين، مايكل كول، توماس جابور، كلوديا لينهوف بوبين. آي سي إم إل 2023 .
الاهتمام التكميلي للتعلم المعزز متعدد الوكلاء. [pdf]
- جيانزون شاو، هونغتشانغ تشانغ، يون تشو، تشانغ ليو، شونشنغ هي، يوهانغ جيانغ، شيانغيانغ جي. آي سي إم إل 2023 .
يحقق التحسين المحلي التحسين العالمي في التعلم المعزز متعدد الوكلاء. [pdf]
- يولاي تشاو، زوران يانغ، زوران وانغ، جيسون دي لي. آي سي إم إل 2023 .
مطاردة متعددة الأهداف بواسطة سرب لامركزي غير متجانس من الطائرات بدون طيار باستخدام التعلم المعزز العميق متعدد الوكلاء. [pdf]
- مريم كوزيرغار، يونغبين سونغ، مليكة ميغاجاني، رولاند بوفانيس. ايكرا 2023 .
مشورة عملية قابلة للتفسير للتعلم المعزز متعدد الوكلاء. [pdf]
- يو جو، جوزيف كامبل، سيمون ستيبوتيس، رويو لي، دانا هيوز، فاي فانغ، كاتيا بي سيكارا. ايكرا 2023 .
التعلم المعزز الآمن متعدد الوكلاء والمدرك للمكان والزمان للمركبات المستقلة المتصلة في السيناريوهات الصعبة. [pdf]
- تشيلي تشانغ، سونغيانغ هان، جيانغوي وانغ، فاي مياو. ايكرا 2023 .
طريقة التعلم المعززة متعددة الوكلاء المقيدة بالصراع لتخطيط مسار مواقف السيارات. [pdf]
- سيوان تشين، ميلينغ وانغ، يي يانغ، وينجي سونغ. ايكرا 2023 .
التعلم المعزز متعدد الوكلاء القابل للتفسير للاستعلامات الزمنية. [pdf]
- كايلا بوجيس، ساريت كراوس، لو فنغ. إيجيكاي 2023 .
اتصالات قابلة للتطوير للتعلم المعزز متعدد الوكلاء عبر آلية البريد الإلكتروني القائمة على المحولات. [pdf]
- شودونج قوه، دامينج شي، وينهوي فان. إيجيكاي 2023 .
تعلم إرسال التعزيزات: تنسيق إرسال دوريات الشرطة الديناميكية متعددة الوكلاء وإعادة جدولتها من خلال تعلم التعزيز. [pdf]
- والدي جو، هونج تشين لاو. إيجيكاي 2023 .
الكشف اللامركزي عن الحالات الشاذة في التعلم المعزز التعاوني متعدد الوكلاء. [pdf]
- كياراش كازاري، عز الدين شيرين، جيورجي دان. إيجيكاي 2023 .
GPLight: التعلم المعزز المجمع متعدد الوكلاء للتحكم في إشارات المرور على نطاق واسع. [pdf]
- ييلين ليو، قوييانغ لو، تشيوان يوان، جينجلين لي، لي جين، بو تشن، روي بان. إيجيكاي 2023 .
رسم بياني عميق للاتصالات الهرمية في التعلم المعزز متعدد الوكلاء. [pdf]
- Zeyang Liu، Lipeng Wan، Xue Sui، Zhuoran Chen، Kewu Sun، Xuguang Lan. إيجيكاي 2023 .
نمذجة الخيارات الأخلاقية في المعضلات الاجتماعية من خلال التعلم المعزز متعدد الوكلاء. [pdf]
- إليزافيتا تينانت، ستيفن هايلز، ميركو موسوليسي. إيجيكاي 2023 .
تحفيز توازن Stackelberg من خلال اتخاذ القرارات المتسلسلة المكانية والزمانية في التعلم المعزز متعدد الوكلاء. [pdf]
- بن تشانغ، ليجوان لي، زيوي شو، دابينج لي، جوليانج فان. إيجيكاي 2023 .
تجزئة الخلايا العصبية ذاتية الإشراف مع التعلم المعزز متعدد العوامل. [pdf]
- يندا تشين، وي هوانغ، شينغلونغ تشو، تشي تشين، زيوي شيونغ. إيجيكاي 2023 .
MA2CL: التعلم المقارن اليقظ المقنع للتعلم المعزز متعدد الوكلاء. [pdf]
- هاولين سونغ، مينغشياو فنغ، وينغانغ تشو، هوكيانغ لي. إيجيكاي 2023 .
التعلم المعزز التنافسي التعاوني متعدد الوكلاء من أجل التعلم الموحد القائم على المزاد. [pdf]
- شياو لي تانغ، هان يو. إيجيكاي 2023 .
DPMAC: الاتصالات الخاصة التفاضلية للتعلم المعزز التعاوني متعدد الوكلاء. [pdf]
- كانزي تشاو، يانجي زي، جينغ دونغ، باوكسيانغ وانغ، شواي لي. إيجيكاي 2023 .

2_التعلم التعزيزي الفوقي

التعلم التعزيزي بناءً على تعلم تمثيل المهام الخاضع للإشراف الذاتي. [pdf]
- مينغيانغ وانغ، تشنشان بينج، شيانغتونغ ياو، شواي وانغ، كاي هوانغ، هانغ سو، تشينجوانغ يانغ، ألويس نول. AAAI 2023 .
التعلم المعزز الكمي متعدد العوامل. [pdf]
- وون جون يون، جيهونج بارك، جونجهيون كيم. AAAI 2023 .
إطار CMDP ضمن إطار العمل عبر الإنترنت للتعلم المعزز الآمن. [pdf]
- فانشاج خطار، يوهاو دينغ، بيلجيهان سيل، جواد لافاي، مينغ جين. ICLR 2023 .
التعلم التعزيزي التوزيعي التدرجي. [pdf]
- هايان يين، شويتشنغ يان، تشونغ ون شو. ICLR 2023 .
تعلم اللغة المجسدة البسيطة كمنتج ثانوي للتعلم المعزز. [pdf]
- إيفان زيران ليو، ساهانا سوري، تونغ مو، ألان تشو، تشيلسي فين. آي سي إم إل 2023 .
التعلم التعزيزي دون الاتصال بالإنترنت من خلال التكيف عبر الإنترنت أثناء التوزيع. [pdf]
- جيانهاو وانغ، جين تشانغ، هاوزهي جيانغ، جونيو تشانغ، ليوي وانغ، تشونغجي تشانغ. آي سي إم إل 2023 .
التعلم المعزز من خلال تعليمات اللغة. [pdf]
- زينشان بينج، ألكسندر دبليو كوخ، شيانغتونغ ياو، كاي هوانغ، ألويس نول. ايكرا 2023 .
نقل سياسة اللقطة الصفرية مع تمثيل المهام المفككة للتعلم المعزز. [pdf]
- تشنغ وو، ييتشين شيه، وينزهاو ليان، تشانغهاو وانغ، يانجيانغ قوه، جيانيو تشين، ستيفان شال، ماسايوشي توميزوكا. ايكرا 2023 .

3_التعلم المعزز الهرمي

هافين: التعلم المعزز التعاوني الهرمي متعدد الوكلاء باستخدام آلية التنسيق المزدوجة. [pdf]
- Zhiwei Xu، Yunpeng Bai، Bin Zhang، Dapeng Li، Guoliang Fan. AAAI 2023 .
التعلم التعزيزي العميق متوسط المجال للأنظمة متعددة الوكلاء واسعة النطاق. [pdf]
- تشاو يو. AAAI 2023 .
التعلم المعزز الهرمي من خلال تحسين الأهداف الفرعية التعاونية بين الإنسان والذكاء الاصطناعي. [pdf]
- هاوزهي ما، ثانه فينه فو، تزي يون ليونج. أماس 2023 .
التعلم المعزز الهرمي للعمل الجماعي المخصص. [pdf]
- ستيفان أروكا أوليت، ميغيل أروكا أوليت، أوباسانا بيسواس، كاثرينا كان، أليساندرو رونكون. أماس 2023 .
مطابقة الخيارات للمهام باستخدام التعلم المعزز الهرمي المفهرس بالخيارات. [pdf]
- كوشال شوهان، سمية تشاترجي، أكاش ريدي، أنيرودا إس، بالارامان رافيندران، براديب شينوي. أماس 2023 .
التعلم المعزز الهرمي مع مكافأة الانتباه. [pdf]
- سيهونغ لوه، جينغهاو تشين، تشنغ هو، تشونهونغ تشانغ، بينهوي تشوانغ. أماس 2023 .
التعلم التعزيزي البرنامجي الهرمي من خلال تعلم تأليف البرامج. [pdf]
- جوان تينج ليو، إن باي هو، بو جين تشينج، هونغ يي لي، شاو هوا صن. آي سي إم إل 2023 .
النشر التكيفي والقابل للتفسير لمهارات الملاحة من خلال التعلم المعزز الهرمي العميق. [pdf]
- كيوون لي، سيونجون كيم، جيسيك تشوي. ايكرا 2023 .

4_التعلم المعزز متعدد المهام

PiCor: التعلم المعزز العميق متعدد المهام مع تصحيح السياسات. [pdf]
- Fengshuo Bai، Hongming Zhang، Tianyang Tao، Zhiheng Wu، Yanna Wang، Bo Xu. AAAI 2023 .
تعدين المهام ذات الأولوية للتعلم المعزز التعاوني متعدد المهام. [pdf]
- يانغ يو، تشيو يين، جونج تشانغ، كايكي هوانغ. أماس 2023 .
التحقيق في التدريب المسبق متعدد المهام والتعميم في التعلم المعزز. [pdf]
- أدريان علي تايغا، ريشاب أغاروال، جيسي فيربروذر، آرون سي كورفيل، مارك جي بلمار. ICLR 2023 .
الممارسة المستقلة للعرض التوضيحي من خلال التعلم المعزز متعدد المهام. [pdf]
- أبهيشيك جوبتا، كوري لينش، براندون كينمان، جاريت بيك، سيرجي ليفين، كارول هاوسمان. ايكرا 2023 .

5_التعلم المعزز دون اتصال بالإنترنت

التعلم المعزز الكمي دون الاتصال بالإنترنت بطريقة محافظة. [pdf]
- زيهاو تشنغ، كاينينغ تشانغ، لي شين، داتشنغ تاو. مؤتمر AAAI للذكاء الاصطناعي (AAAI 2023).
حول مدى تعقيد نموذج التعلم المعزز القائم على نموذج الفانيليا مع العينات التابعة. [pdf]
- مصطفى أو كاراباج، أوفوك توبجو. مؤتمر AAAI للذكاء الاصطناعي (AAAI 2023).

6_التعلم المعزز العكسي

سوء التحديد في التعلم التعزيز العكسي. [pdf]
- جوار سكالس، أليساندرو أباتي. AAAI 2023 .
التعلم المعزز العكسي متعدد العوامل عبر نظرية العقل. [pdf]
- هاوتشن وو، بيدرو سيكويرا، ديفيد ف. بيناداث. أماس 2023 .
تعلم التعزيز العكسي العدائي للألعاب الميدانية المتوسطة. [pdf]
- يانغ تشن، ليبو تشانغ، جيامو ليو، مايكل ويتبروك. أماس 2023 .
تعلم التعزيز العكسي غير المرتكز على LTL. [pdf]
- محمد أفضل، سانكالب غامبير، أشوتوش جوبتا، س. كريشنا، أشوتوش تريفيدي، ألفارو فيلاسكيز. أماس 2023 .
LS-IQ: تنظيم المكافآت الضمنية للتعلم المعزز العكسي. [pdf]
- فراس الحافظ، دافيد تاتيو، أوليغ أرينز، غووبينغ تشاو، جان بيترز. ICLR 2023 .
التعلم بالتقليد السببي من خلال التعلم المعزز العكسي. [pdf]
- كانجروي روان، جونزي تشانغ، شوان دي، إلياس بارينبويم. ICLR 2023 .
قياس الاستدلال القيد في التعلم التعزيز العكسي. [pdf]
- جويليانج ليو، يودونج لو، أشيش جوراف، كاسرا رضائي، باسكال بوبارت. ICLR 2023 .
CLARE: تعلم المكافآت القائم على النموذج المحافظ للتعلم المعزز العكسي دون اتصال بالإنترنت. [pdf]
- شنغ يو، جوانبو وانغ، وي شاو، تشاوفنغ تشانغ، سين لين، جو رن، جونشان تشانغ. ICLR 2023 .
التعلم التعزيزي العكسي الهرمي متعدد المهام. [pdf]
- جيايو تشين، ديبيش تامبولي، تيان لان، فانيت أجروال. آي سي إم إل 2023 .
نحو فهم نظري للتعلم المعزز العكسي. [pdf]
- ألبرتو ماريا ميتيلي، فيليبو لازاتي، مارسيلو ريستيللي. آي سي إم إل 2023 .
قابلية التحديد والتعميم في التعلم المعزز العكسي المقيد. [pdf]
- أندرياس شلاغينهاوفن، مريم كامغاربور. آي سي إم إل 2023 .
التعلم المعزز العكسي بدون التعلم المعزز. [pdf]
- جوكول سوامي، ديفيد وو، سانجيبان تشودري، درو باجنيل، زيوي ستيفن وو. آي سي إم إل 2023 .
إطار التعلم المعزز العكسي لنقل سياسات تسلسل المهام من البشر إلى الروبوتات في تطبيقات التصنيع. [pdf]
- أومي م. مانيار، زاكاري ماكنولتي، ستيفانوس نيكولايديس، ساتياندرا ك. جوبتا. ايكرا 2023 .
تعلم خرائط التكلفة التي تراعي المخاطر من خلال التعلم المعزز العكسي للملاحة على الطرق الوعرة. [pdf]
- صامويل تريست، ماتيو غوامان كاسترو، بارف ماهيشواري، ماثيو سيفابراكسام، وينشان وانغ، سيباستيان أ. شيرير. ايكرا 2023 .
DriveIRL: القيادة في الحياة الواقعية من خلال التعلم المعزز العكسي. [pdf]
- تونغ فان مينه، فوربس هوينغتون، تينغ شينغ تشو، مومشيل س. توموف، روبرت إي بودوين، سانغ أوك لي، نانكسيانغ لي، كاغليان ديكلي، صامويل فيندلر، فرانسيسكو سواريز رويز، بو يانغ، سامي أوماري، إريك إم. وولف. ايكرا 2023 .
أرني ما تريد: تعلم التعزيز العكسي لتصميم أسراب الروبوتات تلقائيًا عن طريق العرض التوضيحي. [pdf]
- إلياس غربي، جوناس كوكلينج، ديفيد جارزون راموس، ماورو بيراتاري. ايكرا 2023 .
تعلم التعزيز العكسي الخصومي المدرك للخيارات للتحكم الآلي. [pdf]
- جيايو تشين، تيان لان، فانيت أغاروال. ايكرا 2023 .
SoLo T-DIRL: مخطط محلي ديناميكي مدرك اجتماعيًا يعتمد على التعلم المعزز العكسي العميق المصنف للمسار. [pdf]
- ييفان شو، تيودور تشاخاتشيرو، تريبهي كاثوريا، ماني غفاري. ايكرا 2023 .
InitLight: إنشاء النموذج الأولي للتحكم في إشارات المرور باستخدام تعلم التعزيز العكسي. [pdf]
- يوتونغ يي، ينغبو تشو، جيبين دينغ، تينغ وانغ، مينغسونغ تشن، شيانغ ليان. إيجيكاي 2023 .

7_ تعزيز التعلم بنماذج لغوية كبيرة

التعلم المعزز العميق من التفضيلات البشرية. [pdf]
- بول إف كريستيانو، جان ليك، توم براون، ميلجان مارتيتش، شين ليغ، داريو أمودي نيوربيس 2017 .
نماذج لغة التدريب على اتباع التعليمات مع ردود الفعل البشرية. [pdf]
- لونغ أويانغ، جيفري وو، شو جيانغ، ديوغو ألميدا، كارول وينرايت، باميلا ميشكين، تشونغ تشانغ، ساندهيني أغاروال، كاتارينا سلامة، أليكس راي، جون شولمان، جاكوب هيلتون، فريزر كيلتون، لوك ميلر، مادي سيمنز، أماندا أسكيل، بيتر ويلندر ، بول إف كريستيانو، جان لايكي، ريان لوي. نيوروبس 2022 .
تحسين التفضيل المباشر: نموذج اللغة الخاص بك هو سرًا نموذج مكافأة. [pdf]
- رافائيل رافايلوف، أرشيت شارما، إريك ميتشل، ستيفانو إرمون، كريستوفر د. مانينغ، تشيلسي فين. نيوروبس 2023 .
توجيه التدريب المسبق في التعلم المعزز باستخدام نماذج اللغة الكبيرة. [pdf]
- يو تشينغ دو، أوليفيا واتكينز، زيهان وانغ، سيدريك كولاس، تريفور داريل، بيتر أبيل، أبهيشيك غوبتا، جاكوب أندرياس. آي سي إم إل 2023 .
تصميم المكافأة باستخدام نماذج اللغة. [pdf]
- مينا كوون، سانغ مايكل شيه، كاليشا بولارد، دورسا صادق. ICLR 2023 .
نماذج لغوية مدربة مسبقًا لاتخاذ القرارات التفاعلية. [pdf]
- شوانغ لي، كزافييه بويغ، كريس باكستون، ييلون دو، كلينتون وانغ، لينكسي فان، تاو تشين، دي آن هوانغ، إيكين أكيوريك، أنيما أناندكومار، جاكوب أندرياس، إيغور مورداتش، أنطونيو تورالبا، يوكي تشو. نيوروبس 2022 .

الاقتباس

إذا كنت تستخدم صندوق الأدوات هذا في بحثك، فيرجى ذكر هذا المشروع.

 @misc{YalunAwesome,
    author = {Yalun Wu},
    title = {Reinforcement-Learning-Papers},
    year = {2023},
    howpublished = {url{https://github.com/Allenpandas/Reinforcement-Learning-Papers}}
}

يوسع