محاذاة رهيبة لنماذج الانتشار
مجموعة من الأوراق الرائعة حول محاذاة نماذج الانتشار.
إذا كنت مهتمًا بمواءمة نماذج الانتشار، فيرجى الرجوع إلى ورقة الاستبيان الخاصة بنا "محاذاة نماذج الانتشار: الأساسيات والتحديات والمستقبل"، وهي أول دراسة استقصائية حول هذا الموضوع على حد علمنا.
نأمل أن نستمتع بمغامرة استكشاف نماذج المحاذاة والانتشار مع المزيد من الباحثين. هي موضع ترحيب التصحيحات والاقتراحات.
تقنيات محاذاة نماذج الانتشار
RLHF
- ImageReward: تعلم وتقييم التفضيلات البشرية لإنشاء النص إلى صورة. نيوربيس 2023، [pdf]
- DPOK: التعلم المعزز لتحسين نماذج نشر النص إلى الصورة، NeurIPS 2023، [pdf]
- محاذاة نماذج النص إلى الصورة باستخدام الملاحظات البشرية. أرخايف 2023، [pdf]
- محاذاة نماذج نشر النص إلى الصورة مع المكافأة Backpropagation. أرخايف 2023، [pdf]
- ضبط نماذج الانتشار بشكل مباشر على المكافآت القابلة للتمييز. الاتفاقية الدولية للحد من الكوارث 2024، [pdf]
- PRDP: التنبؤ بفارق المكافأة القريبة من أجل ضبط المكافأة على نطاق واسع لنماذج الانتشار. CVPR 2024، [pdf]
- ردود الفعل ضبط فعال عبر الإنترنت لنماذج الانتشار. آي سي إم إل 2024، [pdf]
- الضبط الدقيق لنماذج الانتشار المستمر في الوقت كتحكم منظم للإنتروبيا. أرخايف 2024، [pdf]
- فهم الضبط الدقيق لنماذج الانتشار القائم على التعلم المعزز: برنامج تعليمي ومراجعة. أرخايف 2024، [pdf]
- مواءمة نماذج الانتشار ذات الخطوات القليلة مع تعلم فرق المكافأة الكثيف. أرخايف 2024، [pdf]
DPO
- محاذاة نموذج الانتشار باستخدام تحسين التفضيل المباشر. CVPR 2024، [pdf]
- استخدام ردود الفعل البشرية لضبط نماذج الانتشار دون أي نموذج للمكافأة. CVPR 2024، [pdf]
- عرض مكافأة كثيف حول محاذاة نشر النص إلى الصورة مع التفضيل. آي سي إم إل 2024، [pdf]
- الضبط الذاتي لنماذج الانتشار لإنشاء النص إلى الصورة. نيوربيس 2024، [pdf]
- محاذاة نماذج الانتشار من خلال تحسين المنفعة البشرية. أرخايف 2024، [pdf]
- تحسين التفضيلات المدركة للخطوات: محاذاة التفضيلات مع تقليل الضوضاء في الأداء في كل خطوة. أرخايف 2024، [pdf]
- ضبط نموذج الانتشار المقطر بخطوات زمنية باستخدام تحسين العينة الزوجية. أرخايف 2024، [pdf]
- تحسين التفضيلات المصنفة القابلة للتطوير لإنشاء تحويل النص إلى صورة. أرخايف 2024، [pdf]
- تحديد أولويات خطوات تقليل الضوضاء بشأن محاذاة تفضيلات نموذج الانتشار من خلال تقدير التوزيع الواضح. أرخايف 2024، [pdf]
محاذاة ضمنية خالية من التدريب
- تحسين المطالبات لإنشاء النص إلى صورة. نيوربيس 2023، [pdf]
- RePrompt: التحرير الفوري التلقائي لتحسين فن توليد الذكاء الاصطناعي نحو تعبيرات دقيقة. مبادرة تشي 2023، [pdf]
- تحسين تناسق النص إلى الصورة عبر التحسين الفوري التلقائي. تملر 2024، [pdf]
- التحسين الديناميكي السريع لإنشاء النص إلى صورة. CVPR 2024، [pdf]
- ReNO: تعزيز نماذج تحويل النص إلى صورة بخطوة واحدة من خلال تحسين الضوضاء القائم على المكافأة. نيوربيس 2024، [pdf]
- نحو محاذاة أفضل لإنشاء النص إلى الصورة عبر تعديل الانتباه. أرخايف 2024، [pdf]
- لا يتم إنشاء جميع الضوضاء بشكل متساوٍ: اختيار الضوضاء المنتشرة وتحسينها. أرخايف 2024، [pdf]
- إرشادات خالية من المشتقات في نماذج الانتشار المستمر والمنفصل مع فك التشفير المرن القائم على القيمة. أرخايف 2024، [pdf]
- محاذاة وقت الاستدلال لنماذج الانتشار مع تحسين الضوضاء المباشرة. أرخايف 2024، [pdf]
المحاذاة خارج نماذج نشر النص إلى الصورة
- مواءمة مسارات التحسين مع نماذج الانتشار لإنشاء تصميم مقيد. نيوربيس 2023، [pdf]
- AlignDiff: محاذاة التفضيلات البشرية المتنوعة عبر نموذج الانتشار القابل للتخصيص للسلوك. الاتفاقية الدولية للحد من الكوارث 2024، [pdf]
- HIVE: تسخير ردود الفعل البشرية للتحرير المرئي التعليمي. CVPR 2024، [pdf]
- InstructVideo: إرشاد نماذج نشر الفيديو مع ردود الفعل البشرية. CVPR 2024، [pdf]
- DreamReward: إنشاء تحويل النص إلى ثلاثي الأبعاد مع تفضيل الإنسان. أرخايف 2024، [pdf]
- المحاذاة هي المفتاح لتطبيق نماذج الانتشار على عملية التركيب الرجعي. أرخايف 2024، [pdf]
- محاذاة نشر الفيديو عبر تدرجات المكافأة. أرخايف 2024، [pdf]
- مواءمة نماذج نشر الجزيئات المدركة للهدف مع التحسين الدقيق للطاقة. أرخايف 2024، [pdf]
- إصلاح الفيديو: تحسين إنشاء تحويل النص إلى فيديو عبر تقييم المحاذاة غير الصحيحة والتحسين المحلي. أرخايف 2024، [pdf]
المعايير والتقييم
- DALL-Eval: استكشاف مهارات التفكير والتحيزات الاجتماعية للمحولات التوليدية من النص إلى الصورة. ICCV 2023، [pdf]
- درجة التفضيل البشري: محاذاة أفضل لنماذج تحويل النص إلى صورة مع التفضيل البشري. ICCV 2023، [pdf]
- ImageReward: تعلم وتقييم التفضيلات البشرية لإنشاء النص إلى صورة. نيوربيس 2023، [pdf]
- Pick-a-Pic: مجموعة بيانات مفتوحة لتفضيلات المستخدم لإنشاء تحويل النص إلى صورة. نيوربيس 2023، [pdf]
- LLMScore: الكشف عن قوة نماذج اللغات الكبيرة في تقييم تركيب النص إلى الصورة. نيوربيس 2023، [pdf]
- VPGen & VPEval: البرمجة المرئية لإنشاء وتقييم النص إلى صورة. نيوربيس 2023، [pdf]
- درجة التفضيل البشري الإصدار 2: معيار قوي لتقييم التفضيلات البشرية لتركيب النص إلى الصورة. أرخايف 2023، [pdf]
- GenEval: إطار يركز على الكائنات لتقييم محاذاة النص إلى الصورة. مجموعات بيانات ومعايير NeurIPS 2023، [pdf]
- التقييم الشامل لنماذج تحويل النص إلى صورة. نيوربيس 2023، [pdf]
- المكافأة الاجتماعية: تقييم وتعزيز الذكاء الاصطناعي التوليدي من خلال تعليقات مليون مستخدم من مجتمع إبداعي عبر الإنترنت. الاتفاقية الدولية للحد من الكوارث 2024، [pdf]
- ردود فعل بشرية غنية لإنشاء النصوص والصور. CVPR 2024، [pdf]
- تعلم التفضيلات البشرية متعددة الأبعاد لإنشاء تحويل النص إلى صورة. CVPR 2024، [pdf]
- تعمل نماذج اللغات الكبيرة متعددة الوسائط على جعل النماذج التوليدية من النص إلى الصورة تتماشى بشكل أفضل. نيوربيس 2024، [pdf]
- قياس تشابه الأسلوب في نماذج الانتشار. أرخايف 2024، [pdf]
أساسيات المحاذاة البشرية
نمذجة التفضيلات
- تحليل رتبة تصاميم الكتل غير المكتملة: I. طريقة المقارنات المقترنة. القياسات الحيوية 1952، [pdf]
- سلوك الاختيار الفردي. جون وايلي 1959، [pdf]
- تحليل التباديل. مجلة الجمعية الإحصائية الملكية. السلسلة ج (الإحصاء التطبيقي) 1975، [pdf]
- التعلم من أجل التصنيف مع التفضيل المجزأ: تقدير سريع لنموذج بلاكيت-لوس. آيستاتس 2021، [pdf]
- نماذج التفضيل البشري لوظائف مكافأة التعلم. أرخايف 2022، [pdf]
- ما وراء التفضيلات في محاذاة الذكاء الاصطناعي. أرخايف 2024، [pdf]
RLHF
- نماذج لغة التدريب على اتباع التعليمات مع ردود الفعل البشرية. نيوربيس 2022، [pdf]
- الذكاء الاصطناعي الدستوري: عدم الضرر من ردود فعل الذكاء الاصطناعي. أرخايف 2022، [pdf]
- RRHF: ترتيب الاستجابات لمواءمة نماذج اللغة مع التعليقات البشرية دون دموع. نيوربيس 2023، [pdf]
- RAFT: مكافأة FineTuning لمحاذاة نموذج الأساس التوليدي. تملر 2024، [pdf]
- RLAIF مقابل RLHF: توسيع نطاق التعلم المعزز من الملاحظات البشرية باستخدام تعليقات الذكاء الاصطناعي. آي سي إم إل 2024، [pdf]
- العودة إلى الأساسيات: إعادة النظر في تحسين أسلوب REINFORCE للتعلم من الملاحظات البشرية في ماجستير إدارة الأعمال. دوري أبطال آسيا 2024، [pdf]
DPO
- تحسين التفضيل المباشر: نموذج اللغة الخاص بك هو سرًا نموذج مكافأة. نيوربيس 2023، [pdf]
- تحسين ترتيب التفضيلات لمحاذاة الإنسان. AAAI 2024، [pdf]
- نموذج نظري عام لفهم التعلم من التفضيلات البشرية. إستاتس 2024، [pdf]
- KTO: محاذاة النموذج كتحسين نظري محتمل. آي سي إم إل 2024، [pdf]
- LiPO: تحسين تفضيلات القائمة من خلال التعلم إلى الرتبة. أرخايف 2024، [pdf]
- ORPO: تحسين التفضيلات المتجانسة بدون نموذج مرجعي. أرخايف 2024، [pdf]
التحديات والفرص المحتملة لمواءمة الانتشار
- قوانين التوسع من أجل التحسين المفرط لنموذج المكافأة. آي سي إم إل 2023، [pdf]
- مشكلة المحاذاة من منظور التعلم العميق. الاتفاقية الدولية للحد من الكوارث 2024، [pdf]
- ما وراء عكس KL: تعميم تحسين التفضيل المباشر مع قيود الاختلاف المتنوعة. الاتفاقية الدولية للحد من الكوارث 2024، [pdf]
- ناش التعلم من ردود الفعل البشرية. آي سي إم إل 2024، [pdf]
- التعلم التفضيلي التكراري من ردود الفعل البشرية: سد الفجوة بين النظرية والتطبيق لـ RLHF تحت قيود KL. آي سي إم إل 2024، [pdf]
- مكافأة كثيفة مجانًا في تعزيز التعلم من ردود الفعل البشرية. آي سي إم إل 2024، [pdf]
- الموقف: خارطة طريق للتوافق التعددي. آي سي إم إل 2024، [pdf]
- تقييم هشاشة محاذاة السلامة عن طريق التقليم والتعديلات ذات الرتبة المنخفضة. آي سي إم إل 2024، [pdf]
- MaxMin-RLHF: التوافق مع التفضيلات البشرية المتنوعة. آي سي إم إل 2024، [pdf]
- المكافآت في السياق: محاذاة متعددة الأهداف لنماذج الأساس مع تعديل التفضيلات الديناميكية. آي سي إم إل 2024، [pdf]
- مكافأة التعلم النموذجي مقابل تحسين السياسة المباشرة: تحليل مقارن للتعلم من التفضيلات البشرية. آي سي إم إل 2024، [pdf]
- تحسين التفضيلات المعممة: نهج موحد للمحاذاة دون اتصال بالإنترنت. آي سي إم إل 2024، [pdf]
- المحاذاة البشرية لنماذج اللغات الكبيرة من خلال تحسين التفضيلات عبر الإنترنت. آي سي إم إل 2024، [pdf]
- فهم ديناميكيات التعلم للتوافق مع ردود الفعل البشرية. آي سي إم إل 2024، [pdf]
- الموقف: يجب أن يوجه الاختيار الاجتماعي توافق الذكاء الاصطناعي في التعامل مع ردود الفعل البشرية المتنوعة. آي سي إم إل 2024، [pdf]
- هل DPO متفوق على PPO لمحاذاة LLM؟ دراسة شاملة. آي سي إم إل 2024، [pdf]
- BOND: محاذاة LLMs مع أفضل التقطير من N. أرخايف 2024، [pdf]
- مواجهة التحسين المفرط للمكافأة في نماذج الانتشار: منظور التحيزات الاستقرائية والأولوية، [pdf]
نقلا عن
إذا وجدت القائمة الورقية مفيدة لبحثك، فنحن نرحب بك بشدة للاستشهاد بورقة الاستبيان الخاصة بنا حول هذا الموضوع!
@article{liu2024alignment,
title = {Alignment of Diffusion Models: Fundamentals, Challenges, and Future},
author = {Liu, Buhua and Shao, Shitong and Li, Bao and Bai, Lichen, and Xu, Zhiqiang and Xiong, Haoyi and Kwok, James and Helal, Sumi and Xie, Zeke},
journal = {arXiv preprint arXiv 2024.07253},
year = {2024}
}