لي دينغ، جيني تشانغ، جيف كلون، لي سبيكتور، جويل ليمان
TL;DR: يعمل QDHF على تحسين خوارزميات QD من خلال استنتاج مقاييس التنوع من الأحكام البشرية للتشابه، متجاوزًا أحدث الأساليب في اكتشاف التنوع التلقائي في مهام الروبوتات ومهام RL وتحسين الأداء بشكل ملحوظ في المهام التوليدية المفتوحة.
يعمل QDHF (يمين) على تحسين التنوع في نتائج تحويل النص إلى صورة مقارنةً بأفضل ما في N (يسار) باستخدام Stable Diffusion.
لقد أصدرنا عرضًا تجريبيًا لـGradio على Hugging Face. تتيح هذه الواجهة سهلة الاستخدام استكشاف QDHF بسهولة دون أي متطلبات تشفير. شكر خاص لجيني تشانغ لمساهماتها!
لقد أصدرنا برنامجًا تعليميًا: دمج التعليقات البشرية في تنوع الجودة من أجل إنشاء تحويل نص إلى صورة متنوعة، بالتعاون مع فريق بيريبس. يتميز هذا البرنامج التعليمي بإصدار خفيف من QDHF ويعمل على Google Colab خلال ساعة واحدة تقريبًا. انغمس في البرنامج التعليمي لاستكشاف كيفية قيام QDHF بتعزيز نماذج GenAI باستجابات متنوعة وعالية الجودة وتطبيق هذه الأفكار على مشاريعك!
لتثبيت المتطلبات، قم بتشغيل:
pip install -r requirements.txt
لكل تجربة، نقدم برنامج نصي main.py
لتشغيل التجربة. على سبيل المثال، لتشغيل تجربة الذراع الآلية، قم بتشغيل:
cd arm
python3 main.py
استبدل arm
باسم التجربة التي تريد إجراؤها.
إذا وجدت عملنا أو أي من موادنا مفيدة، يرجى الاستشهاد بمقالتنا:
@inproceedings{
ding2024quality,
title={Quality Diversity through Human Feedback: Towards Open-Ended Diversity-Driven Optimization},
author={Li Ding and Jenny Zhang and Jeff Clune and Lee Spector and Joel Lehman},
booktitle={Forty-first International Conference on Machine Learning},
year={2024},
url={https://openreview.net/forum?id=9zlZuAAb08}
}
هذا المشروع تحت رخصة MIT.
تم تعديل البنية الرئيسية لهذا الكود من DQD. تحتوي كل تجربة على نسختها المعدلة من البيريبات، وهي مكتبة لتحسين تنوع الجودة. تستخدم تجربة التنقل في المتاهة نسخة معدلة من Kheperax. تستخدم تجربة LSI تقنية Stable Diffusion (المعانقة/الناشرات)، وOpenAI CLIP، وDreamSim. يتم الكشف عن إقرارات التمويل في الورقة.