Li Ding, Jenny Zhang, Jeff Clune, Lee Spector, Joel Lehman
TL;DR: QDHF meningkatkan algoritme QD dengan menyimpulkan metrik keragaman dari penilaian kesamaan manusia, melampaui metode canggih dalam penemuan keragaman otomatis dalam tugas robotika & RL dan secara signifikan meningkatkan kinerja dalam tugas generatif terbuka.
QDHF (kanan) meningkatkan keragaman hasil pembuatan teks-ke-gambar dibandingkan dengan best-of-N (kiri) menggunakan Difusi Stabil.
Kami telah merilis Demo Gradio tentang Memeluk Wajah. Antarmuka yang ramah pengguna ini memungkinkan eksplorasi QDHF dengan mudah tanpa persyaratan pengkodean apa pun. Terima kasih khusus kepada Jenny Zhang atas kontribusinya!
Kami telah merilis tutorial: Memasukkan Masukan Manusia ke dalam Keanekaragaman Kualitas untuk Diversifikasi Pembuatan Teks-ke-Gambar, bersama dengan tim pyribs. Tutorial ini menampilkan QDHF versi ringan dan berjalan di Google Colab dalam ~1 jam. Pelajari tutorial ini untuk mempelajari bagaimana QDHF menyempurnakan model GenAI dengan respons yang beragam dan berkualitas tinggi, serta menerapkan wawasan ini pada proyek Anda!
Untuk menginstal persyaratan, jalankan:
pip install -r requirements.txt
Untuk setiap eksperimen, kami menyediakan skrip main.py
untuk menjalankan eksperimen. Misalnya, untuk menjalankan eksperimen lengan robot, jalankan:
cd arm
python3 main.py
Ganti arm
dengan nama eksperimen yang ingin Anda jalankan.
Jika Anda merasa karya kami atau materi kami bermanfaat, silakan kutip makalah kami:
@inproceedings{
ding2024quality,
title={Quality Diversity through Human Feedback: Towards Open-Ended Diversity-Driven Optimization},
author={Li Ding and Jenny Zhang and Jeff Clune and Lee Spector and Joel Lehman},
booktitle={Forty-first International Conference on Machine Learning},
year={2024},
url={https://openreview.net/forum?id=9zlZuAAb08}
}
Proyek ini berada di bawah Lisensi MIT.
Struktur utama kode ini dimodifikasi dari DQD. Setiap eksperimen berisi versi pyribnya sendiri yang dimodifikasi, pustaka pengoptimalan keragaman yang berkualitas. Eksperimen navigasi labirin menggunakan versi Kheperax yang dimodifikasi. Eksperimen LSI menggunakan Difusi Stabil (huggingface/diffusers), OpenAI CLIP, dan DreamSim. Pengakuan pendanaan diungkapkan di koran.