Penerapan LoRA
Repositori ini mendemonstrasikan cara menyajikan beberapa Difusi Stabil LoRA yang telah disesuaikan dari ? Pustaka diffuser di Titik Akhir Inferensi Wajah Memeluk. Karena hanya beberapa ~ MB pos pemeriksaan yang dihasilkan setelah penyempurnaan dengan LoRA, kami dapat mengganti pos pemeriksaan yang berbeda untuk Difusi Stabil berbeda yang telah disesuaikan dengan cara yang super cepat, hemat memori, dan hemat ruang disk.
Untuk tujuan demonstrasi, saya telah menguji repositori Hugging Face Model berikut yang memiliki pos pemeriksaan LoRA yang telah disesuaikan ( pytorch_lora_weights.bin
):
- ethan_ai
- noto-emoji
- pokemon
Buku catatan
- Buku catatan percontohan: menunjukkan cara menulis dan menguji pengendali khusus untuk Titik Akhir Inferensi Wajah Memeluk di lingkungan lokal atau Colab
- Buku catatan inferensi: memperlihatkan cara meminta inferensi ke pengendali khusus yang diterapkan pada Hugging Face Inference Endopint
- Buku catatan inferensi multi-pekerja: menunjukkan cara menjalankan permintaan simultan ke penangan khusus yang diterapkan pada Titik Akhir Inferensi Wajah Hugging di lingkungan Colab
Penangan Kustom
- handler.py: penangan dasar. Penangan khusus ini terbukti berfungsi dengan repo Model Wajah Memeluk ini
- multiworker_handler.py: penangan tingkat lanjut dengan kumpulan banyak pekerja (Difusi Stabil). Penangan khusus ini terbukti berfungsi dengan repo Model Wajah Memeluk ini
Naskah
- inference.py: skrip Python mandiri untuk mengirim permintaan ke pengendali khusus yang diterapkan pada Titik Akhir Inferensi Wajah Hugging
Referensi
- https://huggingface.co/blog/lora