دليل شامل للانتشار المستقر - من المبتدئ إلى الخبير
لقد أصبحت مهتمًا باستخدام SD لإنشاء صور للتطبيقات العسكرية. يتم أخذ معظم الموارد من لوحات NSFW الخاصة بـ 4chan، حيث يستخدم المجهولون SD لصنع الهنتاي. ومن المثير للاهتمام أن واجهة SD WebUI الأساسية تحتوي على وظائف مدمجة مع لوحات صور الأنمي/الهنتاي... كانت إحدى حالات استخدام SD الأولى بعد DALL-E مباشرة هي إنشاء فتيات الأنيمي، لذا فإن الانتقال إلى الهنتاي ليس مفاجئًا.
على أية حال، فإن تقنيات هؤلاء غريبي الأطوار قابلة للتطبيق على مجموعة متنوعة من التطبيقات، وعلى الأخص LoRAs، والتي تشبه نماذج الضبط الدقيق. تتمثل الفكرة في العمل مع LoRAs محددة (مثل المركبات العسكرية والطائرات والأسلحة وما إلى ذلك) لإنشاء بيانات صور تركيبية لنماذج الرؤية التدريبية. يعد تدريب LoRAs الجديدة والمفيدة أمرًا مهمًا أيضًا. قد تتضمن الأشياء اللاحقة طلاءًا داخليًا للاضطراب.
إخلاء المسؤولية والمصادر
Every link here may contain NSFW content, as most of the cutting-edge work on SD and LoRAs is with porn or hentai. So, please be wary when you are working with these resources. ALSO, Rentry.org pages are the main resources linked to in this guide. If any of the rentry pages do not work, change the .org to .co and the link should work. Otherwise, use the Wayback machine.
-TP
العب معها!
ما الذي يمكنك فعله فعليًا باستخدام SD؟ لدى Huggingface والبعض الآخر بعض التطبيقات في المتصفح لك. العب معهم لترى القوة! ما سنفعله في هذا الدليل هو الحصول على واجهة WebUI الكاملة والقابلة للتوسيع للسماح لنا بفعل أي شيء نريده.
- Huggingface Text to Image SD Playground
- تطبيق Dreamstudio Text to Image SD
- تطبيق Dezgo Text to Image SD
- صورة المعانقة إلى ملعب صورة SD
- معانقة الوجه في ملعب الرسم
جدول المحتويات
- أساسيات واجهة الويب
- قم بإعداد استخدام GPU المحلي
- إعداد لينكس
- الذهاب أعمق
- مطالبة
- نموذج NovelAI
- لورا
- اللعب مع النماذج
- VAEs
- ضع كل شيء معًا
- عملية SD العامة
- مطالبات الحفظ
- إعدادات txt2img
- إعادة إنشاء صورة تم إنشاؤها مسبقًا
- استكشاف الأخطاء وإصلاحها
- الحصول على الراحة
- اختبار
- واجهة ويب متقدمة
- التحرير الفوري
- Xformers
- Img2Img
- في الرسم
- إضافات
- شبكات التحكم
- صنع أشياء جديدة (WIP)
- دمج نقطة التفتيش
- تدريب LoRAs
- تدريب النماذج الجديدة
- إعداد جوجل كولاب (WIP)
- منتصف الرحلة
- معلمات إم جي
- مطالبات MJ المتقدمة
- دريم ستوديو (WIP)
- الحشد المستقر (WIP)
- دريم بوث (WIP)
- نشر الفيديو (WIP)
أساسيات واجهة الويب
من الصعب إلى حد ما الخوض في هذا الأمر... لكن القنوات الأربعة قامت بعمل جيد في جعل هذا الأمر سهل الوصول إليه. فيما يلي الخطوات التي اتخذتها، بأبسط العبارات. هدفك هو تشغيل Stable Diffusion WebUI (المُصمم باستخدام Gradio) محليًا حتى تتمكن من البدء في المطالبة بالصور وإنشاءها.
قم بإعداد استخدام GPU المحلي
سنقوم بإعداد Google Colab Pro لاحقًا، حتى نتمكن من تشغيل SD على أي جهاز في أي مكان نريده؛ ولكن للبدء، دعونا نحصل على إعداد WebUI على جهاز الكمبيوتر. أنت بحاجة إلى ذاكرة وصول عشوائي (RAM) سعة 16 جيجابايت، ووحدة معالجة رسومات (GPU) مزودة بذاكرة فيديو (VRAM) سعة 2 جيجابايت، ونظام التشغيل Windows 7+ ومساحة قرص تبلغ 20+ جيجابايت.
- قم بإنهاء دليل إعداد البداية
- لقد تابعت هذا حتى الخطوة 7، وبعد ذلك انتقل إلى موضوع الهنتاي
- تستغرق الخطوة 3 من 15 إلى 45 دقيقة في متوسط سرعة الإنترنت، حيث أن حجم كل نموذج يزيد عن 5 جيجابايت
- يمكن أن تستغرق الخطوة 7 ما يزيد عن نصف ساعة وقد تبدو "عالقة" في سطر الأوامر
- في الخطوة 3 قمت بتنزيل SD1.5، وليس الإصدارات 2.x، حيث أن الإصدار 1.5 يعطي نتائج أفضل بكثير
- لدى CivitAI جميع نماذج SD؛ إنه مثل HuggingFace ولكنه مخصص لـ SD على وجه التحديد
- تحقق من أن WebUI يعمل
- انسخ عنوان URL لمخرجات واجهة سطر الأوامر (CLI) بمجرد الانتهاء، على سبيل المثال،
127.0.0.1:7860
( لا تستخدم Ctrl + C لأن هذا الأمر يمكنه إغلاق واجهة سطر الأوامر) - الصق في المتصفح وفويلا. جرب موجهًا وأنت خارج السباقات
- سيتم حفظ الصور تلقائيًا عند إنشائها في
stable-diffusion-webuioutputstxt2img-images
- تذكر، للتحديث، ما عليك سوى فتح واجهة سطر الأوامر (CLI) في المجلد Stable-diffusion-webui وإدخال الأمر
git pull
إعداد لينكس
تجاهل هذا تمامًا إذا كان لديك نظام Windows. لقد تمكنت من تشغيله على Linux أيضًا، على الرغم من أنه أكثر تعقيدًا بعض الشيء. لقد بدأت باتباع هذا الدليل، ولكنه مكتوب بشكل سيء إلى حد ما، لذا فيما يلي الخطوات التي اتخذتها لتشغيله على Linux. كنت أستخدم Linux Mint 20، وهو توزيع Ubuntu 20.
- ابدأ باستنساخ webui repo:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
- احصل على نموذج SD (على سبيل المثال، SD 1.5، كما في القسم السابق)
- ضع ملف النموذج ckpt في
stable-diffusion-webui/models/Stable-diffusion
- تنزيل Python (إذا لم يكن لديك بالفعل):
sudo apt install python3 python3-pip python3-virtualenv wget git
- وواجهة WebUI خاصة جدًا، لذا نحتاج إلى تثبيت Conda، وهو مدير بيئة افتراضية، للعمل داخل:
wget https://repo.anaconda.com/miniconda/Minconda3-latest-Linux-x86_64.sh
chmod +x Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
- الآن قم بإنشاء البيئة:
conda create --name sdwebui python=3.10.6
- تنشيط البيئة:
conda activate sdwebui
- انتقل إلى مجلد WebUI الخاص بك واكتب
./webui.sh
- يجب أن يتم تنفيذه لبعض الوقت حتى تحصل على خطأ بشأن عدم القدرة على الوصول إلى CUDA/وحدة معالجة الرسومات الخاصة بك... هذا جيد، لأنها خطوتنا التالية
- ابدأ بمسح أي برامج تشغيل Nvidia موجودة:
sudo apt update
sudo apt purge *nvidia*
- الآن، باتباع بعض الأجزاء من هذا الدليل، تعرف على وحدة معالجة الرسومات التي يحتوي عليها جهاز Linux الخاص بك (أسهل طريقة للقيام بذلك هي فتح تطبيق Driver Manager وسيتم إدراج وحدة معالجة الرسومات الخاصة بك؛ ولكن هناك عشرات الطرق، فقط ابحث عنها في Google)
- انتقل إلى هذه الصفحة وانقر على "أحدث فرع ميزات جديدة" ضمن Linux x86_64 (بالنسبة لي، كان 530.xx.xx)
- انقر فوق علامة التبويب "المنتجات المدعومة" ثم اضغط على Ctrl + F للعثور على وحدة معالجة الرسومات الخاصة بك؛ إذا كان مدرجًا، تابع، وإلا تراجع وحاول "أحدث إصدار لفرع الإنتاج"؛ لاحظ الرقم، على سبيل المثال، 530
- في المحطة، اكتب:
sudo add-apt-repository ppa:graphics-drivers/ppa
- قم بالتحديث باستخدام
sudo apt-get update
- قم بتشغيل تطبيق Driver Manager وسترى قائمة بها؛ لا تحدد الخيار الموصى به (على سبيل المثال، nvidia-driver-530-open)، وحدد الخيار المحدد من السابق (على سبيل المثال، nvidia-driver-530)، ثم قم بتطبيق التغييرات؛ أو قم بتثبيته في الوحدة الطرفية باستخدام
sudo apt-get install nvidia-driver-530
- في هذه المرحلة، يجب أن تحصل على نافذة منبثقة من خلال واجهة سطر الأوامر الخاصة بك حول Secure Boot، تطلب منك كلمة مرور مكونة من 8 أرقام: قم بتعيينها وكتابتها
- أعد تشغيل جهاز الكمبيوتر الخاص بك وقبل التشفير/تسجيل دخول المستخدم، يجب أن تشاهد شاشة تشبه BIOS (أكتب هذا من الذاكرة) مع خيار إدخال مفتاح MOK؛ انقر فوقه وأدخل كلمة المرور الخاصة بك، ثم قم بالإرسال والتمهيد؛ بعض المعلومات هنا
- قم بتسجيل الدخول كالمعتاد واكتب الأمر
nvidia-smi
؛ إذا نجحت، يجب طباعة جدول؛ إذا لم يكن الأمر كذلك، فسوف يظهر شيئًا مثل "تعذر الاتصال بوحدة معالجة الرسومات؛ يرجى التأكد من تثبيت أحدث برنامج تشغيل" - الآن لتثبيت CUDA (الأمر الأخير هنا يجب أن يطبع بعض المعلومات حول تثبيت CUDA الجديد)؛ من هذا الدليل:
sudo apt update
sudo apt install apt-transport-https ca-certificates gnupg
sudo apt install nvidia-cuda-toolkit
nvcc-version
- عد الآن وقم بالخطوات 7-9؛ إذا حصلت على هذا "الخطأ: لا يمكن تنشيط python venv، إحباط..."، انتقل إلى الخطوة التالية (وإلا، فأنت خارج السباقات وستقوم بنسخ عنوان IP من واجهة سطر الأوامر كالمعتاد ويمكنك البدء في اللعب باستخدام بطاقة SD)
- تحتوي مشكلة Github هذه على بعض استكشاف الأخطاء وإصلاحها لمشكلة venv هذه... بالنسبة لي، ما نجح هو التشغيل
python3 -c 'import venv'
python3 -m venv venv/
ثم انتقل إلى المجلد /stable-diffusion-webui
وقم بتشغيل:
rm -rf venv/
python3 -m venv venv/
بعد ذلك، عملت بالنسبة لي.
الذهاب أعمق
- اقرأ عن تقنيات التحفيز، لأن هناك الكثير من الأشياء التي يجب معرفتها (على سبيل المثال، التحفيز الإيجابي مقابل التحفيز السلبي، وخطوات أخذ العينات، وطريقة أخذ العينات، وما إلى ذلك)
- دليل OpenArt الفوري
- دليل مطالبة SD النهائي
- دليل تحفيزي موجز
- نصائح للمطالبة 4chan (NSFW)
- مجموعة من المطالبات والصور
- دليل خطوة بخطوة لفتاة الأنمي
- اقرأ عن معرفة SD بشكل عام:
- منشور الانتشار المستقر
- CompVis / Stability AI Github (موطن نماذج SD الأصلية)
- خلاصة الانتشار المستقر (مورد خارجي جيد)
- مركز روابط الانتشار المستقر (مورد 4chan المذهل)
- منجم الذهب المستقر
- مبسطة SD منجم الذهب
- عشوائي/متفرقات. روابط SD
- الأسئلة الشائعة (NSFW)
- أسئلة وأجوبة أخرى
- انضم إلى خلاف الانتشار المستقر
- مواكبة مع أخبار Stable Diffsion
- هل تعلم أنه اعتبارًا من مارس 2023، يتوفر نموذج نشر تحويل النص إلى الفيديو بمعلمة 1.7B؟
- يمكنك العبث بواجهة WebUI واللعب باستخدام نماذج وإعدادات مختلفة وما إلى ذلك.
مطالبة
ترتيب الكلمات في الموجه له تأثير: الكلمات السابقة لها الأسبقية. الهيكل العام للموجه الجيد، من هنا:
وهناك دليل جيد آخر يقول أن الموجه يجب أن يتبع هذا الهيكل: