>>> คลิกที่นี่เพื่อติดตั้ง Fooocus <<<
Fooocus เป็นซอฟต์แวร์สร้างภาพ (อิงจาก Gradio)
Fooocus นำเสนอการคิดใหม่เกี่ยวกับการออกแบบตัวสร้างภาพ ซอฟต์แวร์เป็นแบบออฟไลน์ โอเพ่นซอร์ส และฟรี ขณะเดียวกันก็คล้ายกับโปรแกรมสร้างรูปภาพออนไลน์หลายตัว เช่น Midjourney ไม่จำเป็นต้องปรับแต่งด้วยตนเอง และผู้ใช้เพียงแค่เน้นไปที่ข้อความแจ้งและรูปภาพเท่านั้น Fooocus ยังทำให้การติดตั้งง่ายขึ้น: ระหว่างการกด "ดาวน์โหลด" และสร้างภาพแรก จำนวนการคลิกเมาส์ที่ต้องการจะถูกจำกัดไว้อย่างเคร่งครัดที่น้อยกว่า 3 ความต้องการหน่วยความจำ GPU ขั้นต่ำคือ 4GB (Nvidia)
ล่าสุดมีเว็บไซต์ปลอมจำนวนมากบน Google เมื่อคุณค้นหาคำว่า "fooocus" อย่าไว้ใจสิ่งเหล่านั้น – นี่คือแหล่งที่มาอย่างเป็นทางการเพียงแห่งเดียวของ Fooocus
โครงการ Fooocus ซึ่งสร้างขึ้นทั้งหมดบนสถาปัตยกรรม Stable Diffusion XL ขณะนี้อยู่ในสถานะของการสนับสนุนระยะยาว (LTS) ที่จำกัด โดยมีการแก้ไขข้อบกพร่องเท่านั้น เนื่องจากฟังก์ชันที่มีอยู่ถือว่าแทบไม่มีปัญหาด้านโปรแกรมเลย (ด้วยความพยายามอย่างมากของ mashb1t) การอัปเดตในอนาคตจะมุ่งเน้นไปที่การแก้ไขจุดบกพร่องใดๆ ที่อาจเกิดขึ้นโดยเฉพาะ
ขณะนี้ไม่มีแผนที่จะโยกย้ายหรือรวมสถาปัตยกรรมโมเดลที่ใหม่กว่า อย่างไรก็ตาม สิ่งนี้อาจมีการเปลี่ยนแปลงในช่วงเวลาที่มีการพัฒนาของชุมชนโอเพ่นซอร์ส ตัวอย่างเช่น หากชุมชนมาบรรจบกันด้วยวิธีเดียวที่โดดเด่นในการสร้างภาพ (ซึ่งอาจเกิดขึ้นจริงในครึ่งหรือหนึ่งปีตามสถานะปัจจุบัน) Fooocus ก็อาจเปลี่ยนไปใช้วิธีนั้นเช่นกัน
สำหรับผู้ที่สนใจใช้โมเดลใหม่ๆ เช่น Flux เราขอแนะนำให้สำรวจแพลตฟอร์มทางเลือก เช่น WebUI Forge (จากเราด้วย), ComfyUI/SwarmUI นอกจากนี้ยังมีส้อม Fooocus ที่ยอดเยี่ยมหลายตัวสำหรับการทดลอง
ขอย้ำอีกครั้งว่าเมื่อเร็วๆ นี้ มีเว็บไซต์ปลอมจำนวนมากบน Google เมื่อคุณค้นหาคำว่า "fooocus" อย่า รับ Fooocus จากเว็บไซต์เหล่านั้น หน้านี้เป็นแหล่ง Fooocus อย่างเป็นทางการเพียงแห่งเดียว เราไม่เคยมีเว็บไซต์เช่น "fooocus.com", "fooocus.net", "fooocus.co", "fooocus.ai", "fooocus.org", "fooocus.pro", "fooocus.one" เว็บไซต์เหล่านั้นเป็นของปลอมทั้งหมด พวกเขาไม่มีความสัมพันธ์กับเราอย่างแน่นอน Fooocus เป็นซอฟต์แวร์โอเพ่นซอร์สออฟไลน์ที่ไม่ใช่เชิงพาณิชย์ 100%
ด้านล่างนี้เป็นรายการสั้นๆ โดยใช้ตัวอย่างของ Midjourney:
กลางการเดินทาง | ฟูคัส |
---|---|
ข้อความเป็นรูปภาพคุณภาพสูงโดยไม่จำเป็นต้องอาศัยวิศวกรรมหรือการปรับพารามิเตอร์อย่างรวดเร็วมากนัก (ไม่ทราบวิธีการ) | ข้อความเป็นรูปภาพคุณภาพสูงโดยไม่จำเป็นต้องอาศัยวิศวกรรมหรือการปรับพารามิเตอร์อย่างรวดเร็วมากนัก (Fooocus มีกลไกประมวลผลพร้อมท์แบบออฟไลน์ GPT-2 และการปรับปรุงการสุ่มตัวอย่างจำนวนมาก เพื่อให้ผลลัพธ์สวยงามอยู่เสมอ ไม่ว่าการแจ้งของคุณจะสั้นเท่ากับ "บ้านในสวน" หรือยาวถึง 1,000 คำ) |
วี1 V2 V3 V4 | อินพุตรูปภาพ -> เพิ่มสเกลหรือรูปแบบ -> แปรผัน (เล็กน้อย) / แปรผัน (รุนแรง) |
ยู1 ยู2 ยู3 ยู4 | อินพุตรูปภาพ -> เพิ่มสเกลหรือการเปลี่ยนแปลง -> เพิ่มสเกล (1.5x) / เพิ่มสเกล (2x) |
อินเพนท์ / ขึ้น / ลง / ซ้าย / ขวา (แพน) | อินพุตรูปภาพ -> Inpaint หรือ Outpaint -> Inpaint / ขึ้น / ลง / ซ้าย / ขวา (Fooocus ใช้อัลกอริธึม inpaint และโมเดล inpaint ของตัวเองเพื่อให้ผลลัพธ์น่าพึงพอใจมากกว่าซอฟต์แวร์อื่นๆ ทั้งหมดที่ใช้วิธีการ/รุ่น inpaint SDXL มาตรฐาน) |
พร้อมท์รูปภาพ | ป้อนรูปภาพ -> พร้อมท์รูปภาพ (Fooocus ใช้อัลกอริธึมการแจ้งรูปภาพของตัวเองเพื่อให้คุณภาพของผลลัพธ์และความเข้าใจที่รวดเร็วนั้นน่าพึงพอใจมากกว่าซอฟต์แวร์อื่น ๆ ทั้งหมดที่ใช้วิธีการ SDXL มาตรฐาน เช่น IP-Adapters มาตรฐานหรือการแก้ไข) |
--สไตล์ | ขั้นสูง -> สไตล์ |
--จัดสไตล์ | ขั้นสูง -> ขั้นสูง -> คำแนะนำ |
--นิจิ | ตัวเรียกใช้หลายตัว: "run.bat", "run_anime.bat" และ "run_realistic.bat" Fooocus รองรับรุ่น SDXL บน Civitai (คุณสามารถค้นหาใน Google “Civitai” หากคุณไม่ทราบ) |
--คุณภาพ | ขั้นสูง -> คุณภาพ |
--ทำซ้ำ | ขั้นสูง -> หมายเลขรูปภาพ |
พร้อมท์หลายรายการ (::) | เพียงใช้พรอมต์หลายบรรทัด |
น้ำหนักพร้อมท์ | คุณสามารถใช้ " ฉัน (มีความสุข:1.5)" Fooocus ใช้อัลกอริธึมการปรับน้ำหนักของ A1111 เพื่อให้ผลลัพธ์ดีกว่า ComfyUI หากผู้ใช้คัดลอกข้อความแจ้งจาก Civitai โดยตรง (เนื่องจากหากข้อความแจ้งถูกเขียนในการถ่วงน้ำหนักของ ComfyUI ผู้ใช้จะมีโอกาสน้อยที่จะคัดลอกข้อความแจ้งเนื่องจากพวกเขาต้องการลากไฟล์) หากต้องการใช้การฝัง คุณสามารถใช้ "(embedding:file_name:1.1)" |
--เลขที่ | ขั้นสูง -> พรอมต์เชิงลบ |
--ar | ขั้นสูง -> อัตราส่วนภาพ |
InsightFace | ป้อนรูปภาพ -> พรอมต์รูปภาพ -> ขั้นสูง -> FaceSwap |
อธิบาย | ป้อนรูปภาพ -> อธิบาย |
ด้านล่างนี้เป็นรายการด่วนโดยใช้ตัวอย่างของ LeonardoAI:
เลโอนาร์โดไอ | ฟูคัส |
---|---|
พรอมต์เมจิก | ขั้นสูง -> สไตล์ -> Fooocus V2 |
พารามิเตอร์แซมเพลอร์ขั้นสูง (เช่น คอนทราสต์/ความคมชัด/อื่นๆ) | ขั้นสูง -> ขั้นสูง -> ความคมชัดของการสุ่มตัวอย่าง / ฯลฯ |
ControlNets ที่ใช้งานง่าย | ป้อนรูปภาพ -> พรอมต์รูปภาพ -> ขั้นสูง |
คลิกที่นี่เพื่อเรียกดูคุณสมบัติขั้นสูง
คุณสามารถดาวน์โหลด Fooocus ได้โดยตรงด้วย:
>>> คลิกที่นี่เพื่อดาวน์โหลด <<<
หลังจากที่คุณดาวน์โหลดไฟล์แล้ว โปรดคลายการบีบอัดไฟล์แล้วเรียกใช้ "run.bat"
ครั้งแรกที่คุณเปิดซอฟต์แวร์ ซอฟต์แวร์จะดาวน์โหลดโมเดลต่างๆ โดยอัตโนมัติ:
มันจะดาวน์โหลดโมเดลเริ่มต้นไปยังโฟลเดอร์ "Fooocusmodelscheckpoints" ที่กำหนดล่วงหน้าที่แตกต่างกัน คุณสามารถดาวน์โหลดล่วงหน้าได้หากคุณไม่ต้องการดาวน์โหลดอัตโนมัติ
โปรดทราบว่าหากคุณใช้ inpaint ในครั้งแรกที่คุณ inpaint รูปภาพ มันจะดาวน์โหลดโมเดลการควบคุม inpaint ของ Fooocus จากที่นี่เป็นไฟล์ "Fooocusmodelsinpaintinpaint_v26.fooocus.patch" (ขนาดของไฟล์นี้คือ 1.28GB)
หลังจาก Fooocus 2.1.60 คุณจะมี run_anime.bat
และ run_realistic.bat
ด้วย เป็นโมเดลที่ตั้งไว้ล่วงหน้าที่แตกต่างกัน (และต้องใช้โมเดลที่แตกต่างกัน แต่จะถูกดาวน์โหลดโดยอัตโนมัติ) ตรวจสอบที่นี่เพื่อดูรายละเอียดเพิ่มเติม
หลังจาก Fooocus 2.3.0 คุณยังสามารถสลับการตั้งค่าล่วงหน้าได้โดยตรงในเบราว์เซอร์ โปรดทราบว่าให้เพิ่มอาร์กิวเมนต์เหล่านี้หากคุณต้องการเปลี่ยนลักษณะการทำงานเริ่มต้น:
ใช้ --disable-preset-selection
เพื่อปิดใช้งานการเลือกที่กำหนดไว้ล่วงหน้าในเบราว์เซอร์
ใช้ --always-download-new-model
เพื่อดาวน์โหลดโมเดลที่หายไปบนสวิตช์ที่ตั้งไว้ล่วงหน้า ค่าเริ่มต้นคือทางเลือกก่อนหน้าคือ previous_default_models
ที่กำหนดไว้ล่วงหน้าที่เกี่ยวข้อง โปรดดูที่เอาต์พุตของเทอร์มินัลด้วย
หากคุณมีไฟล์เหล่านี้อยู่แล้ว คุณสามารถคัดลอกไปยังตำแหน่งด้านบนเพื่อเพิ่มความเร็วในการติดตั้งได้
โปรดทราบว่าหากคุณเห็น "MetadataIncompleteBuffer" หรือ "PytorchStreamReader" แสดงว่าไฟล์โมเดลของคุณเสียหาย กรุณาดาวน์โหลดโมเดลอีกครั้ง
ด้านล่างนี้คือการทดสอบบนแล็ปท็อประดับล่างที่มี System RAM ขนาด 16GB และ VRAM ขนาด 6GB (แล็ปท็อป NVIDIA 3060) ความเร็วของเครื่องนี้คือประมาณ 1.35 วินาทีต่อการวนซ้ำ ค่อนข้างน่าประทับใจ – ปัจจุบันแล็ปท็อปที่มี 3060 มักจะมีราคาที่ยอมรับได้มาก
นอกจากนี้ ซอฟต์แวร์อื่นๆ จำนวนมากเมื่อเร็วๆ นี้รายงานว่าไดรเวอร์ Nvidia ที่สูงกว่า 532 บางครั้งช้ากว่าไดรเวอร์ Nvidia 531 ถึง 10 เท่า หากเวลาในการสร้างของคุณยาวนานมาก ให้ลองดาวน์โหลดแล็ปท็อป Nvidia Driver 531 หรือ Nvidia Driver 531 Desktop
โปรดทราบว่าข้อกำหนดขั้นต่ำคือ หน่วยความจำ Nvidia GPU 4GB (4GB VRAM) และ หน่วยความจำระบบ 8GB (RAM 8GB) ขั้นตอนนี้จำเป็นต้องใช้เทคนิค Virtual Swap ของ Microsoft ซึ่งจะเปิดใช้งานโดยอัตโนมัติโดยการติดตั้ง Windows ของคุณโดยส่วนใหญ่ ดังนั้นคุณจึงมักไม่จำเป็นต้องดำเนินการใดๆ เกี่ยวกับเรื่องนี้ อย่างไรก็ตาม หากคุณไม่แน่ใจ หรือหากคุณปิดด้วยตนเอง (จะมีใครทำอย่างนั้นจริง ๆ ไหม) หรือ หากคุณเห็น "RuntimeError: CPUAllocator" คุณสามารถเปิดใช้งานได้ที่นี่:
และตรวจสอบให้แน่ใจว่าคุณมีพื้นที่ว่างอย่างน้อย 40GB ในแต่ละไดรฟ์ หากคุณยังคงเห็น "RuntimeError: CPUAllocator" !
โปรดเปิดปัญหาหากคุณใช้อุปกรณ์ที่คล้ายกันแต่ยังไม่สามารถบรรลุประสิทธิภาพที่ยอมรับได้
โปรดทราบว่าข้อกำหนดขั้นต่ำสำหรับแพลตฟอร์มที่แตกต่างกันนั้นแตกต่างกัน
ดูเพิ่มเติมเกี่ยวกับปัญหาทั่วไปและวิธีแก้ไขปัญหาที่นี่
(ทดสอบล่าสุด - 2024 12 ส.ค. โดย mashb1t)
โคลาบ | ข้อมูล |
---|---|
Fooocus อย่างเป็นทางการ |
ใน Colab คุณสามารถแก้ไขบรรทัดสุดท้ายเป็น !python entry_with_update.py --share --always-high-vram
หรือ !python entry_with_update.py --share --always-high-vram --preset anime
หรือ !python entry_with_update.py --share --always-high-vram --preset realistic
สำหรับ Fooocus Default/Anime/Realistic Edition
คุณยังสามารถเปลี่ยนค่าที่ตั้งไว้ล่วงหน้าใน UI ได้ โปรดทราบว่าการดำเนินการนี้อาจนำไปสู่การหมดเวลาหลังจาก 60 วินาที ในกรณีนี้ โปรดรอจนกว่าการดาวน์โหลดจะเสร็จสิ้น เปลี่ยนค่าที่ตั้งล่วงหน้าเป็นค่าเริ่มต้นและกลับไปเป็นค่าที่คุณเลือกไว้ หรือโหลดหน้าเว็บซ้ำ
โปรดทราบว่า Colab นี้จะปิดใช้ตัวปรับแต่งตามค่าเริ่มต้น เนื่องจากทรัพยากรของ Colab ฟรีมีค่อนข้างจำกัด (และฟีเจอร์ "ใหญ่" บางอย่าง เช่น ข้อความแจ้งรูปภาพอาจทำให้ Colab ระดับฟรียกเลิกการเชื่อมต่อ) เราดูแลให้การแปลงข้อความเป็นรูปภาพพื้นฐานใช้งานได้กับ Colab รุ่นฟรีเสมอ
การใช้ --always-high-vram
จะเปลี่ยนการจัดสรรทรัพยากรจาก RAM ไปยัง VRAM และทำให้เกิดความสมดุลโดยรวมที่ดีที่สุดระหว่างประสิทธิภาพ ความยืดหยุ่น และความเสถียรบนอินสแตนซ์ T4 เริ่มต้น กรุณาค้นหาข้อมูลเพิ่มเติมที่นี่
ขอบคุณ Camenduru สำหรับเทมเพลต!
หากคุณต้องการใช้ Anaconda/Miniconda คุณก็สามารถทำได้
git clone https://github.com/lllyasviel/Fooocus.git cd Fooocus conda env create -f environment.yaml conda activate fooocus pip install -r requirements_versions.txt
จากนั้นดาวน์โหลดโมเดล: ดาวน์โหลดโมเดลเริ่มต้นไปยังโฟลเดอร์ "Fooocusmodelscheckpoints" หรือให้ Fooocus ดาวน์โหลดโมเดลโดยอัตโนมัติ โดยใช้ Launcher:
conda activate fooocus python entry_with_update.py
หรือถ้าคุณต้องการเปิดพอร์ตระยะไกลให้ใช้
conda activate fooocus python entry_with_update.py --listen
ใช้ python entry_with_update.py --preset anime
หรือ python entry_with_update.py --preset realistic
สำหรับ Fooocus Anime/Realistic Edition
Linux ของคุณต้องติดตั้ง Python 3.10 และสมมติว่า Python ของคุณสามารถเรียกใช้ด้วยคำสั่ง python3 โดยที่ระบบ venv ของคุณใช้งานได้ คุณสามารถ
git clone https://github.com/lllyasviel/Fooocus.git cd Fooocus python3 -m venv fooocus_env source fooocus_env/bin/activate pip install -r requirements_versions.txt
ดูส่วนด้านบนสำหรับการดาวน์โหลดโมเดล คุณสามารถเปิดซอฟต์แวร์ด้วย:
source fooocus_env/bin/activate python entry_with_update.py
หรือถ้าคุณต้องการเปิดพอร์ตระยะไกลให้ใช้
source fooocus_env/bin/activate python entry_with_update.py --listen
ใช้ python entry_with_update.py --preset anime
หรือ python entry_with_update.py --preset realistic
สำหรับ Fooocus Anime/Realistic Edition
หากคุณรู้ว่าคุณกำลังทำอะไรอยู่ และ Linux ของคุณได้ติดตั้ง Python 3.10 ไว้แล้ว และสามารถเรียกใช้ Python ของคุณด้วยคำสั่ง python3 (และ Pip ด้วย pip3 ) คุณก็สามารถทำได้
git clone https://github.com/lllyasviel/Fooocus.git cd Fooocus pip3 install -r requirements_versions.txt
ดูส่วนด้านบนสำหรับการดาวน์โหลดโมเดล คุณสามารถเปิดซอฟต์แวร์ด้วย:
python3 entry_with_update.py
หรือถ้าคุณต้องการเปิดพอร์ตระยะไกลให้ใช้
python3 entry_with_update.py --listen
ใช้ python entry_with_update.py --preset anime
หรือ python entry_with_update.py --preset realistic
สำหรับ Fooocus Anime/Realistic Edition
โปรดทราบว่าข้อกำหนดขั้นต่ำสำหรับแพลตฟอร์มที่แตกต่างกันนั้นแตกต่างกัน
เช่นเดียวกับคำแนะนำข้างต้น คุณต้องเปลี่ยนคบเพลิงเป็นเวอร์ชัน AMD
pip uninstall torch torchvision torchaudio torchtext functorch xformers pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.6
อย่างไรก็ตาม AMD ไม่ได้รับการทดสอบอย่างเข้มข้น การสนับสนุนของ AMD อยู่ในช่วงเบต้า
ใช้ python entry_with_update.py --preset anime
หรือ python entry_with_update.py --preset realistic
สำหรับ Fooocus Anime/Realistic Edition
โปรดทราบว่าข้อกำหนดขั้นต่ำสำหรับแพลตฟอร์มที่แตกต่างกันนั้นแตกต่างกัน
เช่นเดียวกับวินโดวส์ ดาวน์โหลดซอฟต์แวร์และแก้ไขเนื้อหาของ run.bat
เป็น:
.python_embededpython.exe -m pip uninstall torch torchvision torchaudio torchtext functorch xformers -y .python_embededpython.exe -m pip install torch-directml .python_embededpython.exe -s Fooocusentry_with_update.py --directml pause
จากนั้นรัน run.bat
อย่างไรก็ตาม AMD ไม่ได้รับการทดสอบอย่างเข้มข้น การสนับสนุนของ AMD อยู่ในช่วงเบต้า
สำหรับ AMD ให้ใช้ .python_embededpython.exe entry_with_update.py --directml --preset anime
หรือ .python_embededpython.exe entry_with_update.py --directml --preset realistic
สำหรับ Fooocus Anime/Realistic Edition
โปรดทราบว่าข้อกำหนดขั้นต่ำสำหรับแพลตฟอร์มที่แตกต่างกันนั้นแตกต่างกัน
Mac ไม่ได้รับการทดสอบอย่างเข้มข้น ด้านล่างนี้เป็นแนวทางอย่างไม่เป็นทางการสำหรับการใช้ Mac คุณสามารถหารือเกี่ยวกับปัญหาได้ที่นี่
คุณสามารถติดตั้ง Fooocus บน Apple Mac Silicon (M1 หรือ M2) ด้วย macOS 'Catalina' หรือเวอร์ชันที่ใหม่กว่าได้ Fooocus ทำงานบนคอมพิวเตอร์ Apple Silicon ผ่านการเร่งความเร็วอุปกรณ์ PyTorch MPS คอมพิวเตอร์ Mac Silicon ไม่ได้มาพร้อมกับการ์ดกราฟิกเฉพาะ ส่งผลให้ใช้เวลาในการประมวลผลภาพนานกว่ามากเมื่อเทียบกับคอมพิวเตอร์ที่มีการ์ดกราฟิกเฉพาะ
ติดตั้งตัวจัดการแพ็คเกจ conda และ pytorch ทุกคืน อ่านคู่มือการฝึกอบรม Accelerated PyTorch บน Mac Apple Developer เพื่อดูคำแนะนำ ตรวจสอบให้แน่ใจว่า pytorch รู้จักอุปกรณ์ MPS ของคุณ
เปิดแอป macOS Terminal และโคลนพื้นที่เก็บข้อมูลนี้ด้วย git clone https://github.com/lllyasviel/Fooocus.git
เปลี่ยนเป็นไดเร็กทอรี Fooocus ใหม่ cd Fooocus
สร้างสภาพแวดล้อม conda ใหม่ conda env create -f environment.yaml
เปิดใช้งานสภาพแวดล้อม conda ใหม่ของคุณ conda activate fooocus
ติดตั้งแพ็คเกจที่ Fooocus ต้องการ pip install -r requirements_versions.txt
เรียกใช้ Fooocus โดยเรียกใช้ python entry_with_update.py
(ผู้ใช้ Mac M2 บางรายอาจต้องใช้ python entry_with_update.py --disable-offload-from-vram
เพื่อเร่งความเร็วในการโหลด/ขนถ่ายโมเดล) ครั้งแรกที่คุณรัน Fooocus มันจะดาวน์โหลดโมเดล Stable Diffusion SDXL โดยอัตโนมัติ และจะใช้เวลา ระยะเวลาขึ้นอยู่กับการเชื่อมต่ออินเทอร์เน็ตของคุณ
ใช้ python entry_with_update.py --preset anime
หรือ python entry_with_update.py --preset realistic
สำหรับ Fooocus Anime/Realistic Edition
ดูที่ docker.md
ดูคำแนะนำที่นี่
ด้านล่างนี้เป็นข้อกำหนดขั้นต่ำสำหรับการรัน Fooocus ภายในเครื่อง หากความสามารถของอุปกรณ์ของคุณต่ำกว่าข้อมูลจำเพาะนี้ คุณอาจไม่สามารถใช้ Fooocus ภายในเครื่องได้ (โปรดแจ้งให้เราทราบ ไม่ว่าในกรณีใด หากความสามารถของอุปกรณ์ของคุณต่ำกว่า แต่ Fooocus ยังคงใช้งานได้)
ระบบปฏิบัติการ | จีพียู | หน่วยความจำ GPU น้อยที่สุด | หน่วยความจำระบบน้อยที่สุด | สลับระบบ | บันทึก |
---|---|---|---|---|---|
วินโดวส์/ลินุกซ์ | NVIDIA RTX 4XXX | 4GB | 8GB | ที่จำเป็น | เร็วที่สุด |
วินโดวส์/ลินุกซ์ | NVIDIA RTX 3XXX | 4GB | 8GB | ที่จำเป็น | มักจะเร็วกว่า RTX 2XXX |
วินโดวส์/ลินุกซ์ | NVIDIA RTX 2XXX | 4GB | 8GB | ที่จำเป็น | มักจะเร็วกว่า GTX 1XXX |
วินโดวส์/ลินุกซ์ | NVIDIA GTX1XXX | 8GB (* 6GB ไม่แน่นอน) | 8GB | ที่จำเป็น | เร็วกว่า CPU เพียงเล็กน้อยเท่านั้น |
วินโดวส์/ลินุกซ์ | NVIDIA GTX9XX | 8GB | 8GB | ที่จำเป็น | เร็วกว่าหรือช้ากว่า CPU |
วินโดวส์/ลินุกซ์ | NVIDIA GTX < 9XX | ไม่รองรับ | - | - | - |
หน้าต่าง | เอเอ็มดีจีพียู | 8GB (อัปเดต 30 ธ.ค. 2023) | 8GB | ที่จำเป็น | ผ่าน DirectML (* ROCm ถูกระงับ) ช้ากว่า Nvidia RTX 3XXX ประมาณ 3 เท่า |
ลินุกซ์ | เอเอ็มดีจีพียู | 8GB | 8GB | ที่จำเป็น | ผ่าน ROCm ช้ากว่า Nvidia RTX 3XXX ประมาณ 1.5 เท่า |
แม็ค | M1/M2 MPS | แบ่งปันแล้ว | แบ่งปันแล้ว | แบ่งปันแล้ว | ช้ากว่า Nvidia RTX 3XXX ประมาณ 9 เท่า |
วินโดวส์/ลินุกซ์/แมค | ใช้แต่ซีพียู | 0GB | 32GB | ที่จำเป็น | ช้ากว่า Nvidia RTX 3XXX ประมาณ 17 เท่า |
* AMD GPU ROCm (ระงับ): AMD ยังคงทำงานเพื่อรองรับ ROCm บน Windows
* Nvidia GTX 1XXX 6GB ไม่แน่นอน: บางคนรายงานความสำเร็จ 6GB บน GTX 10XX แต่บางคนรายงานกรณีความล้มเหลว
โปรดทราบว่า Fooocus มีไว้สำหรับการสร้างภาพคุณภาพสูงมากเท่านั้น เราจะไม่สนับสนุนโมเดลขนาดเล็กเพื่อลดความต้องการและเสียสละคุณภาพผลลัพธ์
ดูปัญหาทั่วไปได้ที่นี่
ด้วยเป้าหมายที่แตกต่างกัน โมเดลเริ่มต้นและการกำหนดค่าของ Fooocus จึงแตกต่างกัน:
งาน | หน้าต่าง | อาร์กิวเมนต์ Linux | รุ่นหลัก | โรงกลั่น | การกำหนดค่า |
---|---|---|---|---|---|
ทั่วไป | วิ่ง.ค้างคาว | juggernautXL_v8การกระจายตัวของ Rundiffusion | ไม่ได้ใช้ | ที่นี่ | |
สมจริง | run_realistic.bat | --preset สมจริง | สมจริงStockPhoto_v20 | ไม่ได้ใช้ | ที่นี่ |
อะนิเมะ | run_anime.bat | --อะนิเมะที่ตั้งไว้ล่วงหน้า | แอนิมาดินสอXL_v500 | ไม่ได้ใช้ | ที่นี่ |
โปรดทราบว่าการดาวน์โหลดจะเป็นไป โดยอัตโนมัติ - คุณไม่จำเป็นต้องดำเนินการใดๆ หากการเชื่อมต่ออินเทอร์เน็ตใช้ได้ อย่างไรก็ตาม คุณสามารถดาวน์โหลดได้ด้วยตนเองหากคุณ (หรือย้ายจากที่อื่น) มีการเตรียมการของคุณเอง
นอกเหนือจากการทำงานบน localhost แล้ว Fooocus ยังสามารถเปิดเผย UI ได้ด้วยสองวิธี:
Listener UI ภายในเครื่อง: ใช้ --listen
(ระบุพอร์ต เช่น ด้วย --port 8888
)
การเข้าถึง API: ใช้ --share
(ลงทะเบียนจุดสิ้นสุดที่ .gradio.live
)
ทั้งสองวิธีการเข้าถึงจะไม่ผ่านการรับรองความถูกต้องตามค่าเริ่มต้น คุณสามารถเพิ่มการตรวจสอบสิทธิ์ขั้นพื้นฐานได้โดยการสร้างไฟล์ชื่อ auth.json
ในไดเร็กทอรีหลัก ซึ่งมีรายการออบเจ็กต์ JSON พร้อมด้วยคีย์ user
และ pass
(ดูตัวอย่างใน auth-example.json)
การขยายพร้อมท์ที่ใช้ GPT2 เป็นสไตล์ไดนามิก "Fooocus V2" (คล้ายกับการประมวลผลล่วงหน้าที่ซ่อนอยู่ของ Midjourney และโหมด "ดิบ" หรือ Prompt Magic ของ LeonardoAI)
การสลับตัวกลั่นแบบดั้งเดิมภายใน k-sampler ตัวเดียว ข้อดีก็คือ ขณะนี้โมเดลตัวกลั่นสามารถนำโมเมนตัมของโมเดลพื้นฐานกลับมาใช้ใหม่ (หรือพารามิเตอร์ประวัติของ ODE) ที่รวบรวมจากการสุ่มตัวอย่างแบบ k เพื่อให้เกิดการสุ่มตัวอย่างที่สอดคล้องกันมากขึ้น ในโปรแกรมฟิกซ์ความละเอียดสูงของ Automatic1111 และระบบโหนดของ ComfyUI โมเดลพื้นฐานและผู้ปรับแต่งใช้ k-sampler อิสระสองตัว ซึ่งหมายความว่าโมเมนตัมจะสูญเปล่าไปมาก และความต่อเนื่องในการสุ่มตัวอย่างจะเสียหาย Fooocus ใช้การสุ่มตัวอย่างแบบกระจาย k ขั้นสูงของตัวเอง ซึ่งรับประกันการสลับที่ราบรื่น เป็นธรรมชาติ และต่อเนื่องในการตั้งค่าตัวกลั่น (อัปเดตเมื่อ 13 ส.ค.: จริงๆ แล้ว ฉันได้พูดคุยเรื่องนี้กับ Automatic1111 เมื่อหลายวันก่อน และดูเหมือนว่า "การแลกเปลี่ยนตัวปรับแต่งดั้งเดิมภายใน k-sampler ตัวเดียว" ได้ถูกรวมเข้ากับสาขา dev ของ webui เยี่ยมมาก!)
คำแนะนำ ADM เชิงลบ เนื่องจากระดับความละเอียดสูงสุดของฐาน XL ไม่มีการข้ามความสนใจ สัญญาณบวกและลบสำหรับระดับความละเอียดสูงสุดของ XL จึงไม่สามารถรับคอนทราสต์ที่เพียงพอในระหว่างการสุ่มตัวอย่าง CFG ส่งผลให้ผลลัพธ์ดูพลาสติกเล็กน้อยหรือเรียบเกินไปในบางกรณี โชคดีที่เนื่องจากระดับความละเอียดสูงสุดของ XL ยังคงถูกกำหนดเงื่อนไขตามอัตราส่วนภาพ (ADM) เราจึงสามารถแก้ไข adm ในด้านบวก/ลบเพื่อชดเชยการขาดคอนทราสต์ CFG ในระดับความละเอียดสูงสุด (อัปเดตวันที่ 16 ส.ค. แอพ Draw Things ของ IOS จะรองรับ Negative ADM Guidance เยี่ยมมาก!)
เราใช้รูปแบบที่ได้รับการปรับแต่งอย่างระมัดระวังของส่วนที่ 5.1 ของ "การปรับปรุงคุณภาพตัวอย่างของแบบจำลองการแพร่กระจายโดยใช้คำแนะนำในการเอาใจใส่ตนเอง" น้ำหนักถูกกำหนดไว้ที่ต่ำมาก แต่นี่คือการรับประกันขั้นสุดท้ายของ Fooocus เพื่อให้แน่ใจว่า XL จะไม่ให้รูปลักษณ์ที่เรียบหรือเป็นพลาสติกมากเกินไป (ตัวอย่างที่นี่) วิธีนี้สามารถขจัดทุกกรณีที่ XL ยังคงให้ผลลัพธ์ที่ราบรื่นเกินไปเป็นครั้งคราว แม้ว่าจะมีคำแนะนำ ADM ที่เป็นลบก็ตาม (อัปเดต 2023 18 ส.ค. เคอร์เนล Gaussian ของ SAG เปลี่ยนเป็นเคอร์เนลแอนไอโซทรอปิกเพื่อการรักษาโครงสร้างที่ดีขึ้นและสิ่งประดิษฐ์น้อยลง)
เราปรับเปลี่ยนเทมเพลตสไตล์เล็กน้อยและเพิ่ม "ค่าเริ่มต้นของภาพยนตร์"
เราได้ทดสอบ "sd_xl_offset_example-lora_1.0.safetensors" แล้ว และดูเหมือนว่าเมื่อน้ำหนักของ Lora ต่ำกว่า 0.5 ผลลัพธ์จะดีกว่า XL ที่ไม่มี Lora เสมอ
พารามิเตอร์ของตัวเก็บตัวอย่างได้รับการปรับอย่างระมัดระวัง
เนื่องจาก XL ใช้การเข้ารหัสตำแหน่งสำหรับความละเอียดในการสร้าง รูปภาพที่สร้างจากความละเอียดคงที่หลายๆ ภาพจึงดูดีกว่าภาพที่มาจากความละเอียดที่กำหนดเองเล็กน้อย (เนื่องจากการเข้ารหัสตำแหน่งไม่ค่อยดีนักในการจัดการตัวเลข int ที่มองไม่เห็นระหว่างการฝึก) สิ่งนี้ชี้ให้เห็นว่าความละเอียดใน UI อาจถูกเข้ารหัสอย่างหนักเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด
ข้อความแจ้งที่แยกจากกันสำหรับตัวเข้ารหัสข้อความสองตัวที่แตกต่างกันดูเหมือนไม่จำเป็น ข้อความแจ้งที่แยกกันสำหรับโมเดลพื้นฐานและตัวปรับแต่งอาจใช้งานได้ แต่เอฟเฟกต์จะเป็นแบบสุ่ม และเรางดเว้นจากการดำเนินการนี้
ตระกูล DPM ดูเหมือนจะเหมาะสมอย่างยิ่งสำหรับ XL เนื่องจากบางครั้ง XL จะสร้างพื้นผิวที่เรียบเกินไป แต่บางครั้งตระกูล DPM จะสร้างรายละเอียดที่หนาแน่นมากเกินไปในพื้นผิว ผลกระทบต่อข้อต่อของพวกเขาดูเป็นกลางและน่าดึงดูดต่อการรับรู้ของมนุษย์
ระบบที่ได้รับการออกแบบอย่างพิถีพิถันเพื่อสร้างสมดุลให้กับสไตล์ที่หลากหลายรวมถึงการขยายอย่างรวดเร็ว
ใช้เมธอดของ automatic1111 เพื่อทำให้การเน้นพร้อมท์เป็นปกติ สิ่งนี้จะปรับปรุงผลลัพธ์ได้อย่างมากเมื่อผู้ใช้คัดลอกข้อความแจ้งจาก civitai โดยตรง
ขณะนี้ระบบการแลกเปลี่ยนร่วมของโรงกลั่นยังรองรับ img2img และยกระดับได้อย่างราบรื่น
CFG Scale และการแก้ไข TSNR (ปรับแต่งสำหรับ SDXL) เมื่อ CFG ใหญ่กว่า 10
หลังจากครั้งแรกที่คุณเรียกใช้ Fooocus ไฟล์กำหนดค่าจะถูกสร้างขึ้นที่ Fooocusconfig.txt
ไฟล์นี้สามารถแก้ไขได้เพื่อเปลี่ยนเส้นทางโมเดลหรือพารามิเตอร์เริ่มต้น
ตัวอย่างเช่น Fooocusconfig.txt
ที่แก้ไขแล้ว (ไฟล์นี้จะถูกสร้างขึ้นหลังจากการเปิดตัวครั้งแรก) อาจมีลักษณะดังนี้:
{ "path_checkpoints": "D:Fooocusmodelscheckpoints", "path_loras": "D:Fooocusmodelsloras", "path_embeddings": "D:Fooocusmodelsembeddings", "path_vae_approx": "D:Fooocusmodelsvae_approx", "path_upscale_models": "D:Fooocusmodelsupscale_models", "path_inpaint": "D:Fooocusmodelsinpaint", "path_controlnet": "D:Fooocus modelscontrolnet", "path_clip_vision": "D:Fooocusmodelsclip_vision", "path_fooocus_expansion": "D:Fooocusmodelsprompt_expansionfooocus_expansion", "path_outputs": "D:Fooocusoutputs" , "default_model": "realisticStockPhoto_v10.safetensors", "default_refiner": "", "default_loras": [["lora_filename_1.safetensors", 0.5], ["lora_filename_2.safetensors", 0.5]], "default_cfg_scale": 3.0, "default_sampler": "dpmpp_2m", "default_scheduler": "karras", "default_negative_prompt": "คุณภาพต่ำ", "default_positive_prompt": "", "default_styles": [ "Fooocus V2", "ภาพถ่าย Fooocus", "Fooocus Negative " - -
คีย์ รูปแบบ และตัวอย่างอื่นๆ อีกมากมายอยู่ใน Fooocusconfig_modification_tutorial.txt
(ไฟล์นี้จะถูกสร้างขึ้นหลังจากการเปิดตัวครั้งแรก)
พิจารณาสองครั้งก่อนที่คุณจะเปลี่ยนการกำหนดค่าจริงๆ หากคุณพบว่าตัวเองพัง ให้ลบ Fooocusconfig.txt
ออก Fooocus จะกลับไปสู่ค่าเริ่มต้น
วิธีที่ปลอดภัยกว่าคือลองใช้ "run_anime.bat" หรือ "run_realistic.bat" ซึ่งควรจะดีพอสำหรับงานต่างๆ อยู่แล้ว
โปรดทราบว่า user_path_config.txt
เลิกใช้งานแล้วและจะถูกลบเร็วๆ นี้ (แก้ไข: ลบออกไปแล้ว)
entry_with_update.py [-h] [--listen [IP]] [--port PORT] [--disable-header-check [ORIGIN]] [--web-upload-size WEB_UPLOAD_SIZE] [--hf-mirror HF_MIRROR] [--external-working-path PATH [PATH ...]] [--output-path OUTPUT_PATH] [--temp-path TEMP_PATH] [--cache-path CACHE_PATH] [--in-browser] [--disable-in-browser] [--gpu-device-id DEVICE_ID] [--async-cuda-allocation | --disable-async-cuda-allocation] [--disable-attention-upcast] [--all-in-fp32 | --all-in-fp16] [--unet-in-bf16 | --unet-in-fp16 | --unet-in-fp8-e4m3fn | --unet-in-fp8-e5m2] [--vae-in-fp16 | --vae-in-fp32 | --vae-in-bf16] [--vae-in-cpu] [--clip-in-fp8-e4m3fn | --clip-in-fp8-e5m2 | --clip-in-fp16 | --clip-in-fp32] [--directml [DIRECTML_DEVICE]] [--disable-ipex-hijack] [--preview-option [none,auto,fast,taesd]] [--attention-split | --attention-quad | --attention-pytorch] [--disable-xformers] [--always-gpu | --always-high-vram | --always-normal-vram | --always-low-vram | --always-no-vram | --always-cpu [CPU_NUM_THREADS]] [--always-offload-from-vram] [--pytorch-deterministic] [--disable-server-log] [--debug-mode] [--is-windows-embedded-python] [--disable-server-info] [--multi-user] [--share] [--preset PRESET] [--disable-preset-selection] [--language LANGUAGE] [--disable-offload-from-vram] [--theme THEME] [--disable-image-log] [--disable-analytics] [--disable-metadata] [--disable-preset-download] [--disable-enhance-output-sorting] [--enable-auto-describe-image] [--always-download-new-model] [--rebuild-hash-cache [CPU_NUM_THREADS]]
ตัวอย่างข้อความแจ้ง: __color__ flower
ประมวลผลพร้อมท์ทั้งเชิงบวกและเชิงลบ
เลือกไวด์การ์ดแบบสุ่มจากรายการตัวเลือกที่กำหนดไว้ล่วงหน้า ในกรณีนี้คือไฟล์ wildcards/color.txt
ไวด์การ์ดจะถูกแทนที่ด้วยสีสุ่ม (การสุ่มขึ้นอยู่กับเมล็ด) คุณยังสามารถปิดใช้งานการสุ่มและประมวลผลไฟล์ไวด์การ์ดจากบนลงล่างได้โดยเปิดใช้งานช่องทำเครื่องหมาย Read wildcards in order
ในโหมดดีบักของนักพัฒนา
Wildcard สามารถซ้อนกันและรวมกันได้ และ Wildcard หลายตัวสามารถใช้ในข้อความแจ้งเดียวกันได้ (ตัวอย่าง ดู wildcards/color_flower.txt
)
ตัวอย่างข้อความแจ้ง: [[red, green, blue]] flower
ประมวลผลเฉพาะพร้อมท์เชิงบวกเท่านั้น
ประมวลผลอาร์เรย์จากซ้ายไปขวา สร้างรูปภาพแยกกันสำหรับแต่ละองค์ประกอบในอาร์เรย์ ในกรณีนี้จะมีการสร้างรูปภาพ 3 รูป หนึ่งภาพสำหรับแต่ละสี เพิ่มหมายเลขรูปภาพเป็น 3 เพื่อสร้างตัวแปรทั้ง 3 แบบ
อาร์เรย์ไม่สามารถซ้อนกันได้ แต่สามารถใช้หลายอาร์เรย์ในพร้อมท์เดียวกันได้ รองรับ LoRA แบบอินไลน์เป็นองค์ประกอบอาร์เรย์!
ตัวอย่างข้อความแจ้ง: flower
ประมวลผลเฉพาะพร้อมท์เชิงบวกเท่านั้น
ใช้ LoRA กับพรอมต์ ไฟล์ LoRA จะต้องอยู่ในไดเร็กทอรี models/loras
คลิกที่นี่เพื่อเรียกดูคุณสมบัติขั้นสูง
ด้านล่างนี้คือ Forks บางส่วนสำหรับ Fooocus:
ส้อมของ Fooocus |
---|
fenneishi/Fooocus-ควบคุม runew0lf/RuinedFooocus MoonRide303/Fooocus-MRE metercai/SimpleSDXL mashb1t/Fooocus และอื่น ๆ ... |
ขอขอบคุณ twri และ 3Diva และ Marc K3nt3L ที่สร้างสไตล์ SDXL เพิ่มเติมใน Fooocus
โปรเจ็กต์เริ่มต้นจากส่วนผสมของฐานโค้ด Stable Diffusion WebUI และ ComfyUI
นอกจากนี้ ขอขอบคุณ daswer123 ที่ร่วมสนับสนุน Canvas Zoom!
บันทึกอยู่ที่นี่
คุณสามารถใส่ไฟล์ json ลงในโฟลเดอร์ language
เพื่อแปลอินเทอร์เฟซผู้ใช้ได้
ตัวอย่างเช่น ด้านล่างคือเนื้อหาของ Fooocus/language/example.json
:
{ "Generate": "生成", "Input Image": "入力画子", "ขั้นสูง": "고급", "SAI 3D Model": "SAI 3D Modèle"}
หากคุณเพิ่ม --language example
arg, Fooocus จะอ่าน Fooocus/language/example.json
เพื่อแปล UI
ตัวอย่างเช่น คุณสามารถแก้ไขบรรทัดสิ้นสุดของ Windows run.bat
ได้เป็น
.python_embededpython.exe -s Fooocusentry_with_update.py --language example
หรือ run_anime.bat
เป็น
.python_embededpython.exe -s Fooocusentry_with_update.py --language example --preset anime
หรือ run_realistic.bat
เป็น
.python_embededpython.exe -s Fooocusentry_with_update.py --language example --preset realistic
เพื่อการแปลเชิงปฏิบัติ คุณสามารถสร้างไฟล์ของคุณเอง เช่น Fooocus/language/jp.json
หรือ Fooocus/language/cn.json
จากนั้นใช้ flag --language jp
หรือ --language cn
เห็นได้ชัดว่าไม่มีไฟล์เหล่านี้อยู่ในขณะนี้ เราต้องการความช่วยเหลือจากคุณเพื่อสร้างไฟล์เหล่านี้!
โปรดทราบว่าหากไม่มีการระบุ --language
และในขณะเดียวกันก็มี Fooocus/language/default.json
อยู่ Fooocus จะโหลด Fooocus/language/default.json
สำหรับการแปลเสมอ ตามค่าเริ่มต้น ไฟล์ Fooocus/language/default.json
ไม่มีอยู่