SwarmUI v0.9.3 เบต้า
เดิมชื่อ StableSwarmUI
อินเทอร์เฟซผู้ใช้บนเว็บการสร้างภาพ AI แบบโมดูลาร์ โดยเน้นไปที่การทำให้เครื่องมือไฟฟ้าเข้าถึงได้ง่าย ประสิทธิภาพสูง และความสามารถในการขยายได้ รองรับ Stable Diffusion, Flux ฯลฯ โมเดลรูปภาพ AI พร้อมแผนที่จะรองรับวิดีโอ AI เสียง และอื่นๆ ในอนาคต
เข้าร่วม Discord เพื่อหารือเกี่ยวกับโครงการ รับการสนับสนุน ดูประกาศ ฯลฯ
ติดตามหัวข้อประกาศคุณสมบัติเพื่อรับข้อมูลอัปเดตเกี่ยวกับคุณสมบัติใหม่
โครงการนี้อยู่ในสถานะ เบต้า ซึ่งหมายความว่าสำหรับงานส่วนใหญ่ Swarm มีเครื่องมือที่ยอดเยี่ยมสำหรับคุณ แต่ยังมีการวางแผนเพิ่มเติมอีกมาก แนะนำให้ใช้ Swarm เพื่อเป็น UI ในอุดมคติสำหรับผู้ใช้ส่วนใหญ่ ผู้เริ่มต้น และมืออาชีพ ยังมีบางสิ่งที่ต้องทำ
ผู้ใช้ระดับเริ่มต้นจะชื่นชอบอินเทอร์เฟซแท็บสร้างหลักของ Swarm ทำให้ง่ายต่อการสร้างทุกสิ่งด้วยคุณสมบัติอันทรงพลังที่หลากหลาย ผู้ใช้ขั้นสูงอาจชอบแท็บ Comfy Workflow เพื่อรับกราฟดิบที่ไม่จำกัด แต่ยังคงมีเหตุผลที่จะกลับมาที่แท็บสร้างเพื่อรับคุณสมบัติอำนวยความสะดวก (โปรแกรมแก้ไขรูปภาพ การสร้างเวิร์กโฟลว์อัตโนมัติ ฯลฯ) และเครื่องมือไฟฟ้า (เช่น Grid Generator)
ผู้ที่สนใจในการช่วยผลักดัน Swarm จากรุ่นเบต้าไปสู่สถานะรีลีสที่พร้อมสำหรับทุกสิ่งที่สมบูรณ์แบบ สามารถส่ง PR ได้ (อ่านเอกสารการสนับสนุนก่อน) และคุณสามารถติดต่อเราได้ที่นี่บน GitHub หรือบน Discord ฉันขอแนะนำเป็นอย่างยิ่งให้ติดต่อเพื่อสอบถามเกี่ยวกับแผนสำหรับฟีเจอร์หนึ่งก่อนที่จะประชาสัมพันธ์ อาจมีแผนงานเฉพาะหรือแม้กระทั่งงานที่กำลังดำเนินการอยู่แล้ว
เป้าหมายคุณลักษณะหลักที่ยังไม่ได้ใช้:
รองรับเบราว์เซอร์มือถือที่ดีขึ้น
รายละเอียด "รุ่นปัจจุบัน" แบบเต็มจะแสดงใน UI แยกจากตัวเลือกรุ่น (อาจเป็นแท็บภายในแถบด้านข้างของแบตช์)
และวิธีการเปลี่ยนแท็บไปมาระหว่างจุดต่างๆ แบบไดนามิก เพื่อความสะดวก/การปรับแต่งเค้าโครง
การกระตุ้นด้วย LLM
การกระจาย Swarm โดยตรงที่สะดวกเป็นโปรแกรม (แอพ Electron?)
คำเตือน : Google Colab ไม่จำเป็นต้องอนุญาตให้ใช้ WebUI ระยะไกล โดยเฉพาะบัญชีฟรี โดยยอมรับความเสี่ยงเอง
ลิงก์ Colab หากคุณต้องการลองใช้ Swarm: https://colab.research.google.com/github/mcmonkeyprojects/SwarmUI/blob/master/colab/colab-notebook.ipynb
เทมเพลต Runpod (หมายเหตุ: ดูแลโดยผู้สนับสนุนบุคคลที่สาม nerdylive123): https://runpod.io/console/deploy?template=u7mlkrmxq3&ref=c6jd6jj0
โปรดทราบว่าอาจใช้เวลาหลายนาทีในการเริ่มต้นครั้งแรก ตรวจสอบบันทึกคอนเทนเนอร์เพื่อดูความคืบหน้าของการตั้งค่า ตรวจสอบแม่แบบ ?
ข้อมูลคำแนะนำเกี่ยวกับวิธีการใช้งาน
หมายเหตุ: หากคุณใช้ Windows 10 คุณอาจต้องติดตั้ง git และ DotNET 8 SDK ด้วยตนเองก่อน (Windows 11 นี่เป็นแบบอัตโนมัติ)
ดาวน์โหลดไฟล์ Install-Windows.bat เก็บไว้ในที่ที่คุณต้องการติดตั้ง (ไม่ใช่ Program Files
) และเรียกใช้
ควรเปิดพรอมต์คำสั่งและติดตั้งตัวเอง
หากปิดโดยไม่ดำเนินการต่อไป ให้ลองเรียกใช้อีกครั้ง บางครั้งจำเป็นต้องเรียกใช้สองครั้ง (สิ่งที่ต้องทำ: แก้ไขสิ่งนั้น)
มันจะวางไอคอนบนเดสก์ท็อปของคุณที่คุณสามารถใช้เพื่อเปิดเซิร์ฟเวอร์อีกครั้งได้ตลอดเวลา
เมื่อตัวติดตั้งเสร็จสิ้น ระบบจะเปิดเซิร์ฟเวอร์ SwarmUI โดยอัตโนมัติ และเปิดหน้าต่างเบราว์เซอร์ไปที่หน้าการติดตั้ง
ทำตามคำแนะนำการติดตั้งบนหน้า
หลังจากที่คุณส่งแล้ว โปรดอดทนรอ กระบวนการติดตั้งบางส่วนใช้เวลาสักครู่ (การดาวน์โหลดโมเดล ฯลฯ)
(สิ่งที่ต้องทำ): ตัวติดตั้งล่วงหน้าที่มีในตัวเองง่ายยิ่งขึ้น เช่น .msi
หรือ .exe
ที่มีหน้าจอการติดตั้งทั่วไปและให้คุณเลือกโฟลเดอร์และทั้งหมดได้
ติดตั้ง git จาก https://git-scm.com/download/win
ติดตั้ง DotNET 8 SDK จาก https://dotnet.microsoft.com/en-us/download/dotnet/8.0 (ตรวจสอบให้แน่ใจว่าได้รับ SDK x64 สำหรับ Windows)
เปิดเทอร์มินัลไปยังโฟลเดอร์ที่คุณต้องการจับกลุ่มและเรียกใช้ git clone https://github.com/mcmonkeyprojects/SwarmUI
เปิดโฟลเดอร์และเรียกใช้ launch-windows.bat
ติดตั้ง git
, python3
ผ่านตัวจัดการแพ็คเกจ OS ของคุณหากยังไม่ได้ติดตั้ง (ตรวจสอบให้แน่ใจว่าได้รวม pip
และ venv
ใน distros ที่ไม่ได้รวมไว้ใน python โดยตรง)
ตัวอย่างเช่น ใน Ubuntu เวอร์ชันล่าสุด sudo apt install git python3-pip python3-venv
ดาวน์โหลดไฟล์ install-linux.sh เก็บไว้ในที่ที่คุณต้องการติดตั้งและเรียกใช้งาน
wget https://github.com/mcmonkeyprojects/SwarmUI/releases/download/0.6.5-Beta/install-linux.sh -O install-linux.sh
chmod +x install-linux.sh
หากคุณชอบเทอร์มินัล คุณสามารถเปิดเทอร์มินัลไปยังโฟลเดอร์และรันคำสั่งต่อไปนี้:
เรียกใช้สคริปต์ ./install-linux.sh
มันจะติดตั้งทุกอย่างให้คุณและเปิดหน้าเว็บในเบราว์เซอร์ของคุณในที่สุด
ทำตามคำแนะนำการติดตั้งในหน้า
คุณสามารถเรียกใช้สคริปต์ launch-linux.sh
เพื่อเปิดใช้งาน Swarm อีกครั้งได้ตลอดเวลาในอนาคต
หากเพจไม่เปิดขึ้นมาเอง คุณสามารถเปิด http://localhost:7801
ได้ด้วยตนเอง
ติดตั้ง git
, python3
ผ่านตัวจัดการแพ็คเกจ OS ของคุณหากยังไม่ได้ติดตั้ง (ตรวจสอบให้แน่ใจว่าได้รวม pip
และ venv
ใน distros ที่ไม่ได้รวมไว้ใน python โดยตรง)
ตัวอย่างเช่น ใน Ubuntu เวอร์ชันล่าสุด sudo apt install git python3-pip python3-venv
ติดตั้ง DotNET 8 โดยใช้คำแนะนำที่https://dotnet.microsoft.com/en-us/download/dotnet/8.0 (คุณต้องมี dotnet-sdk-8.0
เนื่องจากมีแพ็คเกจย่อยที่เกี่ยวข้องทั้งหมด)
ผู้ใช้บางคนกล่าวว่า Linux distros บางรุ่นคาดว่าจะติดตั้ง aspnet-runtime
แยกต่างหาก
เปิดเชลล์เทอร์มินัลและ cd
ไปยังไดเร็กทอรีที่คุณต้องการติดตั้ง
รันคำสั่งเชลล์:
git clone https://github.com/mcmonkeyprojects/SwarmUI
ซีดี SwarmUI
./launch-linux.sh
เปิด http://localhost:7801/Install
(หากไม่เปิดขึ้นมาเอง)
ทำตามคำแนะนำการติดตั้งในหน้า
(สิ่งที่ต้องทำ): อาจเชื่อมโยงเอกสารเฉพาะที่มีรายละเอียดต่อ distro และอะไรก็ตาม อาจจะสร้างตัวติดตั้งด้วยคลิกเดียวสำหรับ Linux ด้วย?
หมายเหตุ : คุณสามารถเรียกใช้ SwarmUI บนคอมพิวเตอร์ Mac ที่ใช้โปรเซสเซอร์ Apple Silicon M1 หรือ M2 (Mx) เท่านั้น
เปิดเทอร์มินัล
ตรวจสอบให้แน่ใจว่าแพ็คเกจ brew
ของคุณได้รับการอัพเดตด้วย brew update
ตรวจสอบการติดตั้ง brew
ของคุณกับ brew doctor
คุณไม่ควรเห็นข้อผิดพลาดใดๆ ในเอาต์พุตคำสั่ง
ติดตั้ง .NET สำหรับ macOS: brew install dotnet
หากคุณไม่มี Python ให้ติดตั้ง: brew install [email protected]
และ brew install virtualenv
เปลี่ยนไดเร็กทอรี ( cd
) ไปยังโฟลเดอร์ที่คุณต้องการติดตั้ง SwarmUI
โคลนพื้นที่เก็บข้อมูล SwarmUI GitHub: git clone https://github.com/mcmonkeyprojects/SwarmUI
cd SwarmUI
และรันสคริปต์การติดตั้ง: ./launch-macos.sh
การติดตั้งเริ่มต้นทันทีและดาวน์โหลดโมเดล Stable Diffusion จากอินเทอร์เน็ต อาจใช้เวลาหลายนาที ทั้งนี้ขึ้นอยู่กับการเชื่อมต่ออินเทอร์เน็ตของคุณ รอให้เว็บเบราว์เซอร์ของคุณเปิดหน้าต่าง SwarmUI
ระหว่างการติดตั้ง SwarmUI คุณจะได้รับแจ้งประเภทแบ็กเอนด์ที่คุณต้องการใช้ สำหรับคอมพิวเตอร์ Mac ที่มี M1 หรือ M2 คุณสามารถเลือกแบ็คเอนด์ ComfyUI ได้อย่างปลอดภัย และเลือกรุ่น Stable Diffusion XL Base และ Refiner ในหน้าจอดาวน์โหลดโมเดล
หากต้องการส่งต่อ Nvidia GPU คุณต้องติดตั้ง Nvidia Container Toolkit: https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html
เปิดเชลล์เทอร์มินัลและ cd
ไปยังไดเร็กทอรีที่คุณต้องการติดตั้ง
รันคำสั่งเชลล์:
git clone https://github.com/mcmonkeyprojects/SwarmUI
ซีดี SwarmUI
./launch-docker.sh
เปิดเบราว์เซอร์ของคุณไปที่ localhost:7801
โปรดทราบว่าระบบจะส่งต่อไดเร็กทอรี Models
และ Output
และจะเมานต์ Data
และ dlbackend
เป็นวอลุ่มถาวรอิสระ
ดูโฟลเดอร์เอกสารประกอบ
ชื่อ "Swarm" อ้างอิงถึงฟังก์ชันหลักดั้งเดิมของ UI: การเปิดใช้งาน 'ฝูง' ของ GPU เพื่อสร้างภาพสำหรับผู้ใช้คนเดียวกันในคราวเดียว (โดยเฉพาะอย่างยิ่งสำหรับรุ่นกริดขนาดใหญ่) นี่เป็นเพียงฟีเจอร์ที่เป็นแรงบันดาลใจให้กับชื่อนี้ และไม่ใช่จุดสิ้นสุดของ Swarm ทั้งหมด
เป้าหมายโดยรวมของ SwarmUI คือการเป็นร้านค้าครบวงจรที่มีฟีเจอร์ครบถ้วนสำหรับทุกสิ่งที่ Stable Diffusion
ดูเอกสารแรงจูงใจสำหรับแรงจูงใจในตัวเลือกทางเทคนิค
โครงการนี้:
ฝังสำเนาของ 7-zip (LGPL)
มีความสามารถในการติดตั้ง ComfyUI (GPL) โดยอัตโนมัติ
มีตัวเลือกให้ใช้เป็นแบ็กเอนด์ AUTOMATIC1111/stable-diffusion-webui (AGPL)
สามารถติดตั้ง christophschuhmann/improved-aesthetic-predictor (Apache2) และ yuvalkirstain/PickScore (MIT) ได้โดยอัตโนมัติ
สามารถติดตั้ง git-for-windows (GPLv2) ได้โดยอัตโนมัติ
สามารถติดตั้งแพ็คเกจ pip ของ MIT/BSD/Apache2/PythonSoftwareFoundation ได้โดยอัตโนมัติ: spandrel, dill, imageio-ffmpeg, opencv-python-headless, matplotlib, rembg, kornia, Cython
สามารถติดตั้ง ultralytics (AGPL) สำหรับการตรวจจับใบหน้า YOLOv8
ได้โดยอัตโนมัติ (เช่น โหนด SwarmYoloDetection
หรือการใช้ไวยากรณ์ <segment:yolo-...>
อาจอยู่ภายใต้เงื่อนไข AGPL)
สามารถติดตั้ง Insightface (MIT) สำหรับ IP Adapter - Face
support ได้โดยอัตโนมัติ
ใช้ JSON.NET (MIT), FreneticUtilities (MIT), LiteDB (MIT), ImageSharp (Apache2 ภายใต้ Open-source Split License)
ฝังสำเนาของเนื้อหาเว็บจาก BootStrap (MIT), Select2 (MIT), JQuery (MIT), exifr (MIT)
สามารถใช้ในการติดตั้งโหนดแพ็คแบบกำหนดเองซึ่งมีประกาศสิทธิ์การใช้งานส่วนบุคคลสำหรับสิทธิ์การใช้งานที่ไม่ใช่ FOSS ใด ๆ ก่อนการติดตั้ง
รองรับส่วนขยายที่ผู้ใช้สร้างขึ้นซึ่งอาจมีใบอนุญาตหรือเงื่อนไขทางกฎหมายของตนเอง
SwarmUI นั้นอยู่ภายใต้ใบอนุญาต MIT อย่างไรก็ตาม การใช้งานบางอย่างอาจได้รับผลกระทบจากใบอนุญาตรูปแบบ GPL ของโครงการที่เชื่อมต่อในรายการด้านบน และโปรดทราบว่ารุ่นใดๆ ที่ใช้มีใบอนุญาตของตนเอง
(สำหรับการอัปเดตก่อนเดือนมิถุนายน 2024)
ลิขสิทธิ์ MIT (MIT) ลิขสิทธิ์ (c) 2024 Stability AI
ใบอนุญาต MIT (MIT)
ลิขสิทธิ์ (c) 2024 Alex "mcmonkey" Goodwin
อนุญาตให้บุคคลใดก็ตามที่ได้รับสำเนาของซอฟต์แวร์นี้และไฟล์เอกสารที่เกี่ยวข้อง ("ซอฟต์แวร์") อนุญาตโดยไม่เสียค่าใช้จ่าย เพื่อจัดการกับซอฟต์แวร์โดยไม่มีข้อจำกัด รวมถึงแต่ไม่จำกัดเพียงสิทธิ์ในการใช้ คัดลอก ปรับเปลี่ยน ผสาน เผยแพร่ แจกจ่าย ให้อนุญาตช่วง และ/หรือขายสำเนาของซอฟต์แวร์ และอนุญาตให้บุคคลที่ได้รับซอฟต์แวร์นี้สามารถทำได้ ภายใต้เงื่อนไขต่อไปนี้:
ประกาศเกี่ยวกับลิขสิทธิ์ข้างต้นและประกาศการอนุญาตนี้จะรวมอยู่ในสำเนาทั้งหมดหรือส่วนสำคัญของซอฟต์แวร์
ซอฟต์แวร์นี้มีให้ "ตามที่เป็น" โดยไม่มีการรับประกันใดๆ ทั้งโดยชัดแจ้งหรือโดยนัย ซึ่งรวมถึงแต่ไม่จำกัดเพียงการรับประกันความสามารถในการค้าขาย ความเหมาะสมสำหรับวัตถุประสงค์เฉพาะ และการไม่ละเมิด ไม่ว่าในกรณีใดผู้เขียนหรือผู้ถือลิขสิทธิ์จะต้องรับผิดต่อการเรียกร้องค่าเสียหายหรือความรับผิดอื่นใดไม่ว่าในการกระทำของสัญญาการละเมิดหรืออย่างอื่นที่เกิดขึ้นจากหรือเกี่ยวข้องกับซอฟต์แวร์หรือการใช้งานหรือข้อตกลงอื่น ๆ ใน ซอฟต์แวร์.