บรรณาธิการของ Downcodes ได้เรียนรู้ว่า Stability AI ได้เปิดตัวโมเดลการสร้างภาพล่าสุดและทรงพลังที่สุด Stable Diffusion 3.5 โมเดลนี้ไม่ใช่เวอร์ชันเดียว แต่มีสามเวอร์ชันเพื่อตอบสนองความต้องการของผู้ใช้ที่แตกต่างกัน ตั้งแต่นักวิจัยทางวิทยาศาสตร์ไปจนถึงผู้ใช้ระดับองค์กร จะได้ประโยชน์จากมัน ทั้งสามเวอร์ชันนี้เน้นที่ปริมาณพารามิเตอร์ ความเร็วในการทำงาน และฮาร์ดแวร์ที่เกี่ยวข้องแตกต่างกัน ทำให้ผู้ใช้มีทางเลือกที่หลากหลายมากขึ้น
เมื่อเย็นวานนี้ Stability AI ได้เปิดตัวโมเดลที่ทรงพลังที่สุด - Stable Diffusion 3.5 ซึ่งไม่ได้เป็นเพียงโมเดลเดียวเท่านั้น แต่ยังเป็นกลุ่มครอบครัวที่มีสามเวอร์ชัน ซึ่งได้รับการออกแบบมาเพื่อตอบสนองทุกคนตั้งแต่นักวิจัยทางวิทยาศาสตร์ไปจนถึงผู้ที่ชื่นชอบธุรกิจสตาร์ทอัพและองค์กรต่างๆ
ทั้งสามเวอร์ชัน ได้แก่ Stable Diffusion3.5Large, Stable Diffusion3.5Large Turbo และ Stable Diffusion3.5Medium ซึ่งจะเปิดตัวในวันที่ 29 ตุลาคม
Stable Diffusion3.5Large เป็นโมเดลพื้นฐาน 8 พันล้านพารามิเตอร์ที่ขึ้นชื่อในด้านคุณภาพของภาพที่ยอดเยี่ยมและความแม่นยำของคำคิว ทำให้เหมาะสำหรับการใช้งานระดับมืออาชีพและสามารถสร้างภาพที่มีความละเอียดสูงสุด 1 ล้านพิกเซล
Stable Diffusion3.5Large Turbo เป็นเวอร์ชันกลั่นของรุ่นก่อน ซึ่งสามารถสร้างภาพคุณภาพสูงได้ใน 4 ขั้นตอนเท่านั้น ซึ่งเร็วกว่า Stable Diffusion3.5Large มาก
Stable Diffusion3.5Medium มีพารามิเตอร์ 2.5 พันล้านพารามิเตอร์ ใช้สถาปัตยกรรม MMDiT-X ที่ได้รับการปรับปรุงและวิธีการฝึกอบรม ได้รับการออกแบบมาให้เป็นแบบ Plug-and-Play สามารถรันได้โดยตรงบนฮาร์ดแวร์ระดับผู้บริโภค ปรับสมดุลคุณภาพของภาพและความสามารถในการปรับแต่งได้ และสามารถสร้างภาพที่มีความละเอียดได้ ด้วยอัตราระหว่าง 0.25 ถึง 2 ล้านพิกเซล
โมเดลเหล่านี้ได้รับการพัฒนาโดยให้ความสำคัญกับความสามารถในการปรับแต่งได้เป็นอันดับแรก โดยการผสานรวม Query-Key Normalization เข้ากับบล็อกหม้อแปลงไฟฟ้า ทำให้กระบวนการฝึกอบรมโมเดลมีความเสถียร และลดความซับซ้อนในการปรับแต่งและพัฒนาเพิ่มเติม เพื่อรองรับความยืดหยุ่นในงานปลายน้ำ Stability AI ยังคงรักษาฐานความรู้ที่กว้างขึ้นและรูปแบบที่หลากหลายในแบบจำลอง แม้ว่าสิ่งนี้อาจนำไปสู่ความไม่แน่นอนที่เพิ่มขึ้นในผลลัพธ์ผลลัพธ์ก็ตาม
โมเดล Stable Diffusion3.5 มีความเป็นเลิศในหลายด้าน รวมถึงความสามารถในการปรับแต่ง ประสิทธิภาพที่มีประสิทธิภาพ และเอาต์พุตที่หลากหลาย โมเดลเหล่านี้สามารถปรับแต่งได้อย่างง่ายดายเพื่อให้ตรงตามความต้องการในการเขียนเฉพาะ หรือสร้างแอปพลิเคชันตามเวิร์กโฟลว์ที่ปรับแต่งเอง นอกจากนี้ยังได้รับการปรับแต่งให้ทำงานบนฮาร์ดแวร์ระดับผู้บริโภคมาตรฐานโดยไม่มีข้อกำหนดด้านฮาร์ดแวร์มากเกินไป นอกจากนี้ โมเดลเหล่านี้สามารถสร้างภาพที่เป็นตัวแทนของโลกทั้งใบโดยไม่จำเป็นต้องใช้คำพูดที่กว้างขวาง ในขณะเดียวกันก็สามารถสร้างภาพในรูปแบบและสุนทรียศาสตร์ที่หลากหลาย เช่น 3 มิติ ภาพถ่าย การวาดภาพ ลายเส้น และภาพแทบทุกประเภท สไตล์ที่จินตนาการได้
Stability AI ยังเน้นย้ำถึงความมุ่งมั่นในการรักษาความปลอดภัย โดยทำตามขั้นตอนที่เหมาะสมเพื่อป้องกันการใช้ Stable Diffusion 3.5 ในทางที่ผิด และมุ่งเน้นไปที่ความสมบูรณ์ตั้งแต่ระยะเริ่มต้นของการพัฒนา นอกจากนี้ ใบอนุญาตชุมชน Stability AI ยังได้รับอนุญาตอย่างมาก โดยอนุญาตให้บุคคลและองค์กรใช้โมเดลได้ฟรีสำหรับการใช้ที่ไม่ใช่เชิงพาณิชย์ รวมถึงการวิจัยทางวิทยาศาสตร์ โมเดลนี้ยังฟรีสำหรับการใช้งานเชิงพาณิชย์สำหรับสตาร์ทอัพ SMEs และครีเอเตอร์ที่มีรายได้ต่อปีสูงถึง 1 ล้านดอลลาร์ ความเป็นเจ้าของสื่อผลลัพธ์ยังคงไม่ได้รับผลกระทบจากใบอนุญาตที่มีข้อจำกัด
โมเดล Stable Diffusion3.5 พร้อมใช้งานสำหรับการโฮสต์ด้วยตนเองบน Hugging Face แล้ว และโค้ดการอนุมานยังเป็นโอเพ่นซอร์สอีกด้วย นอกจากนี้ ยังสามารถเข้าถึงโมเดลผ่านแพลตฟอร์มต่างๆ เช่น Stability AI API, Replicate, ComfyUI และ DeepInfra
ที่อยู่ประสบการณ์: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large
โดยรวมแล้ว รุ่น Stable Diffusion 3.5 ซีรีส์มีความก้าวหน้าอย่างมากในด้านคุณภาพของภาพ ความเร็วในการสร้าง และความสะดวกในการใช้งาน ทำให้ผู้ใช้มีความสามารถในการสร้างภาพอันทรงพลังและสถานการณ์การใช้งานที่ยืดหยุ่น เครื่องมือแก้ไขของ Downcodes แนะนำให้ผู้อ่านทุกคนได้สัมผัสและสัมผัสถึงประสิทธิภาพอันทรงพลังของมัน