ความเสถียร AI ประกาศการเปิดตัวของการแพร่กระจายที่เสถียร 3.5 ซึ่งเป็นชุดของรุ่นที่แตกต่างกันสามรุ่นที่แตกต่างกันของโมเดลการสร้างข้อความถึงภาพขนาดใหญ่ ซีรีส์นี้มีจุดมุ่งหมายเพื่อตอบสนองความต้องการที่หลากหลายตั้งแต่นักวิจัยไปจนถึงลูกค้าองค์กรไปจนถึงผู้ที่ชื่นชอบโดยการจัดหาแบบจำลองของพารามิเตอร์ที่แตกต่างกันและลักษณะการทำงานเพื่อให้เหมาะกับความสามารถในการคำนวณที่แตกต่างกันและสถานการณ์แอปพลิเคชัน การอัปเดตมีวัตถุประสงค์เพื่อตอบสนองต่อข้อบกพร่องก่อนหน้าของการแพร่กระจายที่เสถียร 3.0 และแข่งขันกับเครื่องมือสร้างภาพ AI ชั้นนำอื่น ๆ ในตลาด
ความเสถียร AI เพิ่งเปิดตัวโมเดลการสร้างข้อความเป็นภาพการเรียนรู้อย่างลึกซึ้งล่าสุด-การแพร่กระจายที่เสถียร รุ่นนี้รวมถึงรุ่นโอเพนซอร์ซที่ได้รับการปรับปรุงสามแบบที่ออกแบบมาเพื่อตอบสนองความต้องการของผู้ใช้ที่แตกต่างกันรวมถึงนักวิจัยลูกค้าองค์กรและผู้ที่ชื่นชอบ
ในหมู่พวกเขาการแพร่กระจายที่เสถียร 3.5large เป็นโมเดลที่ทรงพลังที่สุดในซีรีย์ทั้งหมดโดยมีพารามิเตอร์สูงถึง 8.1 พันล้าน ด้วยคุณภาพของภาพที่ยอดเยี่ยมและการตอบสนองที่สูงต่อการแจ้งเตือนแบบจำลองนี้เหมาะสำหรับผู้ใช้มืออาชีพสามารถสร้างภาพคุณภาพสูงด้วยความละเอียดสูงถึง 1 ล้านพิกเซล
นอกจากนี้ Turbo ที่มีเสถียรภาพการแพร่กระจายของเทอร์โบที่มีความเสถียรเป็นรุ่นที่เรียบง่ายของการแพร่กระจายที่เสถียร ในขณะที่การสร้างภาพที่มีคุณภาพสูงมันช่วยปรับปรุงความเร็วได้อย่างมาก
อีกรุ่นใหม่คือการแพร่กระจายที่เสถียร 3.5medium ซึ่งมีพารามิเตอร์ 2.5 พันล้าน โมเดลใช้สถาปัตยกรรม MMDIT-X ที่ได้รับการปรับปรุงและวิธีการฝึกอบรมที่ออกแบบมาให้เป็น "นอกกรอบ" และทำงานได้อย่างราบรื่นแม้ในฮาร์ดแวร์ผู้บริโภค มันสร้างความสมดุลที่ดีระหว่างคุณภาพการสร้างภาพและความสะดวกในการปรับแต่งสร้างภาพ 0.25 ถึง 2 ล้านพิกเซล
พื้นหลังของการเปิดตัวครั้งนี้คือหลังจากการเปิดตัว Diffusion3Medium ที่มีเสถียรภาพในเดือนมิถุนายนล้มเหลวในการตอบสนองความคาดหวังความมั่นคง AI ตัดสินใจที่จะเปิดตัวโซลูชันการเปลี่ยนแปลงมากขึ้น บริษัท กล่าวว่าพวกเขาหวังว่าจะฟื้นความสามารถในการแข่งขันของตลาดด้วยการอัปเดตเพื่อตอบสนองความท้าทายจากแพลตฟอร์มเช่น Dall-E และ Midjourney ของ Openai
นวัตกรรมทางเทคโนโลยีที่สำคัญในรูปแบบใหม่คือการแนะนำเทคโนโลยีการทำให้เป็นมาตรฐานคิวรีคีย์ นวัตกรรมนี้ช่วยเพิ่มการปรับแต่งของแบบจำลองและการตอบสนองต่อการแจ้งเตือนและผู้ใช้สามารถได้รับผลลัพธ์ที่สอดคล้องกันมากขึ้นด้วยการแจ้งเตือนที่ชัดเจนในขณะที่ยังได้รับการตีความภาพที่สมบูรณ์ยิ่งขึ้นเมื่อใช้พรอมต์ที่กว้างขึ้น
โมเดล Diffusion3.5 Series ที่เสถียรจะได้รับการปล่อยตัวภายใต้ใบอนุญาตชุมชนของ SELABULITY AI ช่วยให้ผู้ใช้สามารถใช้งานที่ไม่ใช่เชิงพาณิชย์ได้ฟรี ในเวลาเดียวกันหน่วยงานที่มีรายได้ต่อปีน้อยกว่า 1 ล้านเหรียญสหรัฐสามารถใช้สำหรับการใช้งานเชิงพาณิชย์ได้ฟรีในขณะที่ผู้ใช้ที่มีรายได้ส่วนเกินจะต้องสมัครใบอนุญาตขององค์กร
ทุกรุ่นและน้ำหนักที่โฮสต์ตัวเองมีอยู่บนใบหน้ากอดและ API ของ AI ของ AI นอกจากนี้คุณสมบัติ ControlNets ซึ่งมีตัวเลือกการปรับแต่งภาพขั้นสูงคาดว่าจะเปิดตัวในไม่กี่วันข้างหน้า
ทางเข้าอย่างเป็นทางการ:
https://stability.ai/stable-image
พอร์ทัล Hugging Face สามรุ่น:
https://huggingface.co/stabilityai/stable-diffusion-3.5-large
https://huggingface.co/stabilityai/stable-diffusion-3.5-large-turbo
https://huggingface.co/stabilityai/stable-diffusion-3.5-medium
ประเด็นสำคัญ:
การแพร่กระจายที่มีความเสถียรที่เพิ่งเปิดตัวใหม่เสนอรุ่นสามรุ่นเพื่อตอบสนองความต้องการของผู้ใช้ที่แตกต่างกัน
เทอร์โบ diffusion3.5large ที่เสถียรมีความเร็วในการสร้างภาพที่เร็วขึ้นเหมาะสำหรับการสร้างที่รวดเร็ว
โมเดลใหม่แนะนำเทคโนโลยีการทำให้เป็นมาตรฐานคิวรีคีย์ซึ่งปรับปรุงการปรับแต่งและการตอบสนอง
ในระยะสั้นการเปิดตัวโมเดลการแพร่กระจายที่เสถียร 3.5 เป็นเครื่องหมายการอัพเกรดที่สำคัญของความเสถียร AI ในด้านการสร้างข้อความสู่ภาพ ในการแข่งขันตลาดที่ดุเดือด เยี่ยมชมลิงก์ที่ให้มาและสัมผัสกับเทคโนโลยีการสร้างภาพใหม่เอี่ยม!