تعلن الثبات AI عن إطلاق Diffusion 3.5 مستقرة ، وهي سلسلة من ثلاثة إصدارات مختلفة من نماذج توليد النص إلى صورة كبيرة. تهدف السلسلة إلى تلبية مجموعة واسعة من الاحتياجات من الباحثين إلى عملاء المؤسسات إلى المتحمسين ، من خلال توفير نماذج من موازين المعلمات المختلفة وخصائص الأداء لتناسب إمكانات الحوسبة المختلفة وسيناريوهات التطبيق. يهدف التحديث إلى الاستجابة لأوجه القصور السابقة للانتشار المستقر 3.0 والتنافس مع أدوات توليد صور AI الرائدة في السوق.
أطلقت الاستقرار AI مؤخرًا أحدث نموذج لتوليد النصوص العميق-Diffusion3.5. يتضمن هذا الإصدار ثلاثة نماذج مفتوحة المصدر محسّنة مصممة لتلبية احتياجات المستخدمين المختلفين ، بما في ذلك الباحثين وعملاء الشركات والعشاق.
من بينها ، يعد Diffusion3.5Large المستقر أقوى نموذج في السلسلة بأكملها ، مع وجود معلمات تصل إلى 8.1 مليار. بفضل جودة الصور الممتازة واستجابة عالية للمطالبات ، يعد النموذج مثاليًا للمستخدمين المحترفين ، القادر على توليد صور عالية الجودة بدقة تصل إلى 1 ميجابكسل.
بالإضافة إلى ذلك ، فإن Turbo Diffusion3.5large المستقر هو نسخة مبسطة من الانتشار المستقر 3.5large. أثناء توليد صور عالية الجودة ، فإنه يحسن السرعة بشكل كبير.
نموذج جديد آخر هو Diffusion3.5Medium المستقر ، الذي يحتوي على 2.5 مليار معلمة. يتبنى النموذج طريقة محسّنة للهندسة المعمارية والتدريب MMDIT-X ، مصممة ليكون "خارج الصندوق" ويعمل بسلاسة حتى على أجهزة المستهلك. إنه يلفت توازنًا جيدًا بين جودة توليد الصور وسهولة التخصيص ، مما ينتج عنه صور من 0.25 إلى 2 ميجابكسل.
خلفية هذا الإصدار هي أنه بعد إصدار يونيو من Diffusion3Medium المستقر في تلبية التوقعات ، قرر الاستقرار منظمة العفو الدولية إطلاق حل أكثر تحويلية. وقالت الشركة إنهم يأملون في استعادة القدرة التنافسية في السوق من خلال التحديث لمواجهة التحديات من منصات مثل Openai's Dall-E و Midjourney.
أحد الابتكار التكنولوجي الهام في النموذج الجديد هو إدخال تكنولوجيا تطبيع مفتاح الاستعلام. يعزز هذا الابتكار تخصيص النموذج والاستجابة للمطالبات ، ويمكن للمستخدمين الحصول على نتائج أكثر اتساقًا مع مطالبات واضحة ، مع الحصول على تفسير للصور أكثر ثراءً عند استخدام مطالبات أوسع.
سيتم إصدار نموذج سلسلة Diffusion3.5 المستقر تحت رخصة مجتمع AI للاستقرار ، مما يسمح للمستخدمين باستخدام غير تجاري مجانًا. في الوقت نفسه ، يمكن أيضًا استخدام الكيانات ذات الدخل السنوي أقل من مليون دولار أمريكي للاستخدام التجاري مجانًا ، في حين يجب على المستخدمين ذوي الدخل الزائد أن يتقدموا بطلب للحصول على ترخيص الشركة.
يتم توفير جميع النماذج وأوزانها ذاتية الاستضافة على وجه واجهات برمجة تطبيقات AI. بالإضافة إلى ذلك ، من المتوقع إطلاق ميزة ControlNets ، التي توفر خيارات تخصيص الصور المتقدمة ، في الأيام المقبلة.
المدخل الرسمي:
https://stability.ai/stable-image
ثلاثة إصدارات من بوابات الوجه المعانقة:
https://huggingface.co/Stableai/stable-diffusion-3.5-large
https://huggingface.co/Stableai/stable-diffusion-3.5-large-turbo
https://huggingface.co/Stableai/stable-diffusion-3.5-medium
النقاط الرئيسية:
يوفر Diffusion3.5 الذي تم إطلاقه حديثًا ثلاثة إصدارات نموذجية لتلبية احتياجات المستخدم المختلفة.
DIPFUSING3.5LARGE TURBO لديه سرعات توليد صور أسرع ، مناسبة للإبداع السريع.
يقدم النموذج الجديد تقنية تطبيع مفتاح الاستعلام ، مما يحسن التخصيص والاستجابة.
باختصار ، يمثل إطلاق نموذج Series Series المستقر 3.5 ترقية رئيسية للثبات في مجال توليد النصوص. في مسابقة السوق الشرسة. قم بزيارة الروابط المقدمة وتجربة تقنية توليد الصور الجديدة!