علم محرر Downcodes أن Stability AI قد أصدرت أحدث وأقوى نموذج لتوليد الصور، Stable Diffusion 3.5. هذا النموذج ليس إصدارًا واحدًا، ولكنه يحتوي على ثلاثة إصدارات لتلبية احتياجات المستخدمين المختلفين، بدءًا من الباحثين العلميين وحتى مستخدمي المؤسسات. يمكن الاستفادة منه. تتميز هذه الإصدارات الثلاثة بتركيز مختلف على كمية المعلمات وسرعة التشغيل والأجهزة القابلة للتطبيق، مما يوفر للمستخدمين نطاقًا أوسع من الاختيارات.
أصدرت Stability AI مساء أمس أقوى نموذج لها - Stable Diffusion 3.5. وهذا ليس مجرد نموذج واحد، بل مجموعة عائلية تحتوي على ثلاثة إصدارات، مصممة لإرضاء الجميع من الباحثين العلميين إلى عشاق الأعمال.
الإصدارات الثلاثة هي Stable Diffusion3.5Large، وStable Diffusion3.5Large Turbo، وStable Diffusion3.5Medium، والتي سيتم إصدارها في 29 أكتوبر.
Stable Diffusion3.5Large هو نموذج أساسي يحتوي على 8 مليار معلمة معروف بجودة الصورة الممتازة ودقة الكلمات، مما يجعله مثاليًا للاستخدام الاحترافي وقادر على إنتاج صور بدقة تصل إلى 1 ميجابكسل.
Stable Diffusion3.5Large Turbo هو نسخة مقطرة من الأول، وهو قادر على إنشاء صور عالية الجودة في 4 خطوات فقط، وهو أسرع بكثير من Stable Diffusion3.5Large.
يحتوي Stable Diffusion3.5Medium على 2.5 مليار معلمة، ويستخدم بنية MMDiT-X وطريقة تدريب محسنة، وهو مصمم ليكون التوصيل والتشغيل، ويمكن تشغيله مباشرة على أجهزة من فئة المستهلك، ويوازن بين جودة الصورة وقابلية التخصيص، ويمكنه إنشاء صور بدقة بمعدلات تتراوح بين 0.25 و2 ميجابكسل.
تم تطوير هذه النماذج مع التخصيص كأولوية، من خلال دمج تطبيع مفتاح الاستعلام في كتلة المحولات، وتحقيق الاستقرار في عملية تدريب النموذج وتبسيط المزيد من الضبط والتطوير. لدعم المرونة في المهام النهائية، يحتفظ Stability AI بقاعدة معرفية أوسع وأساليب متنوعة في النموذج، على الرغم من أن هذا قد يؤدي إلى زيادة عدم اليقين في نتائج المخرجات.
يتفوق نموذج Stable Diffusion3.5 في جوانب متعددة، بما في ذلك قابلية التخصيص والأداء الفعال والمخرجات المتنوعة. يمكن ضبط هذه النماذج بسهولة لتلبية احتياجات التأليف المحددة أو إنشاء تطبيقات بناءً على سير العمل المخصص. كما تم تحسينها أيضًا لتعمل على الأجهزة القياسية المخصصة للمستهلكين دون متطلبات الأجهزة المفرطة. بالإضافة إلى ذلك، هذه النماذج قادرة على إنشاء صور تمثل العالم بأكمله دون الحاجة إلى كلمات سريعة موسعة، بينما تكون قادرة على إنشاء صور في مجموعة متنوعة من الأساليب والجماليات مثل ثلاثية الأبعاد، والتصوير الفوتوغرافي، والرسم، وفن الخط، وأي شيء مرئي تقريبًا أسلوب يمكن تخيله.
أكدت Stability AI أيضًا على التزامها بالأمن، واتخاذ خطوات معقولة لمنع إساءة استخدام Stable Diffusion 3.5 والتركيز على النزاهة منذ المراحل الأولى من التطوير. بالإضافة إلى ذلك، فإن ترخيص مجتمع Stability AI متساهل للغاية، مما يسمح للأفراد والمنظمات باستخدام النموذج مجانًا للاستخدام غير التجاري، بما في ذلك البحث العلمي. النموذج مجاني أيضًا للاستخدام التجاري من قبل الشركات الناشئة والشركات الصغيرة والمتوسطة والمبدعين الذين تصل إيراداتهم السنوية إلى مليون دولار. تظل ملكية الوسائط الناتجة غير متأثرة بالتراخيص المقيدة.
نموذج Stable Diffusion3.5 متاح بالفعل للاستضافة الذاتية على Hugging Face، كما أن كود الاستدلال مفتوح المصدر أيضًا. بالإضافة إلى ذلك، يمكن الوصول إلى النموذج من خلال منصات مثل Stability AI API وReplicate وComfyUI وDeepInfra.
عنوان التجربة: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large
بشكل عام، حققت نماذج سلسلة Stable Diffusion 3.5 تقدمًا كبيرًا في جودة الصورة وسرعة التوليد وسهولة الاستخدام، مما يوفر للمستخدمين إمكانات قوية لتوليد الصور وسيناريوهات التطبيقات المرنة. يوصي محرر Downcodes جميع القراء بتجربته والشعور بأدائه القوي.