يتغير مجال توليد صور الذكاء الاصطناعي مع مرور كل يوم بعد تحديث Midjourney، وقد وصل النموذج مفتوح المصدر FLUX.1 ويقال إن أداءه يفوق النماذج مغلقة المصدر مثل DALL·E3 وMidjourney V6 أيضًا كسلسلة SD3 من النماذج مفتوحة المصدر، تجتذب اهتمامًا واسع النطاق في الصناعة. سيمنحك محرر Downcodes فهمًا متعمقًا لهذه التحفة الفنية الجديدة التي أنشأها Robin Rombach، وهو خبير موثوق في مجال نماذج الانتشار، بالإضافة إلى الابتكار التكنولوجي والآفاق المستقبلية وراءه.
في مجال الذكاء الاصطناعي، يمكن أن تحدث تغييرات مدمرة كل يوم. في اليوم التالي للتحديث الرئيسي لـ Midjourney، بدأ مجال توليد الصور مفتوحة المصدر ظهور حصان أسود ملفت للنظر-FLUX.1. لا يدعي هذا اللاعب الجديد المفاجئ أنه يتفوق بشكل كبير على النماذج مغلقة المصدر مثل DALL·E3 وMidjourney V6 من حيث الأداء فحسب، بل يقتل أيضًا سلسلة SD3 مفتوحة المصدر بأكملها، مما يؤدي إلى تفجير دائرة الذكاء الاصطناعي على الفور.
دعونا نتعرف أولاً على العقل المدبر وراء FLUX.1. مؤسسها، روبن رومباخ، ليس شخصًا مجهولًا، ولكنه خبير موثوق في مجال نماذج الانتشار. تشمل أعماله التمثيلية VQGAN وTaming Transformers وLent Diffusion. وقد شغل سابقًا منصب كبير العلماء في Stability AI وقاد سلسلة مشاريع Stable Diffusion ذات الشهرة العالمية. يمكن القول أن روبن رومباخ هو سائق ذو خبرة بين السائقين ذوي الخبرة في مجال توليد الصور بالذكاء الاصطناعي.
في مارس من هذا العام، بسبب الاضطرابات الداخلية في Stability AI، اختار روبن المغادرة. وبعد أربعة أشهر من العمل الشاق، عاد مع منصة النماذج الكبيرة الجديدة مفتوحة المصدر FLUX.1. الأمر الأكثر إثارة للدهشة هو أنه عند ظهور FLUX.1 لأول مرة، حصل على جولة تمويل أولية بقيمة 32 مليون دولار أمريكي بقيادة مؤسسة رأس المال الاستثماري المعروفة Andreessen Horowitz. وهذا يوفر بلا شك دفعة قوية للتطوير المستقبلي لـ FLUX.1.
إذن، ما هو الشيء المميز في FLUX.1؟ أولاً وقبل كل شيء، يعتمد على بنية Vision Transformer، ويتبنى طريقة تدريب مطابقة للعملية، ويستخدم تضمين موضع التدوير وطبقات الاهتمام المتوازية لتحسين أداء النموذج وكفاءة استخدام الأجهزة. تم إطلاق هذا النموذج الذي يضم 12 مليار معلمة في ثلاثة إصدارات:
النسخة الاحترافية: تستخدم من خلال API، بأقوى أداء.
إصدار المطورين: نموذج التقطير الموجه غير التجاري الذي يرث معظم أداء الإصدار الاحترافي.
إصدار شنيل: نموذج مفتوح المصدر يمكن استخدامه تجاريًا ويتمتع بأداء ممتاز.
وفقًا لبيانات الاختبار التي أجراها فريق FLUX.1، فإن إصدار Schnell مفتوح المصدر يتفوق على Midjourney v6.0 وDALL·E3 (HD) من حيث استعادة دلالات النص وجودة الصورة واتساق العمل والتماسك والتنوع والنماذج السائدة مثل SD3-Ultra. يُظهر FLUX.1 مزايا واضحة خاصة عند تضمين النص في الصور.
هنا، قامت AIbase باختيار العديد من عروض تأثير الإنشاء الرسمية للرجوع إليها:
صور فوتوغرافية حقيقية
اختبر AIbase قديس القطط السابق، ولم تكن هناك مشكلة على الإطلاق. فهم FLUX.1 الكلمات السريعة بشكل أكثر دقة.
وبطبيعة الحال، من الواضح أن طموحات FLUX.1 لا تتوقف عند هذا الحد. قال الفريق إن Vincent Picture هي مجرد البداية، وفي المستقبل، يخططون أيضًا لإطلاق نموذج Vincent Video لتحدي منتجات الخط الأول مثل Sora وGen-3 وLuma.
بالنسبة للمطورين وعشاق الذكاء الاصطناعي، فإن ظهور FLUX.1 يعد بلا شك فائدة كبيرة. إصدار Schnell مفتوح المصدر بالكامل ويدعمه Comfyui. إذا كان لديك أكثر من 36 جيجا بايت من ذاكرة الفيديو، فيمكنك حتى تشغيل الإصدار fp16 من t5. ومع ذلك، تجدر الإشارة إلى أنه يلزم تنزيل t5xxl_fp16.safetensors أو clip_l.safetensors وVAE بشكل منفصل.
إن ظهور FLUX.1 لا يجلب أملاً جديدًا في مجال توليد صور الذكاء الاصطناعي مفتوحة المصدر فحسب، بل يضخ أيضًا حيوية جديدة في صناعة الذكاء الاصطناعي بأكملها. من المرجح أن يؤدي أدائها القوي وميزاتها مفتوحة المصدر إلى تسريع شعبية وابتكار تكنولوجيا توليد الصور بالذكاء الاصطناعي. بالنسبة للمستخدمين العاديين، هذا يعني أننا قد نتمكن قريبًا من تشغيل نماذج توليد الصور المدعومة بالذكاء الاصطناعي على أجهزة الكمبيوتر المنزلية لدينا والتي تنافس أو حتى تتفوق على Midjourney.
عنوان المشروع: https://github.com/black-forest-labs/flux
عنوان المحاكمة: https://replicate.com/black-forest-labs/flux-pro
سير عمل Comfyui: https://comfyanonymous.github.io/ComfyUI_examples/flux/
بشكل عام، يمثل ظهور FLUX.1 مرحلة جديدة في مجال إنشاء صور الذكاء الاصطناعي مفتوحة المصدر، وسيعمل أدائها القوي وميزاتها مفتوحة المصدر على تعزيز شعبية وتطوير تكنولوجيا توليد الصور ذات الذكاء الاصطناعي بشكل كبير. نحن نتطلع إلى جلب FLUX.1 المزيد من المفاجآت في المستقبل!