تطلق شركة علي بابا FLUX.1-Turbo-Alpha: استنادًا إلى FLUX.1-dev، وتحسين Lora في 8 خطوات

الكاتب：Eve Cole وقت التحديث：2024-12-03 08:16:01

تقارير محرر Downcodes: أطلق فريق Alimama الإبداعي نموذجًا جديدًا لتوليد الصور FLUX.1-Turbo-Alpha، وهو نموذج Lora مقطر من 8 خطوات يعتمد على تدريب نموذج FLUX.1-dev. يستخدم هذا النموذج أداة تمييز متعددة الرؤوس، مما يعمل على تحسين جودة إنشاء الصور بشكل كبير، وهو يدعم وظائف متعددة مثل إنشاء نص إلى صورة، وشبكة التحكم في الإصلاح، وما إلى ذلك، وهو متوافق مع أطر عمل Diffusers وComfyUI، مما يجعله. من السهل على المستخدمين البدء بسرعة. تم تدريب النموذج بشكل تنافسي على الملايين من بيانات الصور عالية الجودة. وتتجاوز النتيجة الجمالية 6.3 والدقة أعلى من 800، مما يضمن إخراج صورة عالية الجودة. والأمر الأكثر إثارة هو أنه سيتم إطلاق إصدار بخطوات أقل في المستقبل.

مؤخرًا، أصدر فريق Alimama الإبداعي FLUX.1-Turbo-Alpha، وهو نموذج لورا لتقطير من 8 خطوات تم تدريبه استنادًا إلى نموذج FLUX.1-dev.

يستخدم هذا النموذج أداة تمييز متعددة الرؤوس، مما يعمل على تحسين جودة التقطير بشكل كبير ويدعم مجموعة متنوعة من التطبيقات المتعلقة بـ FLUX مثل توليد النص إلى الصورة وشبكات التحكم في الإصلاح. يوصي الفريق بضبط مقياس الدليل على 3.5 ومقياس Lora على 1 عند استخدامه، وسيتم إطلاق نسخة ذات عدد أقل من الخطوات في المستقبل.

يمكن استخدام FLUX.1-Turbo-Alpha مباشرةً مع إطار عمل الناشرين. يمكن للمستخدمين تحميل النموذج وإنشاء الصور المطلوبة ببضعة أسطر فقط من التعليمات البرمجية. على سبيل المثال، يمكنك إنشاء مشهد ممتع لحيوان كسلان مبتسم يرتدي سترة جلدية وقبعة رعاة البقر وتنورة منقوشة وقوسًا، ويقف أمام سيارة فولكس فاجن أنيقة مطلية بمناظر المدينة. بمجرد ضبط المعلمات، يمكنك إنشاء صور عالية الجودة بدقة 1024x1024.

بالإضافة إلى ذلك، يتوافق النموذج أيضًا مع ComfyUI ويمكن استخدامه لسير عمل سريع لتحويل النص إلى صورة أو لتحقيق تأثيرات توليد أكثر كفاءة في شبكات التحكم في الإصلاح. ومن خلال هذه التقنية، يمكن للصور التي تم إنشاؤها أن تتبع المخرجات الأصلية عن كثب، مما يحسن التجربة الإبداعية للمستخدم.

عملية التدريب في FLUX.1-Turbo-Alpha مثيرة للإعجاب بنفس القدر. تم تدريب النموذج على أكثر من مليون صورة من مصادر مفتوحة ومصادر داخلية، مع درجة جمالية تزيد عن 6.3، وكلها بدقة أعلى من 800. اعتمد الفريق أسلوب التدريب التنافسي أثناء عملية التدريب لتحسين جودة الصورة وأضاف تصميمًا متعدد الرؤوس لكل طبقة محولات. تم تثبيت مقياس التمهيد أثناء التدريب عند 3.5، وتم ضبط إزاحة الوقت على 3، وتم استخدام الدقة المختلطة bf16، وتم ضبط معدل التعلم على 2e-5، وكان حجم الدفعة 64، وكان حجم الصورة 1024 × 1024.

يمثل إطلاق FLUX.1-Turbo-Alpha تقدمًا آخر لشركة Alimama في مجال توليد الصور، مما يعزز تعميم وتطبيق تكنولوجيا الذكاء الاصطناعي.

مدخل المشروع: https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha

تسليط الضوء على:

يعتمد هذا النموذج على FLUX.1-dev ويستخدم التقطير من 8 خطوات ومميز متعدد الرؤوس لتحسين جودة توليد الصور.

من خلال دعم إنشاء تحويل النص إلى صورة وإصلاح شبكات التحكم، يمكن للمستخدمين بسهولة إنشاء مجموعة متنوعة من المشاهد المثيرة للاهتمام.

تستخدم عملية التدريب التدريب التنافسي، وتتجاوز بيانات التدريب مليون صورة لضمان إخراج النموذج عالي الجودة.

بشكل عام، يوفر FLUX.1-Turbo-Alpha إمكانيات جديدة في مجال توليد الصور بفضل كفاءته العالية وقدراته على توليد الصور عالية الجودة وميزاته المريحة وسهلة الاستخدام. يمكن للمستخدمين المهتمين الانتقال إلى صفحة Hugging Face لتجربة هذا النموذج القوي. سيواصل محرر Downcodes الاهتمام بأحدث التطورات التي حققتها Alibaba في مجال الذكاء الاصطناعي وسيقدم لك المزيد من التقارير المثيرة.