قامت شركة علي بابا بفتح المصدر الأحدث لنموذج توليد الصور Qwen2vl-Flux، الذي يتمتع بوظائف قوية لتحرير الصور ودمجها ومزجها ويمكنه إنشاء صور جديدة متشابهة إلى حد كبير بناءً على الصور أو النصوص المقدمة من المستخدمين. وهو يدعم أوضاعًا متعددة، مثل إنشاء صور مماثلة تعتمد فقط على الصور، ومزج الصور الموجهة بالنص، ومزج الصور الموجهة بالصور. ويمكن للمستخدمين التحكم بمرونة في عملية إنشاء الصور لتحقيق إنشاء صور محسّن. لقد جلب ظهور Qwen2vl-Flux إمكانيات جديدة إلى مجال توليد الصور، كما أن ميزاته مفتوحة المصدر تسهل على المزيد من المطورين والباحثين استخدامه. ستقدم هذه المقالة بالتفصيل الوظائف الرئيسية وسيناريوهات تطبيق Qwen2vl-Flux.
أعلنت شركة علي بابا مؤخرًا عن المصدر المفتوح لنموذج توليد الصور المطور حديثًا Qwen2vl-Flux، ولا يحتوي هذا النموذج على وظائف متعددة مثل التحرير والدمج والمزج فحسب، بل يمكنه أيضًا إنشاء صور جديدة متشابهة للغاية عندما يقوم المستخدم بإدخال الصور أو النص. صورة.
يوفر Qwen2vl-Flux وظائف قوية لتغيير الصورة. يحتاج المستخدمون فقط إلى إدخال صورة دون أي مطالبات نصية، ويمكن للنموذج إنشاء عدة صور مماثلة بناءً على الصورة الأصلية. على سبيل المثال، إذا قام المستخدم بتحميل صورة لشخصية ما، فيمكن للنموذج إنشاء تمثيلات للشخصية من زوايا متعددة، مع إظهار وجهات نظر وعواطف مختلفة.
يدعم النموذج أيضًا مزج الصور الموجهة بالنص. عندما يقوم المستخدم بإدخال صورة وإرفاق المطالبات النصية ذات الصلة، يمكن لـ Qwen2vl-Flux دمج الصورة المدخلة ومحتوى النص بذكاء لإنشاء تأثيرات صورة جديدة.
بالإضافة إلى الميزات المذكورة أعلاه، يتمتع Qwen2vl-Flux أيضًا بالقدرة على مزج الصور الموجهة بالصور. يمكن للمستخدمين الجمع بين صورتين مختلفتين لتحقيق تكامل الشخصية أو تحويل المشهد. على سبيل المثال، من خلال الجمع بين شخصية وخلفية أخرى، يمكن للنموذج أن يمزج بين الاثنين بسلاسة لتكوين تأثير مرئي جديد.
تمنح ميزة نقل النمط الشبكي للنموذج المستخدمين تحكمًا تفصيليًا في صورهم. يمكن للمستخدمين تعديل أجزاء معينة من الصورة لتحقيق الإنشاء المحسن. على سبيل المثال، في صورة تُظهر مزيجًا من التكنولوجيا العالية والبيئة الطبيعية، يمكن للمستخدمين إضافة تفاصيل تقنية الإضاءة الحيوية أو تأثير ضباب الصباح في الغابة لإظهار تجربة بصرية أكثر ثراءً.
مدخل المشروع: https://huggingface.co/Djrango/Qwen2vl-Flux
تسليط الضوء على:
Qwen2vl-Flux مفتوح المصدر ويتمتع بقدرات قوية على إنشاء الصور وتحريرها.
يدعم تغييرات الصورة ومزج الصور الموجهة بالنص لإنشاء تأثيرات مرئية جديدة.
يتم توفير مزج الصور الموجه بالصور وترحيل نمط الشبكة، مما يسمح للمستخدمين بالتحكم الدقيق.
بشكل عام، حقق Qwen2vl-Flux تقدمًا كبيرًا في مجال إنشاء الصور وتحريرها بوظائفه القوية وميزاته مفتوحة المصدر، ومن الجدير التطلع إلى تطبيقاته وتطويره في المستقبل. يمكن للقراء المهتمين زيارة مدخل المشروع للتجربة والتعلم.