قامت شركة علي بابا بفتح المصدر الأحدث لنموذج توليد الصور Qwen2vl-Flux. هذا النموذج قوي ويدعم مجموعة متنوعة من العمليات مثل تحرير الصور ودمجها ومزجها، ويمكنه إنشاء صور جديدة متشابهة إلى حد كبير بناءً على الصور أو النصوص المقدمة من المستخدمين. سيأخذك محرر Downcodes لمعرفة المزيد حول نموذج الذكاء الاصطناعي المذهل هذا ومعرفة الوظائف المذهلة التي يتمتع بها. لا يمكنه فقط إنشاء صور متعددة الزوايا ومتعددة المشاعر بناءً على صورة واحدة، بل يمكنه أيضًا دمج الصور والنصوص بذكاء، وحتى تحقيق اندماج سلس بين الصور المختلفة، مثل تكامل الشخصيات أو انتقال المشهد. والأمر الأكثر إثارة للدهشة هو أنه يحتوي أيضًا على وظيفة ترحيل نمط الشبكة، مما يسمح للمستخدمين بضبط الصور وتحقيق المزيد من الإبداع في إنشاء الصور.
أعلنت شركة علي بابا مؤخرًا عن المصدر المفتوح لنموذج توليد الصور المطور حديثًا Qwen2vl-Flux، ولا يحتوي هذا النموذج على وظائف متعددة مثل التحرير والدمج والمزج فحسب، بل يمكنه أيضًا إنشاء صور جديدة متشابهة للغاية عندما يقوم المستخدم بإدخال الصور أو النص. صورة.
يوفر Qwen2vl-Flux وظائف قوية لتغيير الصورة. يحتاج المستخدمون فقط إلى إدخال صورة دون أي مطالبات نصية، ويمكن للنموذج إنشاء عدة صور مماثلة بناءً على الصورة الأصلية. على سبيل المثال، إذا قام المستخدم بتحميل صورة لشخصية ما، فيمكن للنموذج إنشاء تمثيلات للشخصية من زوايا متعددة، مع إظهار وجهات نظر وعواطف مختلفة.
يدعم النموذج أيضًا مزج الصور الموجهة بالنص. عندما يقوم المستخدم بإدخال صورة وإرفاق المطالبات النصية ذات الصلة، يمكن لـ Qwen2vl-Flux دمج الصورة المدخلة ومحتوى النص بذكاء لإنشاء تأثيرات صورة جديدة.
بالإضافة إلى الميزات المذكورة أعلاه، يتمتع Qwen2vl-Flux أيضًا بالقدرة على مزج الصور الموجهة بالصور. يمكن للمستخدمين الجمع بين صورتين مختلفتين لتحقيق تكامل الشخصية أو تحويل المشهد. على سبيل المثال، من خلال الجمع بين شخصية وخلفية أخرى، يمكن للنموذج أن يمزج بين الاثنين بسلاسة لتكوين تأثير مرئي جديد.
تمنح ميزة نقل النمط الشبكي للنموذج المستخدمين تحكمًا تفصيليًا في صورهم. يمكن للمستخدمين تعديل أجزاء معينة من الصورة لتحقيق الإنشاء المحسن. على سبيل المثال، في صورة تُظهر مزيجًا من التكنولوجيا العالية والبيئة الطبيعية، يمكن للمستخدمين إضافة تفاصيل تقنية الإضاءة الحيوية أو تأثير ضباب الصباح في الغابة لإظهار تجربة بصرية أكثر ثراءً.
مدخل المشروع: https://huggingface.co/Djrango/Qwen2vl-Flux
يوفر المصدر المفتوح لـ Qwen2vl-Flux إمكانيات جديدة في مجال إنشاء الصور ويوفر للمطورين أدوات قوية. وظائفها المتنوعة وعملياتها المريحة تجعلها ذات قيمة كبيرة في تحرير الصور وإنشائها، ومن الجدير التطلع إلى قدرتها على إنشاء نتائج أكثر روعة في المستقبل!