تسبب أحدث مشروع لتوليد صور من الذكاء الاصطناعي في Alibaba و Comfyui في حجة في مجال توليد صورة منظمة العفو الدولية. إنه لا يرث فقط مزايا InstantId و Pulid ، ولكنه يحقق أيضًا تقدمًا اختراقًا في جودة توليد الصور ، واستقرار ميزة الهوية ، وتجربة المستخدم ، مما يجلب الابتكار إلى المناطق ذات المتطلبات العالية لجودة الصورة مثل التجارة الإلكترونية.
أصدرت Alibaba مؤخرًا مشروع AI Portrait Generation الجديد ECOMID وأطلقت المكون الإضافي للتنفيذ الأصلي Comfyui. حققت هذه الأداة طفرة كبيرة في مسار توليد صور الذكاء الاصطناعي الشهير حاليًا ، وليس فقط وراثة مزايا InstantId و Pulid ، ولكن أيضًا تحقيق الابتكار في مؤشرات رئيسية متعددة.
على المستوى الفني ، تتبنى Ecomid تصميمًا معماريًا مبتكرًا. يعتمد المشروع على مكونات معرف بوليد ومكونات الاهتمام ، مما يقلل بشكل كبير من تداخل تضمين المعرف لتضمين النص من خلال التدريب على فقدان المحاذاة.
أنشأ فريق المشروع بنية IdentityNet استنادًا إلى 2 مليون صورة صورة محددة.
أكبر تسليط الضوء على ecomid هو تأثير توليد الصور الممتاز. لا يمكن للنظام توليد صور أكثر واقعية وجميلة فحسب ، بل يحافظ أيضًا على خصائص هوية مستقرة في تغييرات المظهر مثل العمر ، تصفيفة الشعر ، النظارات ، إلخ.
ميزة أخرى مهمة هي أنها تحتفظ تمامًا بوظيفة النص إلى صورة ، والتي لا تولد خلفيات عالية الجودة فحسب ، بل تقلل أيضًا من درجة الأسلوب ، مما يحسن بشكل كبير واقعية الصورة التي تم إنشاؤها.
على مستوى التطبيق العملي ، يجلب SDXL-ECOMID تجربة مستخدم جديدة إلى مستخدمي COMFYUI. يدعم هذا المكون الإضافي سير عملان: تغيير أساسي وتغيير الوجه ، والعملية بسيطة وبديهية. يحتاج المستخدمون فقط إلى إكمال خطوات التثبيت البسيطة وتكوين مكتبات التبعية اللازمة مثل Insightface و OnNxRuntime للبدء. يدعم النظام إعدادات دقة مرنة ويوصى بها لاستخدام قيمة CFG 6 للحصول على أفضل النتائج.
الأمر الأكثر إثارة للدهشة هو أن SDXL-Ecomid يوفر أيضًا ميزات تخصيص مميزة. يمكن للمستخدمين ضبط معلمات الوزن بشكل مستقل لنموذج IP-Adapter و ControlNet لتحقيق المزيد من التحكم في الصورة. تتيح هذه الميزة للأداة إظهار قدرة كبيرة على التكيف عند التعامل مع متطلبات توليد الصور المعقدة.
لا شك في أن هذا التحديث يضخ حيوية جديدة في مجال توليد صور الذكاء الاصطناعي ، وخاصة بالنسبة لمجالات مثل التجارة الإلكترونية التي تتطلب جودة صورة عالية. من خلال توفير قدرات توليد صور أكثر واقعية وثباتًا ، تقوم ECOMID بإعادة تعريف معايير الجودة لتوليد صور الذكاء الاصطناعي.
عنوان المشروع: https://github.com/alimama-creative/sdxl_ecomid_comfyui
يمثل ظهور Ecomid تقدمًا كبيرًا في تقنية توليد صور AI. نتطلع إلى تطبيق Ecomid في المزيد من الحقول في المستقبل لتعزيز تطوير تكنولوجيا الذكاء الاصطناعي.