أطلق معهد بكين تشي يوان لأبحاث الذكاء الاصطناعي (BAAI) نموذجًا جديدًا شاملاً للجيل البصري OmniGen، والذي حقق طفرة كبيرة في مجال توليد الصور. بفضل وحدته وبساطته وقدرات نقل المعرفة عبر المهام، يستطيع OmniGen التعامل بكفاءة مع مجموعة متنوعة من مهام إنشاء الصور ضمن إطار واحد، بما في ذلك إنشاء الصور وتحرير الصور والتوليد القائم على الموضوع وتوليد الحالة المرئية إزالة الصور بمهام رؤية الكمبيوتر الكلاسيكية مثل اكتشاف الضوضاء والحافة. سيشرح محرر Downcodes بالتفصيل الوظائف القوية والتشغيل المريح لـ OmniGen.
أعلن معهد بكين تشي يوان لأبحاث الذكاء الاصطناعي (BAAI) مؤخرًا عن إطلاق نموذج جديد شامل للتوليد البصري OmniGen، مما يمثل طفرة كبيرة في مجال توليد الصور. يشتهر نموذج OmniGen بوحدته وبساطته وقدراته على نقل المعرفة عبر المهام، ويمكنه التعامل مع مجموعة متنوعة من مهام إنشاء الصور ضمن إطار واحد، بما في ذلك إنشاء الصور وتحرير الصور والتوليد القائم على الموضوع وتوليد الحالة المرئية. بالإضافة إلى ذلك، فإن OmniGen قادر أيضًا على التعامل مع بعض مهام رؤية الكمبيوتر الكلاسيكية، مثل تقليل تشويش الصورة واكتشاف الحواف، عن طريق تحويل هذه المهام إلى مهام إنشاء صور.
تكمن الميزة الأساسية لـ OmniGen في بنيته المبسطة وتشغيله سهل الاستخدام. يمكن للمستخدمين إكمال مهام إنشاء الصور المعقدة من خلال تعليمات بسيطة دون مكونات إضافية أو خطوات معالجة معقدة. يمكّن هذا التنسيق الموحد للتعلم OmniGen من نقل المعرفة بشكل فعال عبر مهام مختلفة، والتعامل مع المهام والمجالات غير المرئية، وإظهار قدرات جديدة.
لا تقتصر إمكانيات نموذج OmniGen على ما سبق، ولكنها تشمل أيضًا إمكانات معالجة الصور الأساسية مثل تقليل الضوضاء واستخراج الحواف. تم جعل أوزان النموذج والتعليمات البرمجية الخاصة به مفتوحة المصدر حتى يتمكن المستخدمون من استكشاف المزيد من إمكانيات OmniGen بأنفسهم وضبطها حسب الحاجة. أنشأ معهد Zhiyuan للأبحاث مجموعة بيانات موحدة واسعة النطاق ومتنوعة لتوليد الصور X2I، تحتوي على ما يقرب من 100 مليون صورة، والتي ستكون مفتوحة المصدر في المستقبل لتعزيز تطوير مجال توليد الصور العامة.
روابط ذات صلة:
الورقة: https://arxiv.org/pdf/2409.11340
الكود: https://github.com/VectorSpaceLab/OmniGen
العرض التوضيحي: https://huggingface.co/spaces/Shitao/OmniGen
بشكل عام، جلب ظهور نموذج OmniGen إمكانيات جديدة في مجال توليد الصور، ومن المؤكد أن وظائفه القوية وعملياته المريحة ستعزز المزيد من التطوير في هذا المجال. توفر أوزان وأكواد النماذج مفتوحة المصدر أيضًا موارد قيمة للمطورين، ونحن نتطلع إلى قيام OmniGen بجلب الابتكار والاختراقات إلى المزيد من سيناريوهات التطبيقات في المستقبل. سيستمر محرر Downcodes في الاهتمام بآخر التقدم في هذا النموذج وسيقدم لك المزيد من التقارير ذات الصلة.