أصدر فريق البحث التابع لمعهد بكين للذكاء الاصطناعي نموذجًا جديدًا لتوليد الصور OmniGen، والذي يكسر قيود الوظيفة الواحدة لأدوات توليد الصور التقليدية. يختلف OmniGen عن نماذج مثل Stable Diffusion، حيث يدمج وظائف متعددة مثل تحويل النص إلى صورة وتحرير الصور ضمن إطار موحد، مما يجعله "شاملاً". سيشرح محرر Downcodes بالتفصيل قوة OmniGen وآفاق تطبيقه.
في الآونة الأخيرة، أطلق فريق البحث التابع لمعهد بكين للذكاء الاصطناعي نموذجًا جديدًا لتوليد الصور يسمى OmniGen.
مشغل شامل لتوليد الصور وتحريرها
بالمقارنة مع أدوات إنشاء الصور السابقة مثل Stable Diffusion، فإن أهم ما يميز OmniGen هو أنه لم يعد يركز فقط على مهمة واحدة، بل أصبح يتمتع بقدرات متعددة:
يمكنه التعامل مع مجموعة متنوعة من مهام إنشاء الصور ضمن إطار موحد: من إنشاء النص إلى إنشاء الصور وتحرير الصور.
وهذا يعني أن المستخدمين يحتاجون فقط إلى توفير كلمات سريعة بسيطة للتحكم في إنشاء الصور والتحرير الدقيق، ولم يعودوا بحاجة إلى استخدام المكونات الإضافية مثل ControlNet وIP-Adapter لضبط تفاصيل الصورة!
تعتمد تقنية AIbase هنا على إعطاء تأثير تفصيلي سريع للتصوير الفوتوغرافي الإبداعي باستخدام كاميرا قديمة الطراز، ويكون التأثير الإجمالي مليئًا بالتفاصيل ويكون التأثير كما يلي:
عبر العديد من الاختبارات، كان أداء OmniGen مثيرًا للإعجاب، حيث كان أداءه على قدم المساواة مع النماذج الأكثر تقدمًا في السوق لإنشاء تحويل النص إلى صورة. في معيار GenEval، استخدم OmniGen 0.1 مليار صورة فقط للتدريب، بينما استخدم SD3 أكثر من مليار صورة.
تعتبر إمكانيات تحرير الصور ممتازة أيضًا، مع القدرة على التحكم بدقة في الصور المصدر وتعليمات التحرير. على سبيل المثال، في مجموعة اختبار EMU-Edit، فهو يتفوق على النماذج المعروفة مثل InstructPix2Pix، بل ويمكن مقارنته بنموذج EMU-Edit الحالي المتطور.
في مهمة الإنشاء المبني على الموضوع، أظهر OmniGen قدرات تخصيص غير عادية وهو مناسب للعديد من المجالات مثل الإبداع الفني وتصميم الإعلانات.
عنوان المحاكمة: https://huggingface.co/spaces/Shitao/OmniGen
الورقة: https://arxiv.org/html/2409.11340v1
يقدم OmniGen اختراقات جديدة في مجال توليد الصور بوظائفه القوية وأدائه الفعال. تعمل طريقة التشغيل البسيطة وسهلة الاستخدام أيضًا على تقليل عتبة إنشاء الصور وتوفر لعدد أكبر من المستخدمين أدوات إبداعية ملائمة. ومن المتوقع أن يكون لدى OmniGen تطبيقات أوسع في المستقبل وأن يعزز التطوير الإضافي لتكنولوجيا توليد صور الذكاء الاصطناعي.