التوثيق | التثبيت | حديقة الحيوان النموذجية | ?تحديث الأخبار | المشاريع الجارية | ?الإبلاغ عن القضايا
الإنجليزية | 简体中文
يسعدنا أن نعلن عن إصدار MMagic v1.0.0 الذي يرث MMEditing وMMGeneration.
بعد التحديثات المتكررة مع إطار عمل OpenMMLab 2.0 ودمجها مع MMGeneration، أصبحت MMEditing أداة قوية تدعم الخوارزميات منخفضة المستوى المستندة إلى كل من GAN وCNN. اليوم، MMEditing تحتضن الذكاء الاصطناعي التوليدي وتتحول إلى مجموعة أدوات AIGC أكثر تقدمًا وشمولاً: MMagic ( M ultimodal A dvanced و G enerative و I ntelligent C reation). سيوفر MMagic دعمًا تجريبيًا أكثر مرونة ومرونة للباحثين وعشاق AIGC، وسيساعدك في رحلة استكشاف AIGC الخاصة بك.
نسلط الضوء على الميزات الجديدة التالية.
1. موديلات جديدة
نحن ندعم 11 نموذجًا جديدًا في 4 مهام جديدة.
2. نموذج الانتشار السحري
بالنسبة لنموذج الانتشار، نقدم "السحر" التالي:
3. ترقية الإطار
باستخدام MMEngine وMMCV لإطار عمل OpenMMLab 2.0، تمت ترقية MMagic إلى الميزات الجديدة التالية:
لقد دعم MMagic جميع المهام والنماذج والمقاييس والخسائر في MMEditing وMMGeneration ويوحد واجهات جميع المكونات بناءً على MMEngine؟.
يرجى الرجوع إلى Changelog.md للحصول على التفاصيل وتاريخ الإصدار.
يرجى الرجوع إلى مستندات الترحيل للانتقال من الإصدار القديم MMEditing 0.x إلى الإصدار الجديد MMagic 1.x.
MMagic ( M ultimodal A dvanced و G enerative و I ntelligent C reation) عبارة عن مجموعة أدوات AIGC متقدمة وشاملة ترث من MMEditing وMMGeneration. وهو عبارة عن صندوق أدوات مفتوح المصدر لتحرير وإنشاء الصور والفيديو يعتمد على PyTorch. إنه جزء من مشروع OpenMMLab.
حاليًا، يدعم MMagic مهام إنشاء/تحرير الصور والفيديو المتعددة.
أحدث النماذج
يوفر MMagic أحدث النماذج التوليدية لمعالجة الصور ومقاطع الفيديو وتحريرها وتجميعها.
تطبيقات قوية وشعبية
يدعم MMagic استعادة الصور الشائعة والمعاصرة، وتحويل النص إلى صورة، وإنشاء تطبيقات ثلاثية الأبعاد، والطلاء، والتلميع، والدقة الفائقة، وتطبيقات التوليد. على وجه التحديد، يدعم MMagic الضبط الدقيق للانتشار المستقر والعديد من تطبيقات النشر المثيرة مثل ControlNet Animation مع SAM. يدعم MMagic أيضًا استيفاء GAN وإسقاط GAN ومعالجة GAN والعديد من تطبيقات GAN الشائعة الأخرى. حان الوقت لبدء رحلة استكشاف AIGC الخاصة بك!
إطار فعال
باستخدام MMEngine وMMCV لإطار عمل OpenMMLab 2.0، يقوم MMagic بتحليل إطار التحرير إلى وحدات مختلفة ويمكن للمرء بسهولة إنشاء إطار عمل محرر مخصص من خلال الجمع بين وحدات مختلفة. يمكننا تحديد عملية التدريب تمامًا مثل اللعب بلعبة Legos وتوفير مكونات واستراتيجيات غنية. في MMagic، يمكنك إكمال عناصر التحكم في عملية التدريب بمستويات مختلفة من واجهات برمجة التطبيقات. وبدعم من MMSeparateDistributedDataParallel، يمكن تنفيذ التدريب الموزع للبنى الديناميكية بسهولة.
العودة إلى جدول المحتويات
ينضم إلينا المزيد والمزيد من المساهمين في المجتمع لتحسين الريبو الخاص بنا. بعض المشاريع الأخيرة ساهم بها المجتمع بما في ذلك:
يتم فتح المشاريع ليسهل على الجميع إضافة مشاريع إلى MMagic.
نحن نقدر كل المساهمات لتحسين MMagic. يرجى الرجوع إلى CONTRIBUTING.md في MMCV وCONTRIBUTING.md في MMEngine لمزيد من التفاصيل حول إرشادات المساهمة.
العودة إلى جدول المحتويات
يعتمد MMagic على PyTorch وMMEngine وMMCV. وفيما يلي خطوات سريعة للتثبيت.
الخطوة 1. قم بتثبيت PyTorch باتباع التعليمات الرسمية.
الخطوة 2. قم بتثبيت MMCV وMMEngine وMMagic باستخدام MIM.
pip3 install openmim
mim install mmcv > =2.0.0
mim install mmengine
mim install mmagic
الخطوة 3. تحقق من تثبيت MMagic بنجاح.
cd ~
python -c " import mmagic; print(mmagic.__version__) "
# Example output: 1.0.0
ابدء
بعد تثبيت MMagic بنجاح، أنت الآن قادر على اللعب مع MMagic! لإنشاء صورة من النص، ما عليك سوى عدة أسطر من الرموز بواسطة MMagic!
from mmagic . apis import MMagicInferencer
sd_inferencer = MMagicInferencer ( model_name = 'stable_diffusion' )
text_prompts = 'A panda is having dinner at KFC'
result_out_dir = 'output/sd_res.png'
sd_inferencer . infer ( text = text_prompts , result_out_dir = result_out_dir )
يرجى الاطلاع على التشغيل السريع والاستدلال للاستخدام الأساسي لـ MMagic.
قم بتثبيت MMagic من المصدر
يمكنك أيضًا تجربة أحدث إصدار مطور بدلاً من الإصدار الثابت عن طريق تثبيت MMagic من المصدر باستخدام الأوامر التالية:
git clone https://github.com/open-mmlab/mmagic.git
cd mmagic
pip3 install -e .
يرجى الرجوع إلى التثبيت للحصول على تعليمات أكثر تفصيلا.
العودة إلى جدول المحتويات
شبكات GAN المشروطة | شبكات GAN غير المشروطة | استعادة الصورة | صورة فائقة الدقة |
|
|
|
|
فيديو فائق الدقة | الاستيفاء الفيديو | تلوين الصورة | ترجمة الصور |
|
|
|
|
في الرسم | حصيرة | تحويل النص إلى صورة (فيديو) | الجيل الواعي ثلاثي الأبعاد |
|
|
|
|
يرجى الرجوع إلى model_zoo لمزيد من التفاصيل.
العودة إلى جدول المحتويات
MMagic هو مشروع مفتوح المصدر يساهم به باحثون ومهندسون من مختلف الكليات والشركات. نتمنى أن يخدم صندوق الأدوات والمعيار مجتمع البحث المتنامي من خلال توفير مجموعة أدوات مرنة لإعادة تنفيذ الأساليب الحالية وتطوير أساليب جديدة خاصة بهم.
نحن نقدر جميع المساهمين الذين ينفذون أساليبهم أو يضيفون ميزات جديدة، وكذلك المستخدمين الذين يقدمون تعليقات قيمة. شكرا لكم جميعا!
العودة إلى جدول المحتويات
إذا كان MMagic مفيدًا لبحثك، فيرجى ذكره على النحو التالي.
@misc { mmagic2023 ,
title = { {MMagic}: {OpenMMLab} Multimodal Advanced, Generative, and Intelligent Creation Toolbox } ,
author = { {MMagic Contributors} } ,
howpublished = { url{https://github.com/open-mmlab/mmagic} } ,
year = { 2023 }
}
@misc { mmediting2022 ,
title = { {MMEditing}: {OpenMMLab} Image and Video Editing Toolbox } ,
author = { {MMEditing Contributors} } ,
howpublished = { url{https://github.com/open-mmlab/mmediting} } ,
year = { 2022 }
}
العودة إلى جدول المحتويات
تم إصدار هذا المشروع بموجب ترخيص Apache 2.0. يرجى الرجوع إلى التراخيص لإجراء فحص دقيق، إذا كنت تستخدم الكود الخاص بنا في الأمور التجارية.
العودة إلى جدول المحتويات
العودة إلى جدول المحتويات