文档 |安装|模型动物园| ?更新新闻|正在进行的项目 | ?报告问题
英语 | 简体中文
我们很高兴地宣布发布继承自 MMEditing 和 MMGeneration 的 MMagic v1.0.0。
经过 OpenMMLab 2.0 框架的迭代更新并与 MMGeneration 合并,MMEditing 已成为支持基于 GAN 和 CNN 的低级算法的强大工具。如今,MMEditing 拥抱生成式 AI,并转变为更先进、更全面的 AIGC 工具包: MMagic (多模态高级、生成和智能创建)。 MMagic将为研究人员和AIGC爱好者提供更加敏捷、灵活的实验支持,为您的AIGC探索之旅助上一臂之力。
我们重点介绍以下新功能。
1. 新车型
我们支持 4 个新任务中的 11 个新模型。
2. 魔法扩散模型
对于扩散模型,我们提供以下“魔法”:
3. 框架升级
通过使用OpenMMLab 2.0框架的MMEngine和MMCV,MMagic在以下新功能上进行了升级:
MMagic支持MMEditing和MMGeneration中的所有任务、模型、指标和损失,并基于MMEngine®统一了所有组件的接口。
请参阅changelog.md了解详细信息和发布历史记录。
请参考迁移文档从旧版本 MMEditing 0.x 迁移到新版本 MMagic 1.x 。
MMagic( M ultimodal A dvanced、 G enerative、 Intelligent Creation )是一个继承自 MMEditing 和 MMGeneration 的先进且全面的 AIGC 工具包。它是一个基于PyTorch的开源图像和视频编辑生成工具箱。它是 OpenMMLab 项目的一部分。
目前,MMagic 支持多种图像和视频生成/编辑任务。
最先进的模型
MMagic 提供最先进的生成模型来处理、编辑和合成图像和视频。
强大且流行的应用程序
MMagic 支持流行和当代的图像修复、文本到图像、3D 感知生成、修复、抠图、超分辨率和生成应用程序。具体来说,MMagic 支持稳定扩散的微调和许多令人兴奋的扩散应用,例如带有 SAM 的 ControlNet Animation。 MMagic 还支持 GAN 插值、GAN 投影、GAN 操作和许多其他流行的 GAN 应用程序。是时候开始您的 AIGC 探索之旅了!
高效的框架
通过使用OpenMMLab 2.0框架的MMEngine和MMCV,MMagic将编辑框架分解为不同的模块,通过组合不同的模块可以轻松构建定制的编辑器框架。我们可以像玩乐高一样定义训练过程,并提供丰富的组件和策略。在MMagic中,您可以通过不同级别的API完成对训练过程的控制。在MMSeparateDistributedDataParallel的支持下,可以轻松实现动态架构的分布式训练。
?返回目录
越来越多的社区贡献者加入我们,让我们的仓库变得更好。最近的一些项目是由社区贡献的,包括:
打开Projects是为了让大家更方便的向MMagic添加项目。
我们感谢所有为改进 MMagic 所做的贡献。有关贡献指南的更多详细信息,请参阅 MMCV 中的 CONTRIBUTING.md 和 MMEngine 中的 CONTRIBUTING.md。
?返回目录
MMagic 依赖于 PyTorch、MMEngine 和 MMCV。以下是快速安装步骤。
步骤 1.按照官方说明安装 PyTorch。
步骤 2.使用 MIM 安装 MMCV、MMEngine 和 MMagic。
pip3 install openmim
mim install mmcv > =2.0.0
mim install mmengine
mim install mmagic
步骤 3.验证 MMagic 是否已成功安装。
cd ~
python -c " import mmagic; print(mmagic.__version__) "
# Example output: 1.0.0
入门
成功安装MMagic后,现在你就可以玩MMagic了! MMagic只需要几行代码就可以从文本生成图像!
from mmagic . apis import MMagicInferencer
sd_inferencer = MMagicInferencer ( model_name = 'stable_diffusion' )
text_prompts = 'A panda is having dinner at KFC'
result_out_dir = 'output/sd_res.png'
sd_inferencer . infer ( text = text_prompts , result_out_dir = result_out_dir )
MMagic的基本使用方法请参见快速运行和推理。
从源代码安装 MMagic
您还可以通过使用以下命令从源代码安装 MMagic 来试验最新开发的版本而不是稳定版本:
git clone https://github.com/open-mmlab/mmagic.git
cd mmagic
pip3 install -e .
请参阅安装以获取更详细的说明。
?返回目录
条件 GAN | 无条件 GAN | 图像修复 | 图像超分辨率 |
|
|
|
|
视频超分辨率 | 视频插值 | 图像着色 | 图像翻译 |
|
|
|
|
修复 | 消光 | 文字转图像(视频) | 3D 感知一代 |
|
|
|
|
请参阅 model_zoo 了解更多详细信息。
?返回目录
MMagic 是一个开源项目,由来自各个学院和公司的研究人员和工程师贡献。我们希望工具箱和基准能够通过提供灵活的工具包来重新实现现有方法并开发自己的新方法,从而为不断发展的研究社区服务。
我们感谢所有实施其方法或添加新功能的贡献者,以及提供宝贵反馈的用户。谢谢大家!
?返回目录
如果MMagic对您的研究有帮助,请在下面引用。
@misc { mmagic2023 ,
title = { {MMagic}: {OpenMMLab} Multimodal Advanced, Generative, and Intelligent Creation Toolbox } ,
author = { {MMagic Contributors} } ,
howpublished = { url{https://github.com/open-mmlab/mmagic} } ,
year = { 2023 }
}
@misc { mmediting2022 ,
title = { {MMEditing}: {OpenMMLab} Image and Video Editing Toolbox } ,
author = { {MMEditing Contributors} } ,
howpublished = { url{https://github.com/open-mmlab/mmediting} } ,
year = { 2022 }
}
?返回目录
该项目是在 Apache 2.0 许可证下发布的。如果您将我们的代码用于商业用途,请参阅许可证进行仔细检查。
?返回目录
?返回目录