DragDiffusion
DragBench Released!
史玉君薛俊豪刘家春潘家春
汉书颜文清张文森YF谭松白
这是一个研究项目,而不是商业产品。用户可以自由地使用此工具创建图像,但他们应该遵守当地法律并以负责任的方式使用它。开发者对用户潜在的误用不承担任何责任。
建议在 Linux 系统的 Nvidia GPU 上运行我们的代码。我们尚未对其他配置进行测试。目前,运行我们的方法需要大约 14 GB GPU 内存。我们将持续优化内存效率
要安装所需的库,只需运行以下命令:
conda env create -f environment.yaml
conda activate dragdiff
首先,在命令行中运行以下命令来启动 gradio 用户界面:
python3 drag_ui.py
您可以查看上面的 GIF,它逐步演示了 UI 的使用。
基本上,它由以下步骤组成:
与 DragDiffusion 算法相关的代码采用 Apache 2.0 许可证。
如果您发现我们的存储库有帮助,请考虑留下一颗星或引用我们的论文:)
@article { shi2023dragdiffusion ,
title = { DragDiffusion: Harnessing Diffusion Models for Interactive Point-based Image Editing } ,
author = { Shi, Yujun and Xue, Chuhui and Pan, Jiachun and Zhang, Wenqing and Tan, Vincent YF and Bai, Song } ,
journal = { arXiv preprint arXiv:2306.14435 } ,
year = { 2023 }
}
如果对此项目有任何疑问,请联系Yujun ([email protected])
这项工作的灵感来自令人惊叹的 DragGAN。 lora 训练代码是根据扩散器的示例修改的。图像样本是从 unsplash、pexels、pixabay 收集的。最后,对所有令人惊叹的开源扩散模型和库表示大力赞扬。