Awesome Diffusion Models下载 - Awesome Diffusion Models源代码下载

该存储库包含有关扩散模型的资源和论文的集合。

由于页面限制，本页可能无法包含所有信息，请参阅此页。

内容

资源
- 介绍性帖子
- 介绍性论文
- 介绍视频
- 入门讲座
- 教程和 Jupyter Notebook
文件
- 民意调查
- 想象
  - 一代
  - 分类
  - 分割
  - 图像翻译
  - 反问题
  - 医学影像
  - 多模式学习
  - 3D视觉
  - 对抗性攻击
  - 杂项
- 声音的
  - 一代
  - 转换
  - 强化
  - 分离
  - 文字转语音
  - 杂项
- 自然语言
- 表格和时间序列
  - 一代
  - 预测
  - 插补
  - 杂项
- 图形
  - 一代
  - 分子和材料生成
- 强化学习
- 理论
- 应用领域

资源

介绍性帖子

⏩ 扩散快进：01-扩散理论
米科拉·切尔考斯基 (@mikonvergence)
[网站]
2023 年 2 月 4 日

扩散模型如何工作：从头开始的数学
塞尔吉奥斯·卡拉吉纳科斯、尼古拉斯·阿达洛格鲁
[网站]
2022 年 9 月 24 日

变分扩散损失的路径
亚历克斯·阿莱米
[网站] [Colab]
2022 年 9 月 15 日

带注释的扩散模型
尼尔斯·罗格、卡希夫·拉苏尔
[网站]
2022 年 6 月 6 日

最近兴起的基于扩散的模型
马切伊·多马加拉
[网站]
2022 年 6 月 6 日

机器学习扩散模型简介
瑞安·奥康纳
[网站]
2022 年 5 月 12 日

改进扩散模型作为 GAN 的替代方案
阿拉什·瓦赫达特和卡斯滕·克雷斯
[网站-第 1 部分] [网站-第 2 部分]
2022 年 4 月 26 日

扩散概率模型简介
阿扬·达斯
[网站]
2021 年 12 月 4 日

深度生成建模简介：基于扩散的深度生成模型
雅库布·托姆扎克
[网站]
2021 年 8 月 30 日

什么是扩散模型？
翁莉莲
[网站]
2021 年 7 月 11 日

扩散模型作为 VAE 的一种
安格斯·特纳
[网站]
2021 年 6 月 29 日

通过估计数据分布的梯度进行生成建模
杨松
[网站]
2021 年 5 月 5 日

介绍性论文

理解扩散模型：统一的视角
罗嘉文
arXiv 2022。[论文]
2022 年 8 月 25 日

如何训练基于能量的模型
杨松，Diederik P. Kingma
arXiv 2022。[论文]
2021 年 1 月 9 日

介绍视频

⏩ 扩散快进
米科拉·切尔考斯基 (@mikonvergence)
[视频]
2023 年 3 月 4 日

在 PyTorch 中从头开始建立扩散模型
深度查找器
[视频]
2022 年 7 月 18 日

扩散模型|论文解释 |数学解释
异常值
[视频]
2022 年 6 月 6 日

什么是扩散模型？
阿里·塞夫
[视频]
2022 年 4 月 20 日

扩散模型解释
AI 与 Letitia 喝咖啡休息
[视频]
2022 年 3 月 23 日

入门讲座

基于去噪扩散的生成建模：基础和应用
卡斯滕·克莱斯、高瑞琪、Arash Vahdat
[页]
2022 年 6 月 19 日

扩散概率模型
Jascha Sohl-Dickstein，麻省理工学院 6.S192 - 讲座 22
[视频]
2022 年 4 月 19 日

教程和 Jupyter Notebook

⏩ DiffusionFastForward：在 Colab 中从头开始训练
米科拉·切尔考斯基 (@mikonvergence)
[Github] [笔记本]

初学者扩散
奥桑西加
[Github]

超越扩散：什么是个性化图像生成以及如何定制图像合成？
J·拉菲德·西迪基
[Github] [中]

扩散_模型_教程
菲利普·MB
[Github]

分数扩散模型
郑智宪
[Github]

扩散模型的最小实现
VS赫瓦格
[Github]

扩散_教程
孙林爱
[Github]

去噪扩散概率模型
酸-伊康
[Github]

蜈蚣扩散
扎尔林
[笔记本]

Deforum 稳定扩散
德福鲁姆
[笔记本]

稳定扩散插值
没有任何
[笔记本]

Keras Stable Diffusion：GPU 入门示例
没有任何
[笔记本]

休明贾克斯扩散
胡明艺术
[笔记本]

迪斯科扩散
蒸馏器
[笔记本]

简化的迪斯科扩散
恩特麦克
[笔记本]

WAS 的迪斯科扩散 - 肖像生成器游乐场
瓦斯野人
[笔记本]

扩香器 - 拥抱脸部
拥抱脸
[笔记本]

文件

民意调查

视频传播模型综述
星振、冯其军、陈浩然、戴奇、胡涵、徐航、吴祖轩和蒋玉刚arXiv 2023。 [论文]
2023 年 10 月 16 日

视觉计算扩散模型的最新技术
Ryan Po、王一凡、Vladislav Golyanik、Kfir Aberman、Jonathan T. Barron、Amit H. Bermano、Eric Ryan Chan、Tali Dekel、Aleksander Holynski、Angjoo Kanazawa、C. Karen Liu、Lingjie Liu、Ben Mildenhall、Matthias Nießner、Björn奥默、克里斯蒂安·西奥巴尔特、彼得·旺卡、戈登·韦茨斯坦
arXiv 2023。[论文]
2023 年 10 月 11 日

显而易见的记忆：扩散模型与联想记忆之间惊人相似的调查
本杰明·胡佛、亨德里克·斯特罗伯特、德米特里·克罗托夫、朱迪·霍夫曼、Zsolt Kira、Duen Horng Chau
arXiv 2023。[论文]
2023 年 9 月 28 日

基于扩散的图像生成模型综述：问题及其解决方案
张天一、王政、黄晶、Mohiuddin Muhammad Tasnim、石伟
arXiv 2023。[论文]
2023 年 8 月 25 日

用于图像恢复和增强的扩散模型——综合调查
李鑫、任玉林、金鑫、兰翠玲、王星瑞、曾文军、王新超、陈志博
arXiv 2023。[论文]
2023 年 8 月 18 日

结构化数据生成扩散模型的综合综述
具熙俊、金图恩
arXiv 2023。[论文]
2023 年 6 月 7 日

关于扩散模型的设计基础：调查
Ziyi Chang、George A. Koulieris、Hubert PH Shum
arXiv 2023。[论文]
2023 年 6 月 7 日

NLP 中的扩散模型：一项调查
邹浩、金在明、姜东烨
arXiv 2023。[论文]
2023 年 5 月 24 日

时间序列应用的扩散模型：调查
林乐泉、李正坤、李瑞坤、李旭亮、高俊斌
arXiv 2023。[论文]
2023 年 5 月 1 日

扩散模型知识蒸馏的综合综述
罗伟建
arXiv 2023。[论文]
2023 年 4 月 9 日

图扩散模型综述：分子、蛋白质和材料科学中的生成人工智能
张孟春、Maryam Qamar、Taegoo Kang、Yuna Jung、张晨爽、Sung-Ho Bae、Chaoning 张
arXiv 2023。[论文]
2023 年 4 月 4 日

用于语音合成的音频扩散模型：生成人工智能中文本到语音和语音增强的调查
张晨爽、张超宁、郑盛、张孟春、Maryam Qamar、Sung-Ho Bae、In So Kweon
arXiv 2023。[论文]
2023 年 3 月 23 日

NLP 中的扩散模型：一项调查
朱元松、赵宇
arXiv 2023。[论文]
2023 年 3 月 14 日

生成人工智能中的文本到图像扩散模型：一项调查
张晨爽、张超宁、张孟春、仁素权
arXiv 2023。[论文]
2023 年 3 月 14 日

非自回归文本生成的扩散模型：一项调查
李一凡、周昆、赵鑫、温继荣
arXiv 2023。[论文]
2023 年 3 月 12 日

生物信息学中的扩散模型：深度学习革命的新浪潮正在发生
郭志业、刘健、王艳丽、陈梦瑞、王多林、徐东、程建林
arXiv 2023。[论文]
2023 年 2 月 13 日

图上的生成扩散模型：方法与应用
范文琪、刘成毅、刘云清、李佳桐、李航、刘辉、唐吉良、李庆
arXiv 2023。[论文]
2023 年 2 月 6 日

医学图像分析的扩散模型：综合调查
Amirhossein Kazerouni、Ehsan Khodapanah Aghdam、Moein Heidari、Reza Azad、Mohsen Fayyaz、Ilker Hacihaliloglu、Dorit Merhof
arXiv 2022。 [论文] [Github]
2022 年 11 月 14 日

有效的视觉扩散模型：一项调查
安瓦尔·乌尔哈克、纳维德·阿赫塔尔、甘纳·波格雷布纳
arXiv 2022。[论文]
2022 年 10 月 7 日

视觉扩散模型：一项调查
弗洛里内尔-阿林·克罗伊托鲁、弗拉德·洪德鲁、拉杜·图多尔·约内斯库、穆巴拉克·沙阿
arXiv 2022。[论文]
2022 年 9 月 10 日

生成扩散模型综述
曹汉群、谭成、高张阳、陈光勇、恒鹏安、李斯坦
arXiv 2022。[论文]
2022 年 9 月 6 日

扩散模型：方法和应用的综合综述
杨凌、张志龙、洪申达、张文涛
arXiv 2022。[论文]
2022 年 9 月 2 日

想象

一代

DiffEnc：使用学习编码器进行变分扩散
比阿特丽克斯·MG·尼尔森、安德斯·克里斯滕森、安德里亚·迪塔迪、奥勒·温瑟
arXiv 2023。[论文]
2023 年 10 月 30 日

利用扩散模型提供的无限数据计划升级 VAE 训练
蒂姆·肖、约翰内斯·曾恩、罗伯特·巴姆勒
arXiv 2023。[论文]
2023 年 10 月 30 日

成功地将彩票假设应用于扩散模型
蒋超、辉博、刘博涵、大燕
arXiv 2023。[论文]
2023 年 10 月 28 日

无噪音分数蒸馏
奥伦·卡齐尔、奥尔·帕塔什尼克、丹尼尔·科恩-奥尔、丹尼·利辛斯基
arXiv 2023。[论文]
2023 年 10 月 26 日

生成扩散模型的统计热力学
卢卡·安布罗焦尼
arXiv 2023。[论文]
2023 年 10 月 26 日

通过图像和噪声的同时估计改进去噪扩散模型
张振凯、克里斯塔·A·埃因格、汤姆·德拉蒙德
arXiv 2023。[论文]
2023 年 10 月 26 日

分层半隐式变分推理及其在扩散模型加速中的应用
余隆林、谢天宇、朱宇、杨童、张翔宇、张成
arXiv 2023。 [论文] [Github]
2023 年 10 月 26 日

RePoseDM：用于姿势引导图像合成的循环姿势对齐和梯度指导
阿南特·坎德尔瓦尔
arXiv 2023。[论文]
2023 年 10 月 24 日

训练一致性模型的改进技术
杨松、普拉芙拉·达里瓦尔
arXiv 2023。[论文]
2023 年 10 月 22 日

ScaleLong：通过缩放网络长跳跃连接实现更稳定的扩散模型训练
黄中展、周潘、严水成、林亮
NeurIPS 2023。 [论文] [Github]
2023 年 10 月 20 日

粒子引导：使用扩散模型的非 IID 多样化采样
加布里埃莱·科尔索、徐逸伦、瓦伦丁·德·博尔托利、雷吉娜·巴兹莱、托米·雅科拉
arXiv 2023。 [论文] [Github]
2023 年 10 月 19 日

闭式扩散模型
克里斯托弗·斯卡维利斯、海兹·萨兹·德·奥卡里兹·博尔德、贾斯汀·所罗门
arXiv 2023。[论文]
2023 年 10 月 19 日

阐明分类器引导扩散生成的设计空间
马家俊、胡天阳、王文嘉、孙家成
arXiv 2023。 [论文] [Github]
2023 年 10 月 17 日

BayesDiff：通过贝叶斯推理估计扩散中的像素级不确定性
寇思琪、甘雷、王德全、李崇轩、邓志杰
arXiv 2023。[论文]
2023 年 10 月 17 日

预训练扩散模型 h 空间中可解释方向的无监督发现
张子健、刘路平.林志杰、朱亦辰、赵周
arXiv 2023。[论文]
2023 年 10 月 15 日

使用时间步长对齐器实现更准确的扩散模型加速
夏孟飞、沉宇军、雷长松、周宇、易冉、赵德利、王文平、刘永进
arXiv 2023。[论文]
2023 年 10 月 14 日

使用扩散模型进行看不见的图像合成
野朱、吴宇、邓志伟、Olga Russakovsky、严岩
arXiv 2023。[论文]
2023 年 10 月 13 日

消除扩散模型训练的偏差
胡宇、沉力、黄杰、周满、李宏生、赵峰
arXiv 2023。[论文]
2023 年 10 月 12 日

神经扩散模型
格里戈里·巴托什、德米特里·维特罗夫、克里斯蒂安·A·内塞斯
arXiv 2023。[论文]
2023 年 10 月 12 日

用于扩散生成模型的高效积分器
库沙格拉·潘迪、玛娅·鲁道夫、斯蒂芬·曼特
arXiv 2023。[论文]
2023 年 10 月 11 日

学习可堆叠和可跳过的乐高积木，以实现高效、可重新配置和可变分辨率扩散建模
郑黄杰、王振东、袁建波、宁广汉、何鹏程、尤全增、杨红霞、周明远
arXiv 2023。[论文]
2023 年 10 月 10 日

语言模型战胜扩散——分词器是视觉生成的关键
Lijun Yu, José Lezama, Nitesh B. Gundavarapu, Luca Versari, Kihyuk Sohn, David Minnen, Yong Cheng, Agrim Gupta, Xiuye Gu, Alexander G. Hauptmann, Boqing Kong, Ming-Hsuan Yang, Irfan Essa, David A. Ross,渌江
arXiv 2023。 [论文] [Github]
2023 年 10 月 9 日

扩散模型中再现性和一致性的出现
张慧杰、周晋帆、路一夫、郭敏哲、沉丽月、曲庆
arXiv 2023。[论文]
2023 年 10 月 8 日

DiffNAS：通过提示更好的架构来引导扩散模型
李文浩、苏秀、游善、王飞、陈茜、徐畅
arXiv 2023。[论文]
2023 年 10 月 7 日

观察引导扩散概率模型
Junoh Kang、Jinyoung Choi、Sungik Choi、Bohyung Han
arXiv 2023。[论文]
2023 年 10 月 6 日

潜在一致性模型：通过几步推理合成高分辨率图像
罗思勉、谭益勤、黄龙波、李健、赵航
arXiv 2023。[论文]
2023 年 10 月 6 日

去噪扩散步进感知模型
杨帅、陈玉康、王洛洲、刘书、陈英聪
arXiv 2023。[论文]
2023 年 10 月 5 日

EfficientDM：低位扩散模型的高效量化感知微调
何叶飞、刘静、吴伟嘉、周宏、庄博涵
arXiv 2023。[论文]
2023 年 10 月 5 日

使用扩散摊销 MCMC 学习基于能量的先验模型
于佩玉、朱亚轩、谢思睿、马小健、高瑞琪、朱松春、吴英念
NeurIPS 2023。 [论文] [Github]
2023 年 10 月 5 日

论扩散模型中的记忆
顾向明、杜超、庞天宇、李崇轩、林敏、王晔
arXiv 2023。 [论文] [Github]
2023 年 10 月 4 日

使用分组扩散过程生成顺序数据
李尚允、李佳煐、金贤秀、金俊浩、Uh Youngjung
arXiv 2023。[论文]
2023 年 10 月 2 日

一致性轨迹模型：学习概率流 ODE 扩散轨迹
Dongjun Kim、Chieh-Hsin Lai、Wei-Hsiang Liao、Naoki Murata、Yuhta Takida、Toshimitsu Uesaka、Yutong He、Yuki Mitsufuji、Stefano Ermon
arXiv 2023。[论文]
2023 年 10 月 1 日

通过桥接生成和分割完成视觉对象
李翔、陈银鹏、林中庆、Rita Singh、Bhiksha Raj、刘子成
arXiv 2023。[论文]
2023 年 10 月 1 日

通过对比自我监督和潜在扩散从大脑活动中解码真实图像
孙靖远、李明晓、玛丽-弗朗辛·莫恩斯
arXiv 2023。[论文]
2023 年 9 月 30 日

FashionFlow：利用扩散模型从静态图像合成动态时尚视频
Tasin Islam、Alina Miron、刘晓辉、李永民
arXiv 2023。[论文]
2023 年 9 月 29 日

去噪扩散桥模型
周林奇、楼亚伦、萨马尔·卡纳、斯特凡诺·埃尔蒙
arXiv 2023。[论文]
2023 年 9 月 29 日

DeeDiff：动态不确定性感知提前退出加速扩散模型生成
唐胜坤、王亚庆、丁才文、梁毅、李耀、徐东宽
arXiv 2023。[论文]
2023 年 9 月 29 日

将扩散模型的 ODE 求解器提炼为更小的步骤
Sanghwan Kim、Hao Tang、Fisher Yu
arXiv 2023。[论文]
2023 年 9 月 28 日

用于无监督图像生成和分割的分解扩散架构
心原，迈克尔·梅尔
arXiv 2023。[论文]
2023 年 9 月 27 日

生成埃舍尔网格
诺姆·艾格曼、蒂博·格鲁埃克斯
arXiv 2023。[论文]
2023 年 9 月 25 日

软混合去噪：超越扩散模型的表达瓶颈
李阳明、Boris van Breugel、Mihaela van der Schaar
arXiv 2023。[论文]
2023 年 9 月 25 日

GLOBER：通过 GLOBal Guided Video DecodeR 生成相干非自回归视频
孙明祯、王伟宁、秦子涵、孙佳慧、陈思涵、刘静
arXiv 2023。 [论文] [Github]
2023 年 9 月 23 日

生成建模的分数不匹配
叶森茂、刘飞
arXiv 2023。[论文]
2023 年 9 月 20 日

广义概率扩散尺度空间
帕斯卡·彼得
arXiv 2023。[论文]
2023 年 9 月 15 日

生成图像动力学
李正奇、理查德·塔克、诺亚·斯内夫利、亚历山大·霍林斯基
arXiv 2023。[论文][项目]
2023 年 9 月 14 日

贝塔扩散
周明远、陈天琪、王振东、郑黄杰
NeurIPS 2023。[论文]
2023 年 9 月 14 日

适应和扩散：通过潜在扩散模型进行样本自适应重建
扎兰·法比安、伯克·蒂纳兹、迈赫迪·索尔塔诺科塔比
arXiv 2023。[论文]
2023 年 9 月 12 日

阐明扩散模型的扩展逆时 SDE 的解空间
崔勤鹏、张歆艺、卢宗庆、廖庆民
arXiv 2023。[论文]
2023 年 9 月 12 日

通过协作扩散恢复可能性学习基于能量的模型
朱亚轩、谢建文、吴英年、高瑞琪
arXiv 2023。[论文]
2023 年 9 月 10 日

中继扩散：统一跨分辨率的扩散过程以进行图像合成
滕佳彦、郑文迪、丁明、洪文一、王健桥、杨卓一、唐杰
arXiv 2023。[论文]
2023 年 9 月 4 日

用于图像合成的梯度域扩散模型
宫元浩
arXiv 2023。[论文]
2023 年 9 月 5 日

用于视频外绘的分层蒙版 3D 扩散模型
范凡达、郭超旭、龚立同、王彪、葛铁正、蒋雨宁、罗春杰、詹剑峰
arXiv 2023。 [论文] [Github]
2023 年 9 月 5 日

具有确定性归一化流先验的扩散模型
莫森·赞德、阿里·埃特马德、迈克尔·格林斯潘
arXiv 2023。 [论文] [Github]
2023 年 9 月 3 日

扩散惯性姿势：从任意稀疏 IMU 配置重建人体运动
Tom Van Wouwe、Seunghwan Lee、Antoine Falisse、Scott Delp、C. Karen Liu
AAAI 2024。 [论文]
2023 年 8 月 31 日

通过神经符号约束条件化基于评分的生成模型
达维德·斯卡索拉、塞巴斯蒂亚诺·萨卡尼、吉内芙拉·卡博内、卢卡·博尔托鲁西
arXiv 2023。[论文]
2023 年 8 月 31 日

阐明扩散模型中的曝光偏差
宁芒、李明晓、苏建林、Albert Ali Salah、Itir Onal Ertugrul
arXiv 2023。[论文]
2023 年 8 月 29 日

残差去噪扩散模型
刘家伟、王强、范慧杰、王一农、唐彦东、曲良琼
arXiv 2023。 [论文] [Github]
2023 年 8 月 25 日

通过对抗性噪声在扩散模型中进行高效迁移学习
王希宇、林白炯、刘道昌、徐畅
arXiv 2023。[论文]
2023 年 8 月 23 日

使用自适应动量采样器增强扩散模型
王希宇、丁英东、刘道昌、徐昌
arXiv 2023。[论文]
2023 年 8 月 23 日

Make-It-4D：从单个图像合成一致的长期动态场景视频
廖申、李星怡、孙惠强、彭觉文、可贤、曹志国、林国盛
ACM MM 2023。[论文]
2023 年 8 月 20 日

尖峰扩散：具有尖峰神经网络的矢量量化离散扩散模型
刘明轩、文睿、陈红
arXiv 2023。[论文]
2023 年 8 月 20 日

SciRE-Solver：通过带有递归导数估计的分数被积函数求解器对扩散概率模型进行有效采样
李世贵、陈伟、曾德禄
arXiv 2023。[论文]
2023 年 8 月 15 日

扩散模型采样指数积分器的改进阶次分析与设计
张勤生、宋家明、陈永新
arXiv 2023。[论文]
2023 年 8 月 4 日

用于高分辨率图像合成的修补去噪扩散模型
丁正、张梦琪、吴家俊、屠卓文
arXiv 2023。[论文]
2023 年 8 月 2 日

用于去噪扩散概率模型的空间频率 U-Net
袁欣、李林杰、王剑锋、杨正元、林凯文、刘子成、王丽娟
arXiv 2023。[论文]
2023 年 7 月 27 日

使用扩散合成蜡染图案——生成对抗网络
One Octadion、Novanto Yudistira、Diva Kurnianingtyas
arXiv 2023。[论文]
2023 年 7 月 22 日

DPM-OT：一种基于最优传输的新型扩散概率模型
李泽增、李胜浩、王展鹏、雷娜、罗忠轩、顾险峰
arXiv 2023。 [论文] [Github]
2023 年 7 月 21 日

具有动量的扩散采样可减少发散伪影
Suttisak Wizadwongsa、Worameth Chinchuthakun、Pramook Khungurn、Amit Raj、Supasorn Suwajanakorn
arXiv 2023。[论文]
2023 年 7 月 20 日

潜在空间中的流匹配
Quan Dao、Hao Phung、Binh Nguyen、Anh Tran
arXiv 2023。[论文][项目]
2023 年 7 月 17 日

扩散模型中的流形引导采样以生成无偏图像
苏兴哲、强文文、宋泽恩、高航、吴凤阁、郑昌文
arXiv 2023。[论文]
2023 年 7 月 17 日

复杂性很重要：重新思考生成建模的潜在空间
胡天阳、陈飞、王浩南、李嘉伟、王文嘉、孙家成、李振国
arXiv 2023。[论文]
2023 年 7 月 17 日

协作分数蒸馏以实现一致的视觉合成
Subin Kim、Kyungmin Lee、June Suk Choi、Jongheon Jeong、Kihyuk Sohn、Jinwoo Shin
arXiv 2023。[论文][项目][Github]
2023 年 7 月 4 日

ProtoDiffusion：带有原型学习的无分类器扩散指导
Gulcin Baykal、Halil Faruk Karagoz、Taha Binhuraib、Gozde Unal
arXiv 2023。[论文]
2023 年 7 月 4 日

SDXL：改进高分辨率图像合成的潜在扩散模型
达斯汀·波德尔、锡安·英格利希、凯尔·莱西、安德烈亚斯·布拉特曼、蒂姆·多克霍恩、乔纳斯·穆勒、乔·佩纳、罗宾·隆巴赫
arXiv 2023。 [论文] [Github]
2023 年 7 月 4 日

用于时间一致的人体动画的双向时间扩散模型
Tserendorj Adiya、Sanghun Kim、Jung Eun Lee、Jae Shin Yoon、Hwasup Lim
arXiv 2023。[论文]
2023 年 7 月 2 日

尖峰去噪扩散概率模型
曹佳航、王自清、郭汉忠、程浩、张强、徐人静
arXiv 2023。[论文]
2023 年 6 月 29 日

DomainStudio：使用有限数据微调扩散模型以生成域驱动图像
朱靖远、马慧敏、陈建生、袁建
arXiv 2023。[论文]
2023 年 6 月 25 日

具有显式转移概率的解耦扩散模型
黄宇航、秦正、刘新旺、徐凯
arXiv 2023。[论文]
2023 年 6 月 23 日

使用扩散模型对单幅图像进行连续布局编辑
张志远、黄志同、廖静
arXiv 2023。[论文]
2023 年 6 月 22 日

半隐式去噪扩散模型 (SIDDM)
徐彦武、龚明明、谢少安、魏巍、Matthias Grundmann、kayhan Batmanghelich、侯廷波
arXiv 2023。[论文]
2023 年 6 月 21 日

消除扩散模型中的 Lipschitz 奇点
杨占涛、冯瑞丽、张涵、沉宇军、朱凯、黄良华、张逸飞、刘宇、赵德利、周静仁、程帆
arXiv 2023。[论文]
2023 年 6 月 20 日

GD-VDM：生成深度以实现更好的基于扩散的视频生成
阿里尔·拉皮德、伊丹·阿奇图维、利奥尔·布拉查、伊桑·费塔亚
arXiv 2023。[论文]
2023 年 6 月 19 日

使用扩散模型进行图像协调
李家杰、王健、王晨、熊金军
arXiv 2023。[论文]
2023 年 6 月 17 日

使用去噪辅助训练扩散分类器
Chandramouli Sastry、Sri Harsha Dumpala、Sageev Oore
arXiv 2023。[论文]
2023 年 6 月 15 日

具有显式抽象控制的条件人体草图合成
陈达彦
arXiv 2023。[论文]
2023 年 6 月 15 日

使用 Masked Transformer 快速训练扩散模型
郑宏凯、聂伟丽、Arash Vahdat、Anima Anandkumar
arXiv 2023。 [论文] [Github]
2023 年 6 月 15 日

用于生成可控海报布局的关系感知扩散模型
李风恒、刘安、冯伟、朱红河、李耀宇、张正、吕晶晶、朱欣、沉俊杰、林占刚、邵静平
arXiv 2023。[论文]
2023 年 6 月 15 日

OMS-DPM：优化扩散概率模型的模型调度
刘恩树、宁雪飞、林子楠、杨华中、王宇
arXiv 2023。[论文]
2023 年 6 月 15 日

DORSal：以对象为中心的场景表示的扩散 $textit{等}$
艾伦·贾布里、Sjoerd van Steenkiste、Emiel Hoogeboom、Mehdi SM Sajjadi、Thomas Kipf
arXiv 2023。[论文]
2023 年 6 月 13 日

快速扩散模型
吴子克、周潘、川口健二、张汉旺
arXiv 2023。 [论文] [Github]
2023 年 6 月 12 日

ADDP：通过交替去噪扩散过程学习图像识别和生成的一般表示
田昌耀、陶晨鑫、戴继峰、李浩、李子恒、路乐伟、王小刚、李红生、黄高、朱喜洲
arXiv 2023。[论文]
2023 年 6 月 8 日

多架构多专家扩散模型
李允成、金振英、高孝俊、郑明浩、吴信赫、崔胜泽
arXiv 2023。[论文]
2023 年 6 月 8 日

使用欧几里德距离函数解释和改进扩散模型
弗兰克·佩门特、袁晨阳
arXiv 2023。[论文]
2023 年 6 月 8 日

具有局部-全局上下文指导的视频扩散模型
杨思源、张璐、刘宇、姜志卓、何友
IJCAI 2023。 [论文] [Github]
2023 年 6 月 5 日

用于视觉探索的大脑扩散：使用大规模生成模型的皮层发现
安德鲁·F·罗、玛格丽特·M·亨德森、莱拉·韦贝、迈克尔·J·塔尔
arXiv 2023。[论文]
2023 年 6 月 5 日

通过并行分数匹配更快地训练扩散模型并改进密度估计
埃特里特·哈克霍利、马可·洛伦齐
arXiv 2023。[论文]
2023 年 6 月 5 日

扩散模型的时间动态量化
苏俊赫、李正元、安大贤、金亨俊、朴银赫
arXiv 2023。[论文]
2023 年 6 月 4 日

使用降噪器表示从无条件扩散模型进行条件生成
亚历山德罗斯·格莱科斯、斯里卡尔·耶拉普拉加达、迪米特里斯·萨马拉斯
BMVC 2023。 [论文] [Github]
2023 年 6 月 2 日

通过属性和语义掩模调节扩散模型以生成人脸
尼科·吉安比、朱塞佩·利桑蒂
arXiv 2023。[论文]
2023 年 6 月 1 日

差异扩散：赋予每个像素力量
伊兰·莱文、奥哈德·弗里德
arXiv 2023。[论文]
2023 年 6 月 1 日

解决神经网络中语义和视觉对齐的差异
娜塔莉·阿布鲁、内森·瓦斯卡、维多利亚·赫勒斯
arXiv 2023。[论文]
2023 年 6 月 1 日

解决扩散模型中的负迁移
高孝俊、金振英、李允成、李承贤、吴信赫、文亨敦、崔胜泽
arXiv 2023。[论文]
2023 年 6 月 1 日

扩散模型的几何视角
陈德芳、周振宇、梅建平、沉春华、陈春、王灿
arXiv 2023。[论文]
2023 年 5 月 31 日

生成扩散模型中的自发对称性破缺
加布里埃尔·拉亚、卢卡·安布罗吉奥尼
arXiv 2023。[论文]
2023 年 5 月 31 日

扰动辅助样本合成：不确定性量化的新方法
刘亦菲、沉雷克斯、沉晓彤
arXiv 2023。[论文]
2023 年 5 月 30 日

一行代码数据整理改进了基于似然的生成模型的优化
Ba-Hien Tran、朱利奥·弗兰泽塞、彼得罗·米基亚尔迪、毛里齐奥·菲利蓬
arXiv 2023。[论文]
2023 年 5 月 30 日

环境扩散：从损坏的数据中学习干净的分布
扬尼斯·达拉斯、库林·沙阿、尤瓦尔·达甘、阿拉文德·戈拉科塔、亚历山德罗斯·G·迪马基斯、亚当·克里万斯
arXiv 2023。[论文]
2023 年 5 月 30 日

实现扩散模型的准确无数据量化
王长源、王紫薇、徐修伟、唐岩松、周杰、卢继文
arXiv 2023。[论文]
2023 年 5 月 30 日

BRIGHT：使用哈希表组的图像集合的双层特征表示
杨鼎东、王一智、Ali Mahdavi-Amiri、张浩
arXiv 2023。[论文][项目]
2023 年 5 月 29 日

Diff-Instruct：从预训练扩散模型转移知识的通用方法
罗伟建、胡天阳、张世峰、孙家成、李振国、张志华
arXiv 2023。[论文]
2023 年 5 月 29 日

学习跳跃：生成模型的细化和加厚潜在计数
陈天琪、周明远
ICML 2023。 [论文] [Github]
2023 年 5 月 28 日

重建心灵之眼：使用对比学习和扩散先验的功能磁共振成像到图像
保罗·S·斯科蒂、阿特马迪普·班纳吉、吉米·古德、斯捷潘·沙巴林、亚历克斯·阮、伊森·科恩、艾丹·J·登普斯特、娜塔莉·维林德、埃拉德·云德勒、大卫·韦斯伯格、肯尼思·A·诺曼、塔尼什·A·诺曼、塔尼什克·马修·亚伯拉罕
arXiv 2023。 [论文] [Github]
2023 年 5 月 29 日

对比、关注和扩散来解码大脑活动的高分辨率图像
孙靖远、李明晓、陈子娇、张云浩、王少南、Marie-Francine Moens
arXiv 2023。[论文]
2023 年 5 月 26 日

扩散模型的并行采样
Andy Shih、Suneel Belkhale、Stefano Ermon、Dorsa Sadigh、Nima Anari
arXiv 2023。 [论文] [Github]
2023 年 5 月 25 日

通过跳跃扩散模型进行跨维度生成建模
安德鲁·坎贝尔、威廉·哈维、克里斯蒂安·韦尔巴赫、瓦伦丁·德博尔托利、汤姆·雷恩福斯、阿诺·杜塞
arXiv 2023。[论文]
2023 年 5 月 25 日

UDPM：上采样扩散概率模型
谢迪·阿布·侯赛因、拉贾·吉里斯
arXiv 2023。[论文]
2023 年 5 月 25 日

将 GAN 和基于分数的扩散统一为生成粒子模型
让-伊夫·弗朗西斯基、迈克·加特雷尔、卢多维克·多斯桑托斯、蒂博·伊森胡特、伊曼纽尔·德·贝泽纳克、米克尔·陈、阿兰·拉科托马蒙吉
arXiv 2023。[论文]
2023 年 5 月 25 日

DuDGAN：通过双扩散改进类条件 GAN
廉泰善、李旼赫
arXiv 2023。[论文]
2023 年 5 月 24 日

通过移动时间步长采样减轻扩散模型中的曝光偏差
李明晓、曲婷玉、孙伟、玛丽-弗朗辛·莫恩斯
arXiv 2023。[论文]
2023 年 5 月 24 日

通过单一扩散模型进行稳健分类
陈焕然、董银鹏、王正义、杨晓、段承启、苏航、朱军
arXiv 2023。[论文]
2023 年 5 月 24 日

论扩散模型的推广
易明阳、孙家成、李振国
arXiv 2023。[论文]
2023 年 5 月 24 日

VDT：变压器视频扩散的实证研究
卢浩宇、杨国兴、费南一、霍雨琪、卢志武、罗平、丁明宇
arXiv 2023。 [论文] [Github]
2023 年 5 月 22 日

电影思维景观：根据大脑活动重建高质量视频
陈子娇、庆佳欣、周娟
arXiv 2023。[论文][项目]
2023 年 5 月 19 日

PTQD：扩散模型的准确训练后量化
何叶飞、刘路平、刘静、吴维嘉、周宏、庄博涵
arXiv 2023。[论文]
2023 年 5 月 18 日

停电扩散：离散状态空间中的生成扩散模型
哈维尔·E·桑托斯、扎卡里·R·福克斯、尼古拉斯·鲁伯斯、颜廷林
arXiv 2023。[论文]
2023 年 5 月 18 日

扩散模型的结构修剪
方功凡、马欣银、王新超
arXiv 2023。 [论文] [Github]
2023 年 5 月 18 日

追赶蒸馏：您只需训练一次即可加速采样
邵世童、代旭、尹守义、李路军、陈焕然、胡阳
arXiv 2023。[论文]
2023 年 5 月 18 日

可控心灵视觉扩散模型
曾博涵、李尚林、刘旭辉、高思成、蒋小龙、唐旭、胡耀、刘建壮、张保昌
arXiv 2023。[论文]
2023 年 5 月 17 日

分析基于扩散的人脸生成模型中的偏差
马尔沙·V·佩雷拉、维沙尔·M·帕特尔
arXiv 2023。[论文]
2023 年 5 月 10 日

扩散常微分方程最大似然估计的改进技术
郑凯文、路成、陈剑飞、朱军
ICML 2023。[论文]
2023 年 5 月 6 日

LEO：用于人类视频合成的生成潜像动画器
王耀辉、马欣、陈新元、Antitza Dantcheva、戴波、乔宇
arXiv 2023。[论文][项目][Github]
2023 年 5 月 6 日

迭代 α-(de)Blending：极简确定性扩散模型
埃里克·海茨、洛朗·贝尔库尔、托马斯·尚邦
SIGGRAPH 2023。[论文]
2023 年 5 月 5 日

通过引导随机搜索重建人脑活动所看到的图像
里斯·尼兰、乔丁·奥赫达、吉斯兰·圣伊夫、托马斯·纳塞拉里斯
arXiv 2023。[论文]
2023 年 4 月 30 日

用于可控视频合成的运动条件扩散模型
陈蔡贤、林杰休、曾鸿宇、林宗毅、杨明轩
arXiv 2023。[论文][项目]
2023 年 4 月 27 日

通过向后随机微分方程进行基于分数的生成建模：反演和生成
王子豪
arXiv 2023。[论文]
2023 年 4 月 26 日

利用潜在分类器指导探索组合视觉生成
史昌浩、倪浩淼、李凯、韩少波、梁明富、马丁·民仁强
CVPR 研讨会 2023。[论文]
2023 年 4 月 25 日

补丁扩散：更快、更高效的扩散模型训练
王振东、蒋一凡、郑黄杰、王培豪、何鹏程、王张扬、陈伟柱、周明远
arXiv 2023。[论文]
2023 年 4 月 25 日

变分扩散自动编码器：具有无条件扩散先验的深度潜变量模型
乔治斯·巴佐利斯、扬·斯坦祖克、卡罗拉-比比安·舍恩利布
arXiv 2023。[论文]
2023 年 4 月 24 日

LaMD：用于视频生成的潜在运动扩散
胡耀思、陈振中、罗冲
arXiv 2023。[论文]
2023 年 4 月 23 日

用于细化均值估计的前瞻扩散概率模型
张国强、丹羽健太、W. Bastiaan Kleijn
CVPR 2023。 [论文] [Github]
2023 年 4 月 22 日

NeuralField-LDM：使用分层潜在扩散模型生成场景
金承旭、布拉德利·布朗、尹康学、卡斯滕·克莱斯、Katja Schwarz、李岱青、Robin Rombach、Antonio Torralba、Sanja Fidler
CVPR 2023。[论文]
2023 年 4 月 19 日

使用潜在指纹归因图像生成模型
聂光宇、金昌勋、杨业洲、任毅
arXiv 2023。[论文]
2023 年 4 月 17 日

用于个性化传播的身份编码器
苏玉泉、Kelvin CK Chan、李彦东、赵阳、张涵、龚博庆、王慧生、贾旭辉
arXiv 2023。[论文]
2023 年 4 月 14 日

通过基于补丁的生成实现内存高效扩散概率模型
荒川真英、纲岛英树、堀田大地、田中庆太郎、森岛繁雄
arXiv 2023。[论文]
2023 年 4 月 14 日

DCFace：使用双条件扩散模型生成合成人脸
Minchul Kim、Feng Liu、Anil Jain、刘晓明
arXiv 2023。 [论文] [Github]
2023 年 4 月 14 日

DiffFit：通过简单的参数高效微调解锁大型扩散模型的可转移性
谢恩泽、姚乐伟、石韩、刘志立、周大全、刘兆强、李家伟、李振国
arXiv 2023。[论文]
2023 年 4 月 13 日

RAFT：生成基础模型对齐的奖励排名微调
Hanze Dong、Wei Xiong、Deepanshu Goyal、Rui Pan、Shizhe Diao、Jipeng Zhang、Kashun Shum、Tong Chang
arXiv 2023。[论文]
2023 年 4 月 13 日

DreamPose：通过稳定扩散进行时尚图像到视频合成
约翰娜·卡拉斯、亚历山大·霍林斯基、王庭俊、艾拉·凯梅尔马赫-施利泽曼
arXiv 2023。[论文][项目][Github]
2023 年 4 月 12 日

反射扩散模型
亚伦·卢、斯特凡诺·埃尔蒙
ICML 2023。 [论文] [项目] [Github]
2023 年 4 月 10 日

二元潜扩散
王泽、王江、刘子成、邱强
arXiv 2023。[论文]
2023 年 4 月 10 日

作为屏蔽自动编码器的扩散模型
陈伟、Karttikeya Mangalam、黄坡耀、李阳浩、范浩琪、徐虎、王慧宇、谢慈航、Alan Yuille、Christoph Feichtenhofer
arXiv 2023。[论文][项目]
2023 年 4 月 6 日

具有类亲和力迁移的少镜头语义图像合成
玛琳·卡瑞尔、雅各布·维贝克、史蒂芬·拉苏利埃
CVPR 2023。[论文]
2023 年 4 月 5 日

EGC：通过基于扩散能量的模型进行图像生成和分类
郭秋山、马绰凡、姜毅、袁泽焕、于一舟、罗平
arxiv 2023。[论文][项目]
2023 年 4 月 4 日

代币合并实现快速稳定扩散
丹尼尔·博利亚，朱迪·霍夫曼
arXiv 2023。 [论文] [Github]
2023 年 3 月 30 日

仔细研究扩散模型中的参数高效调整
向晨东、鲍凡、李崇轩、苏航、朱军
arXiv 2023。[论文]
2023 年 3 月 31 日

-Diff：具有二次采样软化状态的无限分辨率扩散
萨姆·邦德-泰勒、克里斯·G·威尔科克斯
arXiv 2023。[论文]
2023 年 3 月 31 日

使用 2D 扩散模型生成 3D 感知图像
向剑峰、杨蛟龙、黄彬彬、童欣
arXiv 2023。[论文][项目]
2023 年 3 月 31 日

使用姿势引导扩散模型进行一致的视图合成
Hung-Yu Tseng、Qinbo Li、Changil Kim、Suhib Alsisan、Jia-Bin Huang、Johannes Kopf
CVPR 2023。[论文]
2023 年 3 月 30 日

DiffCollage：使用扩散模型并行生成大内容
张勤生、宋家明、黄迅、陈永新、刘明宇
CVPR 2023。[论文][项目]
2023 年 3 月 30 日

Masked Diffusion Transformer 是一款强大的图像合成器
高尚华、周潘、程明明、严水成
arXiv 2023。 [论文] [Github]
2023 年 3 月 25 日

使用潜流扩散模型的条件图像到视频生成
倪浩淼、施昌浩、李凯、黄晓云、马丁·民强
CVPR 2023。 [论文] [Github]
2023 年 3 月 24 日

NUWA-XL：Diffusion over Diffusion 用于生成超长视频
尹胜明、吴晨飞、杨欢、王建峰、王晓东、倪敏恒、杨正源、李林杰、刘曙光、杨范、付建龙、公明、王丽娟、刘子成、李厚强、段南
arXiv 2023。[论文][项目]
2023 年 3 月 22 日

以对象为中心的槽扩散
蒋金东、邓飞、高塔姆·辛格、安成镇
arXiv 2023。[论文]
2023 年 3 月 20 日

LDMVFI：使用潜在扩散模型的视频帧插值
多利昆·丹尼尔、张凡、大卫·布尔
arXiv 2023。[论文]
2023 年 3 月 16 日

通过最小信噪比加权策略进行高效扩散训练
杭天凯、谷书阳、李陈、包建民、陈东、胡涵、耿新、郭百宁
arXiv 2023。[论文]
2023 年 3 月 16 日

VideoFusion：用于生成高质量视频的分解扩散模型
CVPR 2023。[论文]
2023 年 3 月 15 日

通过力场构建可解释的 ODE 式生成扩散模型
金未央、朱永培、彭玉玺
arXiv 2023。[论文]
2023 年 3 月 14 日

用于标记图像合成的正则化矢量量化
张家辉、詹方能、Christian Theobalt、鲁石建
arXiv 2023。[论文]
2023 年 3 月 11 日

PARASOL：用于扩散图像合成的参数化风格控制
杰玛·卡内·塔雷斯、丹·鲁塔、Tu Bui、约翰·科洛莫斯
arXiv 2023。[论文]
2023 年 3 月 11 日

Brain-Diffuser：使用生成潜在扩散从功能磁共振成像信号重建自然场景
富尔坎·奥兹塞利克、鲁芬·范鲁伦
arXiv 2023。[论文]
2023 年 3 月 9 日

多级扩散：用于图像生成的基于无限维分数的扩散模型
保罗·哈格曼、拉斯·鲁托托、加布里埃尔·施泰德尔、妮可·杨天骄
arXiv 2023。[论文]
2023 年 3 月 8 日

区域：具有传递闭合时间限定的降级扩散模型
David Berthelot，Arnaud Autef，Jierui Lin，Dian Ang Yap，Shuangfei Zhai，Siyuan Hu，Daniel Zheng，Walter Zheng，Walter Zheng，Walter Talbott，Eric Gu
Arxiv 2023。[纸]
2023 年 3 月 7 日

增强空间中的生成扩散：完整的食谱
库沙格拉·潘迪（Kushagra Pandey），斯蒂芬·曼特（Stephan Mandt）
Arxiv 2023。[纸]
2023 年 3 月 3 日

一致性模型
Yang Song，Prafulla Dhariwal，Mark Chen，Ilya Sutskever
Arxiv 2023。[纸]
2023 年 3 月 2 日

扩散概率场
Peiye Zhuang，Samira Abnar，Jiatao GU，Alex Schwing，Joshua M. Susskind，MiguelángelBautista
ICLR 2023。[纸]
2023 年 3 月 1 日

在扩散模型中无监督的语义潜在方向
Yong-Hyun Park，Mingi Kwon，Junghyo Jo，Youngjung UH
Arxiv 2023。[纸]
2023 年 2 月 24 日

减少，再利用，回收利用：基于能量的扩散模型和MCMC的组成产生
Yilun DU，Conor Durkan，Robin Strudel，Joshua B. Tenenbaum，Sander Dieleman，Rob Fergus，Jascha Sohl Dickstein，Arnaud Doucet，Will Grathwohl
Arxiv 2023。[Paper] [Project]
2023 年 2 月 22 日

通过自我监管的单图像学习3D摄影视频
王王，钟菲王，春天阳，敏恩，王·王，林吉·李，Zhengyuan Yang，fan Yang，Lijuan Wang，Zicheng Liu，Yuejian Fang，Nan Duan，Nan Duan
Arxiv 2023。[纸]
2023 年 2 月 21 日

关于校准扩散概率模型
Tianyu Pang，Cheng Lu，Chao du，Min Lin，Shuicheng Yan，Zhijie Deng
Arxiv 2023。[Paper] [Github]
2023 年 2 月 21 日

扩散模型和半监督学习者在标签很少的情况下互惠互利
Zebin You，Yong Zhong，Fan Bao，Jicheng Sun，Chongxuan Li，Jun Zhu
Arxiv 2023。[纸]
2023 年 2 月 21 日

跨域的组合与预处理的扩散模型
Roy Hachnochi，Mingrui Zhao，Nadav Orzech，Rinon Gal，Ali Mahdavi-Amiri，Daniel Cohen-Or，Amit Haim Bermano
Arxiv 2023。[Paper] [Github]
2023 年 2 月 20 日

基于恢复的生成模型
Jaemoo Choi，Yesom Park，Myungjoo Kang
Arxiv 2023。[纸]
2023 年 2 月 20 日

一致的扩散模型：通过学习保持一致来减轻采样漂移
Giannis Daras，Yuval Dagan，Alexandros G. Dimakis，Constantinos Daskalakis
Arxiv 2023。[Paper] [Github]
2023 年 2 月 17 日

LayoutDiffuse：适应布局至图像生成的基础扩散模型
Jiaxin Cheng，Xiao Liang，Xingjian Shi，Tong He，Tianjun Xiao，Mu Li
Arxiv 2023。[纸]
2023 年 2 月 16 日

投影潜在空间中的视频概率扩散模型
Sihyun Yu，Kihyuk Sohn，Subin Kim，Jinwoo Shin
Arxiv 2023。[Paper] [Github]
2023 年 2 月 15 日

difffaceSketch：高保真面部图像综合与草图引导的潜扩散模型
Yichen Peng，Chunqi Zhao，Haoran Xie，Tsukasa Fukusato，Kazunori Miyata
Arxiv 2023。[纸]
2023 年 2 月 14 日

在哪里扩散，如何扩散以及如何返回：多变量扩散的自动学习
Raghav Singhal，Mark Goldstein，Rajesh Ranganath
Arxiv 2023。[纸]
2023 年 2 月 14 日

基于分数的生成模型
Li Zhang，Hengyuan MA，Xiatian Zhu，Jianfeng Feng
Arxiv 2023。[Paper] Github]
2023 年 2 月 13 日

星形降级扩散概率模型
Andrey Okhotin，Dmitry Molchanov，Vladimir Arkhipkin，Grigory Bartosh，Aibek Alanov，Dmitry Vetrov
Arxiv 2023。[纸]
2023 年 2 月 10 日

UNIPC：用于快速采样扩散模型的统一预测 - 矫正器框架
Wenliang Zhao，Lujia Bai，Yongming Rao，Jie Zhou，Jiwen Lu
Arxiv 2023。[Paper] [Project] [Github]
2023 年 2 月 9 日

基于分数的生成模型的几何形状
Sandesh Ghimire，Jinyang Liu，Armand Comas，Davin Hill，Aria Masoomi，Octavia Camps，Jennifer Dy
Arxiv 2023。[纸]
2023 年 2 月 9 日

Q-扩散：量化扩散模型
Xiuyu li，Long Lian，Yijiang Liu，Huanrui Yang，Zhen Dong，Daniel Kang，Shanghang Zhang，Kurt Keutzer
Arxiv 2023。[纸]
2023 年 2 月 8 日

PFGM ++：解锁物理启发的生成模型的潜力
Yilun Xu，Ziming Liu，Yonglong Tian，Shangyuan Tong，Max Tegmark，Tommi Jaakkola
Arxiv 2023。[Paper] [Github]
2023 年 2 月 8 日

长度温度缩放
安迪·西赫（Andy Shih），dorsa sadigh，Stefano Ermon
Arxiv 2023。[纸]
2023 年 2 月 7 日

空间函数：将函数缩放到成像网分类和生成
Matthias Bauer，Emilien Dupont，Andy Brock，Dan Rosenbaum，Jonathan Schwarz，Hyunjik Kim
Arxiv 2023。[纸]
2023 年 2 月 6 日

ShiftDDPM：通过转移扩散轨迹探索条件扩散模型
Zijian Zhang，Zhou Zhao，Jun Yu，Qi Tian
AAAI 2023。[纸]
2023 年 2 月 5 日

与基于得分的生成模型进行划分并构成
Sandesh Ghimire，Armand Comas，Davin Hill，Aria Masoomi，Octavia Camps，Jennifer Dy
Arxiv 2023。[Paper] [Github]
2023 年 2 月 5 日

扩散模型中降低方差得分估计的稳定目标场
Yilun Xu，Shangyuan Tong，Tommi Jaakkola
ICLR 2023。[Paper] [Github]
2023 年 2 月 1 日

DISDIFF：无监督的扩散概率模型的分解
Tao Yang，Yuwang Wang，Yan LV，Nanning Zheng
神经2023。[纸]
2023 年 1 月 31 日

通过快捷方式进行优化DDPM抽样
ying粉丝，kangwook lee
Arxiv 2023。[纸]
2023 年 1 月 31 日

通过关节扩散模型学习数据表示
Kamil Deja，Tomasz Trzcinski，Jakub M. Tomczak
Arxiv 2023。[纸]
2023 年 1 月 31 日

ERA-SOLVER：误解ADAMS求解器用于快速采样扩散概率模型
Shengmeng Li，Luping Liu，Zenghao Chai，Runnan Li，Xu Tan
Arxiv 2023。[纸]
2023 年 1 月 30 日

不要玩收藏夹：扩散模型的少数群体指导
Soobin UM，Jong Chul Ye
Arxiv 2023。[Paper] [Github]
2023 年 1 月 29 日

加速引导的扩散抽样采用拆分数值方法
Suttisak Wizadwongsa，Supasorn Suwajanakorn
ICLR 2023。[纸]
2023 年 1 月 27 日

输入扰动减少了扩散模型中的暴露偏差
Mang Ning，Enver Sangineto，Angelo Porrello，Simone Calderara，Rita Cucchiara
Arxiv 2023。[Paper] [Github]
2023 年 1 月 27 日

最小化基于ODE的生成模型的轨迹曲率
Sangyun Lee，Beomsu Kim，Jong Chul Ye
Arxiv 2023。[纸]
2023 年 1 月 27 日

关于扩散模型的噪声调度的重要性
陈婷
Arxiv 2023。[纸]
2023 年 1 月 26 日

简单扩散：高分辨率图像的端到端扩散
Emiel Hoogeboom，Jonathan Heek，Tim Salimans
Arxiv 2023。[纸]
2023 年 1 月 26 日

通过MMD Finetuning快速推断DeNo扩散模型
Emanuele Aiello，Diego Valsesia，Enrico Magli
Arxiv 2023。[Paper] [Github]
2023 年 1 月 19 日

探索图像扩散模型的变压器骨架
查哈尔王子
Arxiv 2022。[纸]
2022 年 12 月 27 日

从预先训练的扩散概率模型中学习无监督的表示
Zijian Zhang，Zhou Zhao，Zhijie lin
Arxiv 2022。[纸]
2022 年 12 月 26 日

迭代生成的可扩展自适应计算
艾伦·贾布里（Allan Jabri），戴维·弗莱特（David Fleet），Ting Chen
Arxiv 2022。[纸]
2022 年 12 月 22 日

层次分支扩散模型，以实现高效且可解释的多级条件生成
Alex M. Tseng，Tommaso Biancalani，Max Shen，Gabriele Scalia
Arxiv 2022。[纸]
2022 年 12 月 21 日

MM扩散：联合音频和视频生成的学习多模式扩散模型
Ludan Ruan，Yiyang MA，Huan Yang，Huiguo He，Bei Liu，Jianlong Fu，Nicholas Jing Yuan，Qin Jin，baining guo
Arxiv 2022。[Paper] [Github]
2022 年 12 月 19 日

使用 Transformer 的可扩展扩散模型
威廉·皮布尔斯（William Peebles）
Arxiv 2022。[Paper] [Project] [Github]
2022 年 12 月 19 日

DAG：具有降解扩散概率模型的深度感知指导
Gyeongnyeon Kim，Wooseok Jang，Gyuseong Lee，Susung Hong，Junyoung Seo，Seungryong Kim
Arxiv 2022。[Paper] [Project]
2022 年 12 月 17 日

迈向实用的插座扩散模型
Hyojun Go，Yunsung Lee，Jin-Young Kim，Seunghyun Lee，Myeongho Jeong，Hyun Seung Lee，Seungtaek Choi
Arxiv 2022。[纸]
2022 年 12 月 12 日

语义大脑解码：从fMRI到概念上相似的视觉刺激图像重建
Matteo Ferrante，Tommaso Boccato，Nicola Toschi
Arxiv 2022。[纸]
2022 年 12 月 13 日

MAGVIT：屏蔽生成视频转换器
Lijun Yu，Yong Cheng，Kihyuk Sohn，JoséLezama，Han Zhang，Huiwen Chang，Alexander G. Hauptmann，Ming-Hsuan Yang，Yuan Hao，Irfan Essa，Lu Jiang
Arxiv 2022。[纸]项目]
2022 年 12 月 10 日

扩散视频自动编码器：通过删除视频编码为暂时一致的面部视频编辑
Gyeongman Kim，Hajin Shim，Hyunsu Kim，Yunjey Choi，Junho Kim，Eunho Yang
Arxiv 2022。[纸]
2022 年 12 月 6 日

使用扩散模型通过像素指导进行细粒度的图像编辑
Naoki Matsunaga，Masato Ishii，Akio Hayakawa，Kenji Suzuki，Takuya Narihira
Arxiv 2022。[纸]
2022 年 12 月 5 日

vidm：视频隐式扩散模型
Kangfu Mei，Vishal M. Patel
Arxiv 2022。[Paper] [Project] [Github]
2022 年 12 月 1 日

为什么有条件的生成模型比无条件模型更好？
Fan Bao，Chongxuan Li，Jicheng Sun，Jun Zhu
Arxiv 2022。[纸]
2022 年 12 月 1 日

高保真指导图像合成与潜在扩散模型
Jaskirat Singh，Stephen Gould，Liang Zheng
Arxiv 2022。[Paper] [Project]
2022 年 11 月 30 日

基于得分的连续时间离散扩散模型
Haoran Sun，Lijun Yu，Bo Dai，Dale Schuurmans，Hanjun Dai
Arxiv 2022。[纸]
2022 年 11 月 30 日

小波扩散模型是快速且可扩展的图像发生器
Hao Phung，Quan Dao，Anh Tran
Arxiv 2022。[纸]
2022 年 11 月 29 日

维度变化的扩散过程
韩张，瑞里冯，Zhantao Yang，Lianghua Huang，Yu Liu，Yifei Zhang，Yujun Shen，Deli Zhao，Jingren Zhou，Fan fan cheng
Arxiv 2022。[纸]
2022 年 11 月 29 日

在基于得分的扩散模型中使用歧视器指导来完善生成过程
Dongjun Kim，Yeongmin Kim，Wanmo Kang，Il-Chul Moon
Arxiv 2022。[纸]
2022 年 11 月 28 日

扩散概率模型缩小
Xingyi Yang，Daquan Zhou，jiashi Feng，Xinchao Wang
Arxiv 2022。[纸]
2022 年 11 月 27 日

通过操作员学习快速抽样扩散模型
Hongkai Zheng，Weili Nie，Arash Vahdat，Kamyar Azizzadenesheli，Anima Anandkumar
Arxiv 2022。[纸]
2022 年 11 月 24 日

具有任意长度的高保真视频生成的潜在视频扩散模型
yingqing He，Tianyu Yang，Yong Zhang，Ying Shan，Qifeng Chen
Arxiv 2022。[纸]
2022 年 11 月 23 日

通过示例：基于示例的图像编辑，扩散模型
Binxin Yang，Shuyang Gu，Bo Zhang，Ting Zhang，Xuejin Chen，Xiaoyan Sun，Dong Chen，Fang Wen
Arxiv 2022。[纸]
2022 年 11 月 23 日

sIndiffusion：从单个自然图像中学习扩散模型
Weilun Wang，Jianmin Bao，Wengang Zhou，Dongdong Chen，Dong Chen，Lu Yuan，Houqiang li
Arxiv 2022。[Paper] [Github]
2022 年 11 月 22 日

使用基于分类器的特征蒸馏加速扩散采样
Wujie Sun，Defang Chen，Can Wang，Deshi Ye，Yan Feng，Chun Chen
Arxiv 2022。[纸]
2022 年 11 月 22 日

场景演出者：任何级别的语义图像综合
Yu Zeng，Zhe Lin，Jianming Zhang，Qing Liu，John Collomosse，Jason Kuen，Vishal M. Patel
Arxiv 2022。[Paper] [Project]
2022 年 11 月 21 日

基于扩散的场景图与图像生成的图像生成，并具有掩盖的对比预训练
Ling Yang，Zhilin Huang，Yang Song，Shenda Hong，Guohao Li，Winao Zhang，Bin Cui，Bernard Ghanem，Ming-Hsuan Yang
Arxiv 2022。[纸]
2022 年 11 月 21 日

犯罪：单个图像或视频上的训练扩散模型
Yaniv Nikankin，Niv Haim，Michal Irani
Arxiv 2022。[纸]
2022 年 11 月 21 日

MagicVideo：具有潜扩散模型的有效视频生成
Daquan Zhou，Weimin Wang，Hanshu Yan，Weiwei LV，Yizhe Zhu，Jiashi Feng
Arxiv 2022。[Paper] [Project]
2022 年 11 月 20 日

超越大脑：有条件扩散模型，具有稀疏的掩盖建模用于视觉解码
Zijiao Chen，Jiaxin Qing，Tiange Xiang，Wan Lin Yue，Juan Helen Zhou
Arxiv 2022。[Paper] [Project] [Github]
2022 年 11 月 13 日

通过扩散模型生成的几声图像产生
Jingyuan Zhu，Huimin MA，Jiansheng Chen，Jian Yuan
Arxiv 2022。[纸]
2022年11月7日

从脱氧扩散到deno的马尔可夫模型
乔·本顿（Joe Benton），Yuyang Shi，Valentin de Bortoli，George Deligiannidis，Arnaud Doucet
Arxiv 2022。[Paper] [Github]
2022年11月7日

有条件的gan和扩散模型的有效空间稀疏推断
Muyang Li，Ji Lin，Chenlin Meng，Stefano Ermon，Song Han，Jun-Yan Zhu
神经2022。[Paper] [Github]
2022 年 11 月 4 日

基于扩散的生成建模的最佳控制观点
朱利叶斯·伯纳（Julius Berner），洛伦兹·里希特（Lorenz Richter）
Neurips研讨会2022。[纸]
2022 年 11 月 2 日

通过扩散过程的熵神经最佳传输
Nikita Gushchin，Alexander Kolesov，Alexander Korotin，Dmitry Vetrov，Evgeny Burnaev
Arxiv 2022。[纸]
2022 年 11 月 2 日

DPM-Solver++：用于扩散概率模型引导采样的快速求解器
Cheng Lu，Yuhao Zhou，Fan Bao，Jianfei Chen，Chongxuan Li，Jun Zhu
神经2022（口服）。 [纸] [github]
2022 年 11 月 2 日

基于得分的非偶性高斯噪声模型的deno降解扩散
Vikram Voleti，Christopher Pal，Adam Oberman
Neurips研讨会2022。[纸]
2022 年 10 月 21 日

深度平衡方法扩散模型
Ashwini Pokle，Zhengyang Geng，Zico Kolter
神经2022。[Paper] [Github]
2022 年 10 月 23 日

通过扩散模型的表示学习
耶利米·特拉布（Jeremias Traub）
Arxiv 2022。[Paper] [Github]
2022 年 10 月 20 日

自引导扩散模型
Vincent Tao Hu，David W Zhang，Yuki M. Asano，Gertjan J. Burghouts，Cees GM Snoek
Arxiv 2022。[Paper] [Project]
2022 年 10 月 12 日

精灵：高阶非降级扩散求解器
Tim Dockhorn，Arash Vahdat，Karsten Kreis
神经2022。[Paper] [Project [Github]
2022 年 10 月 11 日

F-DM：通过渐进信号转换的多阶段扩散模型
Jiatao Gu，Shuangfei Zhai，Yizhe Zhang，Miguel Angel Bautista，Josh Susskind
Arxiv 2022。[Paper] [Project]
2022 年 10 月 10 日

关于引导扩散模型的蒸馏
Chenlin Meng，Ruiqi Gao，Diederik P. Kingma，Stefano Ermon，Jonathan Ho，Tim Salimans
Arxiv 2022。[纸]
2022 年 10 月 6 日

使用自我注意指导提高扩散模型的样本质量
Susung Hong，Gyuseong Lee，Wooseok Jang，Seungryong Kim
Arxiv 2022。[Paper] [Project]
2022 年 10 月 3 日

强迫症：学会与条件扩散模型过度合适
Shahar Shlomo Lutati，Lior Wolf
Arxiv 2022。[Paper] [Github]
2022 年 10 月 2 日

野外生成的面孔：稳定扩散，Midjourney和Dall-E 2的定量比较
阿里博尔吉
Arxiv 2022。[Paper] [Github]
2022 年 10 月 2 日

将MCMC降级用于加速基于扩散的生成模型
Beomsu Kim，Jong Chul Ye
Arxiv 2022。[Paper] [Github]
2022 年 9 月 29 日

所有都是值得的话：用于基于分数扩散模型的VIT主干
Fan Bao，Chongxuan Li，Yue Cao，Jun Zhu
Arxiv 2022。[纸]
2022 年 9 月 25 日

3D形成的神经小波域扩散
Ka-hei Hui，Ruihui Li，Jingyu Hu，Chi-Wing Fu
Arxiv 2022。[纸]
2022 年 9 月 19 日

分割模型可以通过完全合成生成的数据训练吗？
弗吉尼亚·费尔南德斯（Virginia Fernandez），沃尔特·雨果（Walter Hugo Lopez Pinaya），佩德罗·博格斯（Pedro Borges），佩特鲁·戴尼尔·图多苏（Petru-Daniel Tudosiu），马克·S·格雷厄姆（Mark S Graham）
Arxiv 2022。[纸]
2022 年 9 月 17 日

模糊扩散模型
Emiel Hoogeboom，蒂姆·萨利曼斯（Tim Salimans）
Arxiv 2022。[纸]
2022 年 9 月 12 日

软扩散：一般腐败的得分匹配
Giannis Daras，Mauricio Delbracio，Hossein Talebi，Alexandros G. Dimakis，Peyman Milanfar
Arxiv 2022。[纸]
2022 年 9 月 12 日

具有令牌评论的改进的蒙版图像产生
JoséLezama，Huiwen Chang，Lu Jiang，Irfan Essa
Arxiv 2022。[纸]
2022 年 9 月 9 日

让我们建造桥梁：理解和扩展扩散生成模型
Xingchao Liu，Lemeng Wu，Mao Ye，Qiang Liu
Arxiv 2022。[纸]
2022 年 8 月 31 日

弗里多：复杂场景图像合成的特征金字塔扩散
Wan-Cyuan粉丝，Yen-Chun Chen，Dongdong Chen，Yu Cheng，Lu Yuan，Yu-Chiang Frank Wang
Arxiv 2022。[纸]
2022 年 8 月 29 日

通过扩散模型从中风和草图产生适应性现实的图像
Shin-i Cheng，Yu-Jie Chen，Wei-Chen Chiu，Hsin-Ying Lee，Hung-Yu Tseng
Arxiv 2022。[Paper] [Project]
2022 年 8 月 26 日

冷扩散：倒置任意图像会变换而没有噪音
Arpit Bansal，Eitan Borgnia，Hong Min Chu，Jie S. Li，Hamid Kazemi，Furong Huang，Micah Goldblum，Jonas Geiping，Tom Goldstein
Arxiv 2022。[Paper] [Github]
2022 年 8 月 19 日

使用强大的分类器指导增强基于扩散的图像合成
Bahjat Kawar，Roy Ganz，Michael Elad
Arxiv 2022。[纸]
2022 年 8 月 18 日

您的VIT秘密地是混合歧视生成扩散模型
Xiulong Yang，Sheng-Min Shih，Yinlin Fu，Xiaoting Zhao，Shihao ji
Arxiv 2022。[Paper] [Github]
2022 年 8 月 16 日

在生成建模中应用基于Schrödinger-Bridge的随机过程
ki-gung歌曲
Arxiv 2022。[Paper] [Github]
2022 年 8 月 15 日

模拟位：使用具有自调节功能的扩散模型生成离散数据
Ting Chen，Ruixiang Zhang，Geoffrey Hinton
Arxiv 2022。[纸]
2022 年 8 月 8 日

锥体降解扩散概率模型
Dohoon Ryu，Jong Chul ye
Arxiv 2022。[纸]
2022 年 8 月 3 日

逐步脱蓝色的扩散模型用于粗到精细图像合成
Sangyun Lee，Hyungjin Chung，Jaehyeon Kim，Jong Chul Ye
Arxiv 2022。[Paper] [Github]
2022 年 7 月 16 日

通过修补提高扩散模型效率
特洛伊·卢曼（Troy Luhman），埃里克·卢曼（Eric Luhman）
Arxiv 2022。[Paper] [Github]
2022 年 7 月 9 日

带有预处理扩散采样的基于得分的生成模型加速
Hengyuan MA，Li Zhang，Xiatian Zhu，Jianfeng Feng
ECCV 2022。[纸]
2022 年 7 月 5 日

SPI-GAN：基于分数的生成模型，具有直径插值
鼻子公园的金恩·新
Arxiv 2022。[纸]
2022 年 6 月 29 日

条件扩散产生的熵驱动的采样和训练方案
Shengming Li，广方郑，Hui Wang，Taiping Yao，Yang Chen，Shoudong Ding，XI Li
Arxiv 2022。[纸]
2022 年 6 月 23 日

逆热耗散的生成建模
Severi Rissanen，Markus Heinonen，Arno Solin
Arxiv 2022。[Paper] [Project]
2022 年 6 月 21 日

扩散模型作为即插即用的先验
Alexandros Graikos，Nikolay Malkin，Nebojsa Jojic，Dimitris Samaras
神经2022。[Paper] [Github]
2022 年 6 月 17 日

灵活的扩散模型
Weitao du，Tao Yang，他张，Yuanqi du
ICML 2023。[纸]
2022 年 6 月 17 日

高斯扩散的有损压缩
Lucas Theis，Tim Salimans，Matthew D. Hoffman，Fabian Mentzer
Arxiv 2022。[纸]
2022 年 6 月 17 日

通过高阶Denoising评分匹配，基于得分的扩散ODE的最大似然训练
Cheng Lu，Kaiwen Zheng，Fan Bao，Jianfei Chen，Chongxuan Li，Jun Zhu
ICML 2022。[Paper] [GitHub]
2022 年 6 月 16 日

在扩散概率模型中估计最佳协方差使用不完美的平均值
Fan Bao，Chongxuan Li，Jicheng Sun，Jun Zhu，Bo Zhang
ICML 2022。[Paper] [GitHub]
2022 年 6 月 15 日

视频预测和填充的扩散模型
TobiasHöppe，Arash Mehrjou，Stefan Bauer，Didrik Nielsen，Andrea Dittadi
Arxiv 2022。[纸]
2022 年 6 月 15 日

离散的对比扩散的跨模式和条件产生
Ye Zhu，Yu Wu，Kyle Olszewski，Jian Ren，Sergey Tulyakov，Yan Yan
Arxiv 2022。[Paper] [Github]
2022 年 6 月 15 日

GDDIM：广义降级扩散隐式模型
Zhang Zhang，Molei Tao，Yongxin Chen
Arxiv 2022。[Paper] [Github]
2022 年 6 月 11 日

多少才足够？一项关于基于分数生成模型的扩散时间的研究
Giulio Franzese，Simone Rossi，Lixuan Yang，Alessandro Finamore，Dario Rossi，Maurizio Filippone，Pietro Michiardi
Arxiv 2022。[纸]
2022 年 6 月 10 日

使用脱氧扩散概率模型的多模式先验的图像产生
Nithin Gopalakrishnan Nair，Wele Gedara Chaminda Bandara，Vishal M Patel
Arxiv 2022。[纸]
2022 年 6 月 10 日

高分辨率图像合成的基于得分的生成模型加速
Hengyuan MA，Li Zhang，Xiatian Zhu，Jingfeng Zhang，Jianfeng feng
Arxiv 2022。[纸]
2022 年 6 月 8 日

扩散术：扩散的训练剂
Zhendong Wang，Huangjie Zheng，Pengcheng He，Weizhu Chen，Mingyuan Zhou
Arxiv 2022。[纸]
2022年6月5日

DPM-Solver：一种快速 ODE 求解器，可通过大约 10 个步骤进行扩散概率模型采样
Cheng Lu，Yuhao Zhou，Fan Bao，Jianfei Chen，Chongxuan Li，Jun Zhu
Neurrips 2022。[Paper] [Github]
2022 年 6 月 2 日

阐明基于扩散的生成模型的设计空间
Tero Karras，Miika Aittala，Timo Aila，Samuli Laine
神经2022。[纸]
2022 年 6 月 1 日

分析基于扩散的深层生成模型的生成和降解能力
Kamil Deja，Anna Kuzina，TomaszTrzciński，Jakub M. Tomczak
神经2022。[纸]
2022 年 5 月 31 日

几乎没有射击扩散模型
Giorgio Giannone，Didrik Nielsen，Ole Winther
Arxiv 2022。[纸]
2022 年 5 月 30 日

离散降级模型的连续时间框架
安德鲁·坎贝尔（Andrew Campbell），乔·本顿（Joe Benton），瓦伦丁·德·博尔托利（Valentin de Bortoli），汤姆·雷德斯（Tom Rainforth），乔治·德里吉亚尼迪斯（George Deligiannidis），Arnaud Doucet
Arxiv 2022。[纸]
2022 年 5 月 30 日

隐式非线性扩散模型的最大似然训练
Dongjun Kim，Byeonghu Na，Se Jung Kwon，Dongsoo Lee，Wanmo Kang，Il-Chul Moon
神经2022。[纸]
2022 年 5 月 27 日

通过扩散过程的早期停止加速扩散模型
Zhaoyang Lyu，Xudong Xu，Ceyuan Yang，Dahua Lin，Bo Dai
ICML 2022。[纸]
2022 年 5 月 25 日

长视频的灵活扩散建模
威廉·哈维（William Harvey），塞德·纳德里帕里（Saeid Naderiparizi），瓦登·马斯拉尼（Vaden Masrani），克里斯蒂安·韦尔巴赫（Christian Weilbach），弗兰克·伍德
Arxiv 2022。[Paper] [Github]
2022 年 5 月 23 日

MCVD：用于预测，生成和插值的有条件视频扩散
Vikram Voleti，Alexia Jolicoeur-Martineau，Christopher Pal
神经2022。[Paper] [Github]
2022 年 5 月 19 日

通过扩散模型来调理输入噪声以生成受控图像的生成
Vedant Singh，Surgan Jandial，Ayush Chopra，Siddharth Ramesh，Balaji Krishnamurthy，Vineeth N. Balasubramanian
CVPR研讨会2022。[纸]
2022 年 5 月 8 日

子空间扩散生成模型
Bowen Jing，Gabriele Corso，Renato Berlinghieri，Tommi Jaakkola
Arxiv 2022。[Paper] [Github]
2022 年 5 月 3 日

使用指数积分器对扩散模型进行快速采样
Zhang Zhang，Yongxin Chen
Arxiv 2022。[纸]
2022 年 4 月 29 日

半参数神经图像合成
Andreas Blattmann，Robin Rombach，Kaan Oktay，JonasMüller，Björn -Ommer
神经2022。[纸]
2022 年 4 月 25 日

视频扩散模型
乔纳森·霍（Jonathan Ho），蒂姆·萨利曼斯（Tim Salimans），亚历克斯·格里森科（Alexey Gritsenko），威廉·陈（William Chan），穆罕默德·诺鲁兹（Mohammad Norouzi），大卫·J·弗里特
神经2022。[纸]
2022 年 4 月 7 日

感知优先训练扩散模型
Jooyoung Choi，Jungbeom Lee，Chaehun Shin，Sungwon Kim，Hyunwoo Kim，Sungroh Yoon
CVPR 2022。[Paper] [Github]
2022 年 4 月 1 日

使用扩散模型从低密度区域生成高富达数据
Vikash Sehwag，Caner Hazirbas，Albert Gordo，Firat Ozgenel，Cristian Canton Ferrer
Arxiv 2022。[纸]
2022 年 3 月 31 日

反事实解释的扩散模型
Guillaume Jeanneret，LoïcSimon，Frédéricjurie
Arxiv 2022。[纸]
2022 年 3 月 29 日

基于条件分数的数据生成的可能性得分匹配
Chen-Hao Chao，Wei-Fang Sun，Bo-Wun Cheng，Yi-Chen LO，Chia-Che Chang，Yu-Lun Liu，Yu-Lin Chang，Chia-Ping Chen，Chun-yi Lee
ICLR 2022。[纸]
2022 年 3 月 27 日

视频生成的扩散概率建模
Ruihan Yang，Prakhar Srivastava，Stephan Mandt
Arxiv 2022。[Paper] [Github]
2022 年 3 月 16 日

动态双输出扩散模型
Yaniv Benny，Lior Wolf
CVPR 2022。[纸]
2022 年 3 月 8 日

使用扩散schrödinger桥的有条件模拟
Yuyang Shi，Valentin de Bortoli，George Deligiannidis，Arnaud Doucet
Arxiv 2022。[纸]
2022 年 2 月 27 日

反事实估计的扩散因果模型
佩德罗·桑切斯（Pedro Sanchez），Sotirios A. Tsaftaris
PMLR 2022。[纸]
2022 年 2 月 21 日

流形扩散模型的伪数值方法
Luping Liu，Yi Ren，Zhijie Lin，Zhou Zhao
ICLR 2022。[Paper] [Github]
2022 年 2 月 20 日

截断的扩散概率模型
Huangjie Zheng，Pengcheng He，Weizhu Chen，Mingyuan Zhou
Arxiv 2022。[纸]
2022 年 2 月 19 日

通过最佳传输了解DDPM潜在代码
Valentin Khrulkov，Ivan Oseledets
Arxiv 2022。[纸]
2022 年 2 月 14 日

通过通过样本质量区分扩散模型的快速采样器
丹尼尔·沃森（Daniel Watson），威廉·陈（William Chan），乔纳森·霍（Jonathan Ho），穆罕默德·诺鲁兹（Mohammad Norouzi）
ICLR 2022。[纸]
2022 年 2 月 11 日

扩散桥矢量量化变异自动编码器
Max Cohen，Guillaume Quispe，Sylvain Le Corff，Charles Ollion，Eric Moulines
ICML 2022。[纸]
2022 年 2 月 10 日

用于扩散模型快速采样的渐进蒸馏
蒂姆·萨利曼斯（Tim Salimans），乔纳森·何（Jonathan Ho）
ICLR 2022。[纸]
2022 年 2 月 1 日

分析-DPM：扩散概率模型中最佳反向差异的分析估计值
Fan Bao，Chongxuan Li，Jun Zhu，Bo Zhang
ICLR 2022。[纸]
2022 年 1 月 17 日

差异：低维潜在的有效，可控制和高保真产生
Kushagra Pandey，Avideep Mukherjee，Piyush Rai，Abhishek Kumar
Arxiv 2022。[Paper] [Github]
2022 年 1 月 2 日

ITô-Taylor采样方案，用于使用理想衍生物的扩散概率模型进行降解
hideyuki tachibana，莫乔·戈（Mocho Go），穆尼奥西（Muneyoshi inahara）
Arxiv 2021。[纸]
2021 年 12 月 26 日

滑行：使用文本引导的扩散模型迈向逼真的图像生成和编辑
Alex Nichol，Prafulla Dhariwal，Aditya Ramesh，Pranav Shyam，Pamela Mishkin，Bob McGrew，Ilya Sutskever，Mark Chen
ICML 2021。[Paper] [GitHub]
2021 年 12 月 20 日

高分辨率图像合成与潜扩散模型
Robin Rombach，Andreas Blattmann，Dominik Lorenz，Patrick Esser，Björn -Ommer
Arxiv 2021。[Paper] [Github]
2021 年 12 月 20 日

重尾denoising得分匹配
雅各布·迪亚（Jacob Deasy），尼古拉·西尼迪耶夫斯基（Nikola Simidjievski）
Arxiv 2021。[纸]
2021年12月17日

高保真可视化您的自我监督代表所知道的
Florian Bordes，Randall Balestriero，Pascal Vincent
Arxiv 2021。[纸]
2021 年 12 月 16 日

通过脱氧扩散剂来解决生成学习三元素
Zhisheng Xiao，Karsten Kreis，Arash Vahdat
Arxiv 2021。[Paper] [Project]
2021 年 12 月 15 日

基于分数的生成建模，具有诱导的Langevin扩散
Tim Dockhorn，Arash Vahdat，Karsten Kreis
ICLR 2022。[Paper] [Project]
2021 年 12 月 14 日

更多免费控制！图像综合语义扩散指导
Xihui Liu，Dong Huk Park，Samaneh Azadi，Gong Zhang，Arman Chopikyan，Yuxiao Hu，Humphrey Shi，Anna Rohrbach，Trevor Darrell
Arxiv 2021。[纸]
2021 年 12 月 10 日

图像生成的矢量量化建模中具有离散扩散的全球环境
Minghui Hu，Yujie Wang，Tat-Jen Cham，Jianfei Yang，pnsuganthan
Arxiv 2021。[纸]
2021 年 12 月 3 日

扩散自动编码器：迈向有意义且可解码的表示
Konpat Preechakul，Nattanat Chatthee，Suttisak Wizadwongsa，Supasorn Suwajanakorn
CVPR 2022。[Paper] [Project] [GitHub]
2021 年 12 月 30 日

有条件图像生成基于得分的扩散模型
Georgios Batzolis，Jan Stanczuk，Carola-BibianeSchönlieb，Christian Etmann
Arxiv 2021。[纸]
2021 年 11 月 26 日

释放变压器：与矢量定量代码的快速高分辨率图像生成的离散吸收扩散的平行令牌预测
Sam Bond-Taylor，Peter Hessey，Hiroshi Sasaki，Toby P. Breckon，Chris G. Willcocks
Arxiv 2021。[Paper] [Github]
2021 年 11 月 24 日

扩散归一流的流量
Zhang Zhang，Yongxin Chen
神经2021。[纸] [github]
2021 年 10 月 14 日

剥离扩散伽马模型
Eliya Nachmani，Robin San Roman，Lior Wolf
Arxiv 2021。[纸]
2021 年 10 月 10 日

基于得分的生成神经网络，用于大规模最佳运输
马克斯·丹尼尔斯（Max Daniels），泰勒·莫努（Tyler Maunu），保罗·汉德
Arxiv 2021。[纸]
2021 年 10 月 7 日

基于分数的生成分类器
Roland S. Zimmermann，Lukas Schott，Yang Song，Benjamin A. Dunn，David A. Klindt
Arxiv 2021。[纸]
2021 年 10 月 1 日

无分类器扩散指南
乔纳森·霍（Jonathan Ho），蒂姆·萨利曼斯（Tim Salimans）
Neurips研讨会2021。[纸]
2021 年 9 月 28 日

双边降级扩散模型
Max Wy Lam，Jun Wang，Rongjie Huang，Dan Su，Dong Yu
Arxiv 2021。[Paper] [Project]
2021 年 8 月 26 日

ImageBart：具有多项式扩散的双向上下文，用于自回归图像合成
帕特里克·埃瑟（Patrick Esser），罗宾·罗姆巴赫（Robin Rombach），安德烈亚斯·布拉特曼（Andreas Blattmann）
神经2021。[纸] [项目]
2021 年 8 月 19 日

ILVR：用于降级扩散概率模型的调理方法
Jooyoung Choi，Sungwon Kim，Yonghyun Jeong，Youngjune Gwon，Sungroh Yoon
ICCV 2021（口服）。 [纸] [github]
2021 年 8 月 6 日

SDEDIT：带有随机微分方程的引导图像合成和编辑
Chenlin Meng，Yutong He，Yang Song，Jiaming Song，Jiajun Wu，Jun-Yan Zhu，Stefano Ermon
ICLR 2022。[Paper] [Project] [GitHub]
2021 年 8 月 2 日

在离散状态空间中结构化denoising扩散模型
雅各布·奥斯汀（Jacob Austin），丹尼尔·约翰逊（Daniel D. Johnson），乔纳森·霍（Jonathan Ho），丹尼尔·塔洛
神经2021。[纸]
2021 年 7 月 7 日

变分扩散模型
Diederik P. Kingma，Tim Salimans，Ben Poole，Jonathan Ho
Arxiv 2021。[Paper] [Github]
2021 年 7 月 1 日

差异自动编码器中的扩散先验
Antoine Wehenkel，Gilles Lowppe
ICML研讨会2021。[纸]
2021 年 6 月 29 日

通过Schrödinger桥的深入生成学习
Gefei Wang，Yuling Jia，Qian Xu，Yang Wang，CAN YANG
ICML 2021。[纸]
2021 年 6 月 19 日

非高斯去噪扩散模型
Eliya Nachmani，Robin San Roman，Lior Wolf
Arxiv 2021。[Paper] [Project]
2021 年 6 月 14 日

D2C：用于少量有条件产生的扩散 - 降解模型
Abhishek Sinha，Jiaming Song，Chenlin Meng，Stefano Ermon
神经2021。[Paper] [Project] [Github]
2021 年 6 月 12 日

潜在空间中基于得分的生成建模
Arash Vahdat，Karsten Kreis，Jan Kautz
Arxiv 2021。[纸]
2021 年 6 月 10 日

学习从扩散概率模型中有效采样
丹尼尔·沃森（Daniel Watson），乔纳森·霍（Jonathan Ho），穆罕默德·诺鲁兹（Mohammad Norouzi），威廉·陈（William Chan）
Arxiv 2021。[纸]
2021 年 6 月 7 日

基于扩散的生成模型和评分匹配的变分观点
Chin-Wei Huang，Jae Hyun Lim，亚伦·库尔维尔
神经2021。[纸] [github]
2021 年 6 月 5 日

软截断：基于得分扩散模型的通用训练技术，用于高精度得分估计
Dongjun Kim，Seungjae Shin，Kyungwoo Song，Wanmo Kang，Il-Chul Moon
ICML 2022。[纸]
2021 年 6 月 10 日

扩散Schrödinger桥，并应用于基于分数的生成建模
Valentin de Bortoli，James Thornton，Jeremy Heng，Arnaud Doucet
Arxiv 2021。[Paper] [Project] [GitHub]
2021 年 6 月 1 日

关于扩散概率模型的快速采样
希芬·孔，魏ping
ICML研讨会2021。[Paper] [Github]
2021 年 5 月 31 日

高保真图像产生的级联扩散模型
乔纳森·霍（Jonathan Ho），奇旺·萨哈里亚（Chitwan Saharia），威廉·陈（William Chan），大卫·J·弗利特（David J. Fleet），穆罕默德·诺鲁兹（Mohammad Norouzi）
JMLR 2021。[Paper] [Project]
2021 年 5 月 30 日

用基于分数的模型生成数据时必须快速发展
Alexia Jolicoeur-Martineau，Ke Li，RémiPiché-Taillefer，Tal Kachman，Ioannis Mitliagkas
Arxiv 2021。[Paper] [Github]
2021 年 5 月 28 日

扩散模型在图像合成方面击败了 GAN
Prafulla Dhariwal，Alex Nichol
Arxiv 2021。[Paper] [Github]
2021 年 5 月 11 日

通过迭代细化实现图像超分辨率
Chitwan Saharia，Jonathan Ho，William Chan，Tim Salimans，David J. Fleet，Mohammad Norouzi
Arxiv 2021。[Paper] [Project] [GitHub]
2021 年 4 月 15 日

生成扩散模型的噪声估计
罗宾·圣罗曼（Robin San-Roman），埃利亚·纳赫（Eliya Nachmani）
Arxiv 2021。[纸]
2021 年 4 月 6 日

改进的去噪扩散概率模型
Alex Nichol，Prafulla Dhariwal
ICLR 2021。[Paper] [Github]
2021 年 2 月 18 日

基于分数的扩散模型的最大似然训练
Yang Song，Conor Durkan，Iain Murray，Stefano Ermon
Arxiv 2021。[纸]
2021 年 1 月 22 日

迭代生成模型中的知识蒸馏，以提高采样速度
埃里克·卢曼（Eric Luhman），特洛伊·卢曼（Troy Luhman）
Arxiv 2021。[Paper] [Github]
2021 年 1 月 7 日

通过扩散恢复的可能性学习基于能量的模型
Ruiqi Gao，Yang Song，Ben Poole，Ying Nian Wu，Diederik P. Kingma
ICLR 2021。[Paper] [Github]
2020 年 12 月 15 日

通过随机微分方程进行基于分数的生成模型
Yang Song，Jascha Sohl-Dickstein，Diederik P. Kingma，Abhishek Kumar，Stefano Ermon，Ben Poole
ICLR 2021（口服）。 [纸] [github]
2020 年 11 月 26 日

基于能量的潜在变量模型中得分函数的变分（梯度）估计值
Fan Bao，Kun Xu，Chongxuan Li，Lanqing Hong，Jun Zhu，Bo Zhang
ICML 2021。[纸]
2020 年 10 月 16 日

去噪扩散隐式模型
Jiaming Song，Chenlin Meng，Stefano Ermon
ICLR 2021。[Paper] [Github]
2020 年 10 月 6 日

对抗分数匹配和改进图像生成的采样
Alexia Jolicoeur-Martineau，RémiPiché-Taillefer，RémiTachet des Combes，Ioannis Mitliagkas
ICLR 2021。[Paper] [Github]
2020 年 9 月 11 日

去噪扩散概率模型
乔纳森·何 (Jonathan Ho)、阿杰·贾恩 (Ajay Jain)、彼得·阿贝尔 (Pieter Abbeel)
神经2020。[Paper] [GitHub] [GitHub2]
2020年6月19日

训练基于分数的生成模型的改进技术
杨歌，Stefano Ermon
神经2020。[纸] [github]
2020 年 6 月 16 日

通过估计数据分布的梯度进行生成建模
杨歌，Stefano Ermon
Neurips 2019。[Paper] [Project] [Github]
2019 年 7 月 12 日

神经随机微分方程：扩散极限中的深层高斯模型
Belinda Tzen，Maxim Raginsky
Arxiv 2019。[纸]
2019 年 5 月 23 日

使用非平衡热力学的深度无监督学习
Jascha Sohl-Dickstein，Eric A. Weiss，Niru Maheswaranathan，Surya Ganguli
ICML 2015。[Paper] [GitHub]
2015 年 3 月 2 日

分类

基于脱氧扩散概率模型的基于可能性的离分布检测
约瑟夫·好，尼尔DF坎贝尔
BMVC 2023。[纸]
2023 年 10 月 26 日

多尺度扩散剥离平滑
Jongheon Jeong，Jinwoo Shin
神经2023。[纸]
2023 年 10 月 25 日

diffref3d：一个基于扩散的提案改进框架3D对象检测
Se-Ho Kim，Inyong Koo，Inyoung Lee，Byeongjun Park，Changick Kim
Arxiv 2023。[纸]
2023 年 10 月 25 日

扩散模型的剥落任务路由
Byeongjun Park，Sangmin Woo，Hyojun GO，Jin-Young Kim，Changick Kim
Arxiv 2023。[纸]
2023 年 10 月 11 日

利用基于扩散的图像变化，以在中毒数据上进行强大的训练
Lukas Struppek，Martin B. Hentschel，Clifton Poth，Dominik Hintersdorf，Kristian Kersting
Arxiv 2023。[Paper] [Github]
2023 年 10 月 10 日

梦想不可能：带有扩散模型的想象力
Xuefeng du，Yiyou Sun，Xiaojin Zhu，yixuan li
神经2023。[Paper] [Github]
2023 年 9 月 23 日

用语言视觉模型计数的零拍对象
Jingyi Xu，Hieu LE，Dimitris Samaras
CVPR 2023。[Paper] [Github]
2023 年 9 月 22 日

PSDIFF：迭代和协作精炼的人搜索的扩散模型
Chengyou Jia，Minnan Luo，Zhuohang Dang，Guang Dai，Xiaojun Chang，Jingdong Wang，Qinghua Zheng
Arxiv 2023。[纸]
2023 年 9 月 20 日

超越发电：将文本利用到图像模型以进行对象检测和细分
Yunhao GE，Jiashu Xu，Brian Nlong Zhao，Neel Joshi，Laurent Itti，Vibhav Vineet
Arxiv 2023。[Paper] [Github]
2023 年 9 月 12 日

diffusionEngine：扩散模型是可扩展的数据引擎用于对象检测
Manlin Zhang，Jie Wu，Yuxi Ren，Ming Li，Jie Qin，Xuefeng Xiao，Wei Liu，Rui Wang，Min Zheng，Andy J. Ma
Arxiv 2023。[Paper] [Project] [Github]
2023 年 9 月 7 日

基于扩散的3D对象检测随机盒
Xin Zhou，Jinghua Hou，Tingting Yao，Dingkang Liang，Zhe Liu，Zhikang Zou，XiaoQing Ye，Jianwei Cheng，Xiang bai
PRCV 2023。[纸]
2023 年 9 月 5 日

扩散模型作为代表学习者
Xingyi Yang，Xinchao Wang
ICCV 2023。[纸]
2023 年 8 月 21 日

扩散导线：多对象跟踪的扩散模型
Run Luo，Zikai Song，Lintao MA，Jinlin Wei，Wei Yang，Min Yang
Arxiv 2023。[纸]
2023 年 8 月 19 日

DIFFGUARD：使用预训练的扩散模型的语义不匹配引导的分布外检测
Ruiyuan Gao，Chenchen Zhao，Lanqing Hong，Qiang Xu
Arxiv 2023。[纸]
2023 年 8 月 15 日

IDIFF-FACE：通过Fizzy身份条件扩散模型基于合成的面部识别
Fadi Boutros，Jonas Henry Grebe，Arjan Kuijper，Naser Damer
ICCV 2023。[纸]
2023 年 8 月 9 日

利用合成数据来解决数据不平衡问题：从数据角度来看基线
Moon Ye-bin，Nam Hyeon-Woo，Wonseok Choi，Nayeong Kim，Suha Kwak，Tae-hyun哦
Arxiv 2023。[纸]
2023 年 8 月 2 日

用于伪装物体检测的扩散模型
Zhennan Chen，Rongrong Gao，Tian-Zhu Xiang，粉丝林
ECAI 2023。[纸]
2023 年 8 月 1 日

扩散：基于视频的人姿势估计的时空扩散模型
Runyang Feng, Yixing Gao, Tze Ho Elden Tse, Xueqing Ma, Hyung Jin Chang
arXiv 2023. [Paper]
2023 年 7 月 31 日

MetaDiff: Meta-Learning with Conditional Diffusion for Few-Shot Learning
Baoquan Zhang, Demin Yu
arXiv 2023. [Paper]
2023 年 7 月 31 日

Generative Prompt Model for Weakly Supervised Object Localization
Yuzhong Zhao, Qixiang Ye, Weijia Wu, Chunhua Shen, Fang Wan
ICCV 2023. [Paper] [Github]
2023 年 7 月 19 日

Diffusion Models Beat GANs on Image Classification
Soumik Mukhopadhyay, Matthew Gwilliam, Vatsal Agarwal, Namitha Padmanabhan, Archana Swaminathan, Srinidhi Hegde, Tianyi Zhou, Abhinav Shrivastava
arXiv 2023. [Paper]
2023 年 7 月 17 日

Diffusion to Confusion: Naturalistic Adversarial Patch Generation Based on Diffusion Model for Object Detector
Shuo-Yen Lin, Ernie Chu, Che-Hsien Lin, Jun-Cheng Chen, Jia-Ching Wang
arXiv 2023. [Paper]
2023 年 7 月 16 日

DreamTeacher: Pretraining Image Backbones with Deep Generative Models
Daiqing Li, Huan Ling, Amlan Kar, David Acuna, Seung Wook Kim, Karsten Kreis, Antonio Torralba, Sanja Fidler
arXiv 2023. [Paper] [Project]
2023 年 7 月 14 日

ProtoDiff: Learning to Learn Prototypical Networks by Task-Guided Diffusion
Yingjun Du, Zehao Xiao, Shengcai Liao, Cees Snoek
arXiv 2023. [Paper]
2023 年 6 月 26 日

Masked Diffusion Models are Fast Learners
Jiachen Lei, Peng Cheng, Zhongjie Ba, Kui Ren
arXiv 2023. [Paper]
2023 年 6 月 20 日

Renderers are Good Zero-Shot Representation Learners: Exploring Diffusion Latents for Metric Learning
Michael Tang, David Shustin
arXiv 2023. [Paper]
2023 年 6 月 19 日

The Big Data Myth: Using Diffusion Models for Dataset Generation to Train Deep Detection Models
Roy Voetman, Maya Aghaei, Klaas Dijkstra
arXiv 2023. [Paper]
2023 年 6 月 16 日

When Hyperspectral Image Classification Meets Diffusion Models: An Unsupervised Feature Learning Framework
Jingyi Zhou, Jiamu Sheng, Jiayuan Fan, Peng Ye, Tong He, Bin Wang, Tao Chen
arXiv 2023. [Paper]
2023 年 6 月 15 日

DDLP: Unsupervised Object-Centric Video Prediction with Deep Dynamic Latent Particles
Tal Daniel, Aviv Tamar
arXiv 2023. [Paper]
2023 年 6 月 9 日

ADDP: Learning General Representations for Image Recognition and Generation with Alternating Denoising Diffusion Process
Changyao Tian, Chenxin Tao, Jifeng Dai, Hao Li, Ziheng Li, Lewei Lu, Xiaogang Wang, Hongsheng Li, Gao Huang, Xizhou Zhu
arXiv 2023. [Paper]
2023 年 6 月 8 日

Conditional Generation from Unconditional Diffusion Models using Denoiser Representations
Alexandros Graikos, Srikar Yellapragada, Dimitris Samaras
BMVC 2023. [Paper] [Github]
2023 年 6 月 2 日

DiffCLIP: Leveraging Stable Diffusion for Language Grounded 3D Classification
Sitian Shen, Zilin Zhu, Linqian Fan, Harry Zhang, Xinxiao Wu
arXiv 2023. [Paper]
2023 年 5 月 25 日

Training on Thin Air: Improve Image Classification with Generated Data
Yongchao Zhou, Hshmat Sahak, Jimmy Ba
arXiv 2023. [Paper] [Project] [Github]
2023 年 5 月 24 日

Is Synthetic Data From Diffusion Models Ready for Knowledge Distillation?
Zheng Li, Yuxuan Li, Penghai Zhao, Renjie Song, Xiang Li, Jian Yang
arXiv 2023. [Paper] [Github]
2023 年 5 月 22 日

Boosting Human-Object Interaction Detection with Text-to-Image Diffusion Model
Jie Yang, Bingliang Li, Fengyu Yang, Ailing Zeng, Lei Zhang, Ruimao Zhang
arXiv 2023. [Paper]
2023 年 5 月 20 日

Meta-DM: Applications of Diffusion Models on Few-Shot Learning
Wentao Hu, Xiurong Jiang, Jiarun Liu, Yuqi Yang, Hui Tian
arXiv 2023. [Paper]
2023 年 5 月 14 日

Class-Balancing Diffusion Models
Yiming Qin, Huangjie Zheng, Jiangchao Yao, Mingyuan Zhou, Ya Zhang
CVPR 2023. [Paper]
2023 年 4 月 30 日

Synthetic Data from Diffusion Models Improves ImageNet Classification
Shekoofeh Azizi, Simon Kornblith, Chitwan Saharia, Mohammad Norouzi, David J. Fleet
arXiv 2023. [Paper]
2023 年 4 月 17 日

OVTrack: Open-Vocabulary Multiple Object Tracking
Siyuan Li, Tobias Fischer, Lei Ke, Henghui Ding, Martin Danelljan, Fisher Yu
arXiv 2023. [Paper]
2023 年 4 月 17 日

Your Diffusion Model is Secretly a Zero-Shot Classifier
Alexander C. Li, Mihir Prabhudesai, Shivam Duggal, Ellis Brown, Deepak Pathak
arXiv 2023. [Paper] [Project]
28 Mar 2023

Text-to-Image Diffusion Models are Zero-Shot Classifiers
Kevin Clark, Priyank Jaini
arXiv 2023. [Paper]
2023 年 3 月 27 日

Diffusion Denoised Smoothing for Certified and Adversarial Robust Out-Of-Distribution Detection
Nicola Franco, Daniel Korth, Jeanette Miriam Lorenz, Karsten Roscher, Stephan Guennemann
arXiv 2023. [Paper]
2023 年 3 月 27 日

CIFAKE: Image Classification and Explainable Identification of AI-Generated Synthetic Images
Jordan J. Bird, Ahmad Lotfi
arXiv 2023. [Paper]
2023 年 3 月 24 日

Denoising Diffusion Autoencoders are Unified Self-supervised Learners
Weilai Xiang, Hongyu Yang, Di Huang, Yunhong Wang
arXiv 2023. [Paper] )]
2023 年 3 月 17 日

Boosting Zero-shot Classification with Synthetic Data Diversity via Stable Diffusion
Jordan Shipard, Arnold Wiliem, Kien Nguyen Thanh, Wei Xiang, Clinton Fookes
arXiv 2023. [Paper]
2023 年 2 月 7 日

Fake it till you make it: Learning(s) from a synthetic ImageNet clone
Mert Bulent Sariyildiz, Karteek Alahari, Diane Larlus, Yannis Kalantidis
CVPR 2023. [Paper] [Project]
2022 年 12 月 16 日

DiffAlign : Few-shot learning using diffusion based synthesis and alignment
Aniket Roy, Anshul Shah, Ketul Shah, Anirban Roy, Rama Chellappa
arXiv 2022. [Paper]
2022 年 12 月 11 日

Diffusion Denoising Process for Perceptron Bias in Out-of-distribution Detection
Luping Liu, Yi Ren, Xize Cheng, Zhou Zhao
arXiv 2022. [Paper] [Github]
2022 年 11 月 21 日

DiffusionDet：用于物体检测的扩散模型
Shoufa Chen, Peize Sun, Yibing Song, Ping Luo
arXiv 2022. [Paper] [Github]
2022 年 11 月 17 日

Denoising Diffusion Models for Out-of-Distribution Detection
Mark S. Graham, Walter HL Pinaya, Petru-Daniel Tudosiu, Parashkev Nachev, Sebastien Ourselin, M. Jorge Cardoso
arXiv 2022. [Paper] [Github]
2022 年 11 月 14 日

A simple, efficient and scalable contrastive masked autoencoder for learning visual representations
Shlok Mishra, Joshua Robinson, Huiwen Chang, David Jacobs, Aaron Sarna, Aaron Maschinot, Dilip Krishnan
arXiv 2022. [Paper]
2022 年 10 月 30 日

From Points to Functions: Infinite-dimensional Representations in Diffusion Models
Sarthak Mittal, Guillaume Lajoie, Stefan Bauer, Arash Mehrjou
arXiv 2022. [Paper] [Github]
2022 年 10 月 25 日

Boomerang: Local sampling on image manifolds using diffusion models
Lorenzo Luzi, Ali Siahkoohi, Paul M Mayer, Josue Casco-Rodriguez, Richard Baraniuk
arXiv 2022. [Paper] [Colab]
2022 年 10 月 21 日

Meta-Learning via Classifier(-free) Guidance
Elvis Nava, Seijin Kobayashi, Yifei Yin, Robert K. Katzschmann, Benjamin F. Grewe
arXiv 2022. [Paper]
2022 年 10 月 17 日

分割

One-shot Localization and Segmentation of Medical Images with Foundation Models
Deepa Anand, Gurunath Reddy M, Vanika Singhal, Dattesh D. Shanbhag, Shriram KS, Uday Patil, Chitresh Bhushan, Kavitha Manickam, Dawei Gui, Rakesh Mullick, Avinash Gopal, Parminder Bhatia, Taha Kass-Hout
arXiv 2023. [Paper]
2023 年 10 月 28 日

Semantic-preserving image coding based on Conditional Diffusion models
Francesco Pezone, Osman Musa, Giuseppe Caire, Sergio Barbarossa
arXiv 2023. [Paper]
2023 年 10 月 24 日

Diffusion-based Data Augmentation for Nuclei Image Segmentation
Xinyi Yu, Guanbin Li, Wei Lou, Siqi Liu, Xiang Wan, Yan Chen, Haofeng Li
arXiv 2023. [Paper]
2023 年 10 月 22 日

EMIT-Diff: Enhancing Medical Image Segmentation via Text-Guided Diffusion Model
Zheyuan Zhang, Lanhong Yao, Bin Wang, Debesh Jha, Elif Keles, Alpay Medetalibeyoglu, Ulas Bagci
arXiv 2023. [Paper]
2023 年 10 月 19 日

Towards Training-free Open-world Segmentation via Image Prompting Foundation Models
Lv Tang, Peng-Tao Jiang, Hao-Ke Xiao, Bo Li
arXiv 2023. [Paper]
2023 年 10 月 17 日

Towards Generic Semi-Supervised Framework for Volumetric Medical Image Segmentation
Haonan Wang, Xiaomeng Li
NeurIPS 2023. [Paper] [Github]
2023 年 10 月 17 日

Image Augmentation with Controlled Diffusion for Weakly-Supervised Semantic Segmentation
Wangyu Wu, Tianhong Dai, Xiaowei Huang, Fei Ma, Jimin Xiao
arXiv 2023. [Paper]
2023 年 10 月 15 日

Steered Diffusion: A Generalized Framework for Plug-and-Play Conditional Image Synthesis
Nithin Gopalakrishnan Nair, Anoop Cherian, Suhas Lohit, Ye Wang, Toshiaki Koike-Akino, Vishal M. Patel, Tim K. Marks
ICCV 2023. [Paper]
2023 年 9 月 30 日

Factorized Diffusion Architectures for Unsupervised Image Generation and Segmentation
Xin Yuan, Michael Maire
arXiv 2023. [Paper]
2023 年 9 月 27 日

Dataset Diffusion: Diffusion-based Synthetic Dataset Generation for Pixel-Level Semantic Segmentation
Quang Nguyen, Truong Vu, Anh Tran, Khoi Nguyen
arXiv 2023. [Paper]
2023 年 9 月 25 日

MosaicFusion: Diffusion Models as Data Augmenters for Large Vocabulary Instance Segmentation
Jiahao Xie, Wei Li, Xiangtai Li, Ziwei Liu, Yew Soon Ong, Chen Change Loy
arXiv 2023. [Paper] [Github]
2023 年 9 月 22 日

Beyond Generation: Harnessing Text to Image Models for Object Detection and Segmentation
Yunhao Ge, Jiashu Xu, Brian Nlong Zhao, Neel Joshi, Laurent Itti, Vibhav Vineet
arXiv 2023. [Paper] [Github]
2023 年 9 月 12 日

Introducing Shape Prior Module in Diffusion Model for Medical Image Segmentation
Zhiqing Zhang, Guojia Fan, Tianyong Liu, Nan Li, Yuyang Liu, Ziyu Liu, Canwei Dong, Shoujun Zhou
arXiv 2023. [Paper]
2023 年 9 月 12 日

From Text to Mask: Localizing Entities Using the Attention of Text-to-Image Diffusion Models
Changming Xiao, Qi Yang, Feng Zhou, Changshui Zhang
arXiv 2023. [Paper]
2023 年 9 月 8 日

SLiMe: Segment Like Me
Aliasghar Khani, Saeid Asgari Taghanaki, Aditya Sanghi, Ali Mahdavi Amiri, Ghassan Hamarneh
arXiv 2023. [Paper] [Github]
2023 年 9 月 6 日

Diffusion Model is Secretly a Training-free Open Vocabulary Semantic Segmenter
Jinglong Wang, Xiawei Li, Jing Zhang, Qingyuan Xu, Qin Zhou, Qian Yu, Lu Sheng, Dong Xu
arXiv 2023. [Paper]
2023 年 9 月 6 日

GenSelfDiff-HIS: Generative Self-Supervision Using Diffusion for Histopathological Image Segmentation
Vishnuvardhan Purma, Suhas Srinath, Seshan Srirangarajan, Aanchal Kakkar, Prathosh A. P
arXiv 2023. [Paper] [Github]
2023 年 9 月 4 日

Attention as Annotation: Generating Images and Pseudo-masks for Weakly Supervised Semantic Segmentation with Diffusion
Ryota Yoshihashi, Yuya Otsuka, Kenji Doi, Tomohiro Tanaka
AAAI 2022. [Paper]
2023 年 9 月 4 日

ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic Diffusion Models
Yuhao Du, Yuncheng Jiang, Shuangyi Tan, Xusheng Wu, Qi Dou, Zhen Li, Guanbin Li, Xiang Wan
arXiv 2023. [Paper]
2023 年 9 月 3 日

Ref-Diff: Zero-shot Referring Image Segmentation with Generative Models
Minheng Ni, Yabo Zhang, Kailai Feng, Xiaoming Li, Yiwen Guo, Wangmeng Zuo
arXiv 2023. [Paper]
2023 年 8 月 31 日

Modality Cycles with Masked Conditional Diffusion for Unsupervised Anomaly Segmentation in MRI
Ziyun Liang, Harry Anthony, Felix Wagner, Konstantinos Kamnitsas
arXiv 2023. [Paper]
2023 年 8 月 30 日

A Recycling Training Strategy for Medical Image Segmentation with Diffusion Denoising Models
Yunguan Fu, Yiwen Li, Shaheer U Saeed, Matthew J Clarkson, Yipeng Hu
arXiv 2023. [Paper] [Github]
2023 年 8 月 30 日

Diffuse, Attend, and Segment: Unsupervised Zero-Shot Segmentation using Stable Diffusion
Junjiao Tian, Lavisha Aggarwal, Andrea Colaco, Zsolt Kira, Mar Gonzalez-Franco
arXiv 2023. [Paper]
2023 年 8 月 23 日

Diffusion-based Image Translation with Label Guidance for Domain Adaptive Semantic Segmentation
Duo Peng, Ping Hu, Qiuhong Ke, Jun Liu
arXiv 2023. [Paper]
2023 年 8 月 23 日

DMCVR: Morphology-Guided Diffusion Model for 3D Cardiac Volume Reconstruction
Xiaoxiao He, Chaowei Tan, Ligong Han, Bo Liu, Leon Axel, Kang Li, Dimitris N. Metaxas
MICCAI 2023. [Paper] [Github]
2023 年 8 月 18 日

Masked Diffusion as Self-supervised Representation Learner
Zixuan Pan, Jianxu Chen, Yiyu Shi
arXiv 2023. [Paper]
2023 年 8 月 10 日

DermoSegDiff: A Boundary-aware Segmentation Diffusion Model for Skin Lesion Delineation
Afshin Bozorgpour, Yousef Sadegheih, Amirhossein Kazerouni, Reza Azad, Dorit Merhof
MICCAI Workshop 2023. [Paper] [Github]
2023 年 8 月 5 日

DiffusePast: Diffusion-based Generative Replay for Class Incremental Semantic Segmentation
Jingfan Chen, Yuxi Wang, Pengfei Wang, Xiao Chen, Zhaoxiang Zhang, Zhen Lei, Qing Li
arXiv 2023. [Paper]
2023 年 8 月 2 日

DAVIS: High-Quality Audio-Visual Separation with Generative Diffusion Models
Chao Huang, Susan Liang, Yapeng Tian, Anurag Kumar, Chenliang Xu
arXiv 2023. [Paper]
2023 年 7 月 31 日

Pre-Training with Diffusion models for Dental Radiography segmentation
Jérémy Rousseau, Christian Alaka, Emma Covili, Hippolyte Mayard, Laura Misrachi, Willy Au
arXiv 2023. [Paper]
2023 年 7 月 26 日

FEDD -- Fair, Efficient, and Diverse Diffusion-based Lesion Segmentation and Malignancy Classification
Héctor Carrión, Narges Norouzi
MICCAI 2023. [Paper] [Github]
2023 年 7 月 21 日

Prompting Diffusion Representations for Cross-Domain Semantic Segmentation
Rui Gong, Martin Danelljan, Han Sun, Julio Delgado Mangas, Luc Van Gool
arXiv 2023. [Paper]
2023 年 7 月 5 日

DifFSS: Diffusion Model for Few-Shot Semantic Segmentation
Weimin Tan, Siyuan Chen, Bo Yan
arXiv 2023. [Paper]
2023 年 7 月 3 日

Towards Better Certified Segmentation via Diffusion Models
Othmane Laousy, Alexandre Araujo, Guillaume Chassagnon, Marie-Pierre Revel, Siddharth Garg, Farshad Khorrami, Maria Vakalopoulou
arXiv 2023. [Paper]
2023 年 6 月 16 日

Diffusion Models for Zero-Shot Open-Vocabulary Segmentation
Laurynas Karazija, Iro Laina, Andrea Vedaldi, Christian Rupprecht
arXiv 2023. [Paper]
2023 年 6 月 15 日

Annotator Consensus Prediction for Medical Image Segmentation with Diffusion Models
Tomer Amit, Shmuel Shichrur, Tal Shaharabany, Lior Wolf
arXiv 2023. [Paper]
2023 年 6 月 15 日

Generative Semantic Communication: Diffusion Models Beyond Bit Recovery
Eleonora Grassucci, Sergio Barbarossa, Danilo Comminiello
arXiv 2023. [Paper] [Github]
7 Jun 2023

Conditional Diffusion Models for Weakly Supervised Medical Image Segmentation
Xinrong Hu, Yu-Jen Chen, Tsung-Yi Ho, Yiyu Shi
arXiv 2023. [Paper]
2023 年 6 月 6 日

DFormer: Diffusion-guided Transformer for Universal Image Segmentation
Hefeng Wang, Jiale Cao, Rao Muhammad Anwer, Jin Xie, Fahad Shahbaz Khan, Yanwei Pang
arXiv 2023. [Paper] [Github]
2023 年 6 月 6 日

Denoising Diffusion Semantic Segmentation with Mask Prior Modeling
Zeqiang Lai, Yuchen Duan, Jifeng Dai, Ziheng Li, Ying Fu, Hongsheng Li, Yu Qiao, Wenhai Wang
arXiv 2023. [Paper]
2023 年 6 月 2 日

Multi-Level Global Context Cross Consistency Model for Semi-Supervised Ultrasound Image Segmentation with Diffusion Model
Fenghe Tang, Jianrui Ding, Lingtao Wang, Min Xian, Chunping Ning
arXiv 2023. [Paper] [Github]
2023 年 5 月 16 日

Echo from noise: synthetic ultrasound image generation using diffusion models for real image segmentation
David Stojanovski, Uxio Hermida, Pablo Lamata, Arian Beqiri, Alberto Gomez
arXiv 2023. [Paper]
2023 年 5 月 9 日

Personalize Segment Anything Model with One Shot
Renrui Zhang, Zhengkai Jiang, Ziyu Guo, Shilin Yan, Junting Pan, Hao Dong, Peng Gao, Hongsheng Li
arXiv 2023. [Paper] [Github]
2023 年 5 月 4 日

Unsupervised Discovery of 3D Hierarchical Structure with Generative Diffusion Features
Nurislam Tursynbek, Marc Niethammer
arXiv 2023. [Paper]
2023 年 4 月 28 日

DiffuseExpand: Expanding dataset for 2D medical image segmentation using diffusion models
Shitong Shao, Xiaohan Yuan, Zhen Huang, Ziming Qiu, Shuai Wang, Kevin Zhou
arXiv 2023. [Paper] [Github]
2023 年 4 月 26 日

Realistic Data Enrichment for Robust Image Segmentation in Histopathology
Sarah Cechnicka, James Ball, Callum Arthurs, Candice Roufosse, Bernhard Kainz
arXiv 2023. [Paper]
2023 年 4 月 19 日

Denoising Diffusion Medical Models
Pham Ngoc Huy, Tran Minh Quan
IEEE ISBI 2023. [Paper]
2023 年 4 月 19 日

使用扩散模型进行模糊医学图像分割
Aimon Rahman, Jeya Maria Jose Valanarasu, Ilker Hacihaliloglu, Vishal M Patel
CVPR 2023. [Paper] [Github]
2023 年 4 月 10 日

BerDiff: Conditional Bernoulli Diffusion Model for Medical Image Segmentation
Tao Chen, Chenhui Wang, Hongming Shan
arXiv 2023. [Paper]
2023 年 4 月 10 日

Distribution Aligned Diffusion and Prototype-guided network for Unsupervised Domain Adaptive Segmentation
Haipeng Zhou, Lei Zhu, Yuyin Zhou
arXiv 2023. [Paper]
2023 年 3 月 22 日

Semantic Latent Space Regression of Diffusion Autoencoders for Vertebral Fracture Grading
Matthias Keicher, Matan Atad, David Schinz, Alexandra S. Gersing, Sarah C. Foreman, Sophia S. Goller, Juergen Weissinger, Jon Rischewski, Anna-Sophia Dietrich, Benedikt Wiestler, Jan S. Kirschke, Nassir Navab
arXiv 2023. [Paper]
2023 年 3 月 21 日

LD-ZNet: A Latent Diffusion Approach for Text-Based Image Segmentation
Koutilya Pnvr, Bharat Singh, Pallabi Ghosh, Behjat Siddiquie, David Jacobs
arXiv 2023. [Paper]
2023 年 3 月 22 日

DiffuMask: Synthesizing Images with Pixel-level Annotations for Semantic Segmentation Using Diffusion Models
Weijia Wu, Yuzhong Zhao, Mike Zheng Shou, Hong Zhou, Chunhua Shen
arXiv 2023. [Paper] [Project]
2023 年 3 月 21 日

Object-Centric Slot Diffusion
Jindong Jiang, Fei Deng, Gautam Singh, Sungjin Ahn
arXiv 2023. [Paper]
2023 年 3 月 20 日

Diff-UNet: A Diffusion Embedded Network for Volumetric Segmentation
Zhaohu Xing, Liang Wan, Huazhu Fu, Guang Yang, Lei Zhu
arXiv 2023. [Paper] [Github]
2023 年 3 月 18 日

DiffusionSeg: Adapting Diffusion Towards Unsupervised Object Discovery
Chaofan Ma, Yuhuan Yang, Chen Ju, Fei Zhang, Jinxiang Liu, Yu Wang, Ya Zhang, Yanfeng Wang
arXiv 2023. [Paper]
2023 年 3 月 17 日

Stochastic Segmentation with Conditional Categorical Diffusion Models
Lukas Zbinden, Lars Doorenbos, Theodoros Pissas, Raphael Sznitman, Pablo Márquez-Neila
ICCV 2023. [Paper] [Github]
2023 年 3 月 15 日

DiffBEV: Conditional Diffusion Model for Bird's Eye View Perception
Jiayu Zou, Zheng Zhu, Yun Ye, Xingang Wang
arXiv 2023. [Paper]
2023 年 3 月 15 日

Importance of Aligning Training Strategy with Evaluation for Diffusion Models in 3D Multiclass Segmentation
Yunguan Fu, Yiwen Li, Shaheer U. Saeed, Matthew J. Clarkson, Yipeng Hu
arXiv 2023. [Paper] [Github]
2023 年 3 月 10 日

MaskDiff: Modeling Mask Distribution with Diffusion Probabilistic Model for Few-Shot Instance Segmentation
Minh-Quan Le, Tam V. Nguyen, Trung-Nghia Le, Thanh-Toan Do, Minh N. Do, Minh-Triet Tran
arXiv 2023. [Paper]
2023 年 3 月 9 日

Open-Vocabulary Panoptic Segmentation with Text-to-Image Diffusion Models
Jiarui Xu, Sifei Liu, Arash Vahdat, Wonmin Byeon, Xiaolong Wang, Shalini De Mello
arXiv 2023. [Paper] [Project]
2023 年 3 月 8 日

MedSegDiff-V2: Diffusion based Medical Image Segmentation with Transformer
Junde Wu, Rao Fu, Huihui Fang, Yu Zhang, Yanwu Xu
arXiv 2023. [Paper]
2023 年 1 月 19 日

DiffusionInst: Diffusion Model for Instance Segmentation
Zhangxuan Gu, Haoxing Chen, Zhuoer Xu, Jun Lan, Changhua Meng, Weiqiang Wang
arXiv 2022. [Paper] [Github]
6 DEc 2022

Multi-Class Segmentation from Aerial Views using Recursive Noise Diffusion
Benedikt Kolbeinsson, Krystian Mikolajczyk
arXiv 2022. [Paper]
2022 年 12 月 1 日

Peekaboo: Text to Image Diffusion Models are Zero-Shot Segmentors
Ryan Burgert, Kanchana Ranasinghe, Xiang Li, Michael S. Ryoo
arXiv 2022. [Paper]
2022 年 11 月 23 日

Improved HER2 Tumor Segmentation with Subtype Balancing using Deep Generative Networks
Mathias Öttl, Jana Mönius, Matthias Rübner, Carol I. Geppert, Jingna Qiu, Frauke Wilm, Arndt Hartmann, Matthias W. Beckmann, Peter A. Fasching, Andreas Maier, Ramona Erber, Katharina Breininger
arXiv 2022. [Paper]
2022 年 11 月 11 日

MedSegDiff: Medical Image Segmentation with Diffusion Probabilistic Model
Junde Wu, Huihui Fang, Yu Zhang, Yehui Yang, Yanwu Xu
arXiv 2022. [Paper]
2022 年 11 月 1 日

Accelerating Diffusion Models via Pre-segmentation Diffusion Sampling for Medical Image Segmentation
Xutao Guo, Yanwu Yang, Chenfei Ye, Shang Lu, Yang Xiang, Ting Ma
arXiv 2022. [Paper]
2022 年 10 月 27 日

Anatomically constrained CT image translation for heterogeneous blood vessel segmentation
Giammarco La Barbera, Haithem Boussaid, Francesco Maso, Sabine Sarnacki, Laurence Rouet, Pietro Gori, Isabelle Bloch
BMVC 2022. [Paper]
2022 年 10 月 4 日

Diffusion Adversarial Representation Learning for Self-supervised Vessel Segmentation
Boah Kim, Yujin Oh, Jong Chul Ye
arXiv 2022. [Paper]
2022 年 9 月 29 日

Can segmentation models be trained with fully synthetically generated data?
Virginia Fernandez, Walter Hugo Lopez Pinaya, Pedro Borges, Petru-Daniel Tudosiu, Mark S Graham, Tom Vercauteren, M Jorge Cardoso
arXiv 2022. [Paper]
2022 年 9 月 17 日

Let us Build Bridges: Understanding and Extending Diffusion Generative Models
Xingchao Liu, Lemeng Wu, Mao Ye, Qiang Liu
arXiv 2022. [Paper]
2022 年 8 月 31 日

Semantic Image Synthesis via Diffusion Models
Weilun Wang, Jianmin Bao, Wengang Zhou, Dongdong Chen, Dong Chen, Lu Yuan, Houqiang Li
arXiv 2022. [Paper]
2022 年 6 月 30 日

Remote Sensing Change Detection (Segmentation) using Denoising Diffusion Probabilistic Models
Wele Gedara Chaminda Bandara, Nithin Gopalakrishnan Nair, Vishal M. Patel
arXiv 2022. [Paper] [Github]
2022 年 6 月 23 日

Diffusion models as plug-and-play priors
Alexandros Graikos, Nikolay Malkin, Nebojsa Jojic, Dimitris Samaras
arXiv 2022. [Paper]
2022 年 6 月 17 日

Fast Unsupervised Brain Anomaly Detection and Segmentation with Diffusion Models
Walter HL Pinaya, Mark S. Graham, Robert Gray, Pedro F Da Costa, Petru-Daniel Tudosiu, Paul Wright, Yee H. Mah, Andrew D. MacKinnon, James T. Teo, Rolf Jager, David Werring, Geraint Rees, Parashkev Nachev, Sebastien Ourselin, M. Jorge Cardos
MICCAI 2022. [Paper]
7 Jun 2022

用于语义分割的解码器去噪预训练
Emmanuel Brempong Asiedu, Simon Kornblith, Ting Chen, Niki Parmar, Matthias Minderer, Mohammad Norouzi
arXiv 2022. [Paper]
2022 年 5 月 23 日

Diffusion Models for Implicit Image Segmentation Ensembles
Julia Wolleb, Robin Sandkühler, Florentin Bieder, Philippe Valmaggia, Philippe C. Cattin
MIDL 2021. [Paper]
2021 年 12 月 6 日

Label-Efficient Semantic Segmentation with Diffusion Models
Dmitry Baranchuk, Ivan Rubachev, Andrey Voynov, Valentin Khrulkov, Artem Babenko
ICLR 2021. [Paper] [Github]
2021 年 12 月 6 日

SegDiff：使用扩散概率模型进行图像分割
Tomer Amit, Eliya Nachmani, Tal Shaharbany, Lior Wolf
arXiv 2021. [Paper]
1 Dec 2021

Argmax Flows and Multinomial Diffusion: Learning Categorical Distributions
Emiel Hoogeboom, Didrik Nielsen, Priyank Jaini, Patrick Forré, Max Welling
NeurIPS 2021. [Paper]
2021 年 2 月 10 日

图像翻译

Latent Diffusion Counterfactual Explanations
Karim Farid, Simon Schrodi, Max Argus, Thomas Brox
arXiv 2023. [Paper]
2023 年 10 月 10 日

Phasic Content Fusing Diffusion Model with Directional Distribution Consistency for Few-Shot Model Adaption
Teng Hu, Jiangning Zhang, Liang Liu, Ran Yi, Siqi Kou, Haokun Zhu, Xu Chen, Yabiao Wang, Chengjie Wang, Lizhuang Ma
ICCV 2023. [Paper]
2023 年 9 月 7 日

Latent Painter
Shih-Chieh Su
arXiv 2023. [Paper]
2023 年 8 月 31 日

Zero-shot Inversion Process for Image Attribute Editing with Diffusion Models
Zhanbo Feng, Zenan Ling, Ci Gong, Feng Zhou, Jie Li, Robert C. Qiu
arXiv 2023. [Paper]
2023 年 8 月 30 日

DiffI2I: Efficient Diffusion Model for Image-to-Image Translation
Bin Xia, Yulun Zhang, Shiyin Wang, Yitong Wang, Xinglong Wu, Yapeng Tian, Wenming Yang, Radu Timotfe, Luc Van Gool
arXiv 2023. [Paper]
2023 年 8 月 26 日

SSMG: Spatial-Semantic Map Guided Diffusion Model for Free-form Layout-to-Image Generation
Chengyou Jia, Minnan Luo, Zhuohang Dang, Guang Dai, Xiaojun Chang, Mengmeng Wang, Jingdong Wang
arXiv 2023. [Paper]
2023 年 8 月 20 日

MeDM: Mediating Image Diffusion Models for Video-to-Video Translation with Temporal Correspondence Guidance
Ernie Chu, Tzuhsuan Huang, Shuo-Yen Lin, Jun-Cheng Chen
arXiv 2023. [Paper] [Project]
2023 年 8 月 19 日

StyleDiffusion: Controllable Disentangled Style Transfer via Diffusion Models
Zhizhong Wang, Lei Zhao, Wei Xing
arXiv 2023. [Paper]
2023 年 8 月 15 日

Inversion-by-Inversion: Exemplar-based Sketch-to-Photo Synthesis via Stochastic Differential Equations without Training
Ximing Xing, Chuang Wang, Haitao Zhou, Zhihao Hu, Chongxuan Li, Dong Xu, Qian Yu
arXiv 2023. [Paper]
2023 年 8 月 15 日

Taming the Power of Diffusion Models for High-Quality Virtual Try-On with Appearance Flow
Junhong Gou, Siyu Sun, Jianfu Zhang, Jianlou Si, Chen Qian, Liqing Zhang
ACM MM 2023. [Paper]
2023 年 8 月 11 日

Head Rotation in Denoising Diffusion Models
Andrea Asperti, Gabriele Colasuonno, Antonio Guerra
arXiv 2023. [Paper]
2023 年 8 月 11 日

Photorealistic and Identity-Preserving Image-Based Emotion Manipulation with Latent Diffusion Models
Ioannis Pikoulis, Panagiotis P. Filntisis, Petros Maragos
arXiv 2023. [Paper]
2023 年 8 月 6 日

SDDM: Score-Decomposed Diffusion Models on Manifolds for Unpaired Image-to-Image Translation
Shikun Sun, Longhui Wei, Junliang Xing, Jia Jia, Qi Tian
ICML 2023. [Paper]
2023 年 8 月 4 日

Interpolating between Images with Diffusion Models
Clinton J. Wang, Polina Golland
ICML Workshop 2023. [Paper] [Project] [Github]
2023 年 7 月 24 日

TF-ICON: Diffusion-Based Training-Free Cross-Domain Image Composition
Shilin Lu, Yanzhu Liu, Adams Wai-Kin Kong
ICCV 2023. [Paper] [Github]
2023 年 7 月 24 日

DiffuseGAE: Controllable and High-fidelity Image Manipulation from Disentangled Representation
Yipeng Leng, Qiangjuan Huang, Zhiyuan Wang, Yangyang Liu, Haoyu Zhang
arXiv 2023. [Paper]
2023 年 7 月 12 日

DIFF-NST: Diffusion Interleaving For deFormable Neural Style Transfer
Dan Ruta, Gemma Canet Tarrés, Andrew Gilbert, Eli Shechtman, Nicholas Kolkin, John Collomosse
arXiv 2023. [Paper]
2023 年 7 月 9 日

Applying a Color Palette with Local Control using Diffusion Models
Vaibhav Vavilala, David Forsyth
arXiv 2023. [Paper]
2023 年 7 月 6 日

DragonDiffusion：在扩散模型上启用拖动式操作
Chong Mou, Xintao Wang, Jiechong Song, Ying Shan, Jian Zhang
arXiv 2023. [Paper] [Project]
2023 年 7 月 5 日

DragDiffusion：利用扩散模型进行交互式基于点的图像编辑
Yujun Shi, Chuhui Xue, Jiachun Pan, Wenqing Zhang, Vincent YF Tan, Song Bai
arXiv 2023. [Paper]
2023 年 6 月 26 日

ArtFusion: Controllable Arbitrary Style Transfer using Dual Conditional Latent Diffusion Models
Dar-Yen Chen
arXiv 2023. [Paper] [Github]
2023 年 6 月 15 日

InfoDiffusion: Representation Learning Using Information Maximizing Diffusion Models
Yingheng Wang, Yair Schiff, Aaron Gokaslan, Weishen Pan, Fei Wang, Christopher De Sa, Volodymyr Kuleshov
ICML 2023. [Paper]
2023 年 6 月 14 日

TryOnDiffusion: A Tale of Two UNets
Luyang Zhu, Dawei Yang, Tyler Zhu, Fitsum Reda, William Chan, Chitwan Saharia, Mohammad Norouzi, Ira Kemelmacher-Shlizerman
CVPR 2023. [Paper]
2023 年 6 月 14 日

Improving Diffusion-based Image Translation using Asymmetric Gradient Guidance
Gihyun Kwon, Jong Chul Ye
arXiv 2023. [Paper]
7 Jun 2023

DiffSketching: Sketch Control Image Synthesis with Diffusion Models
Qiang Wang, Di Kong, Fengyin Lin, Yonggang Qi
arXiv 2023. [Paper]
2023 年 5 月 30 日

Real-World Image Variation by Aligning Diffusion Inversion Chain
Yuechen Zhang, Jinbo Xing, Eric Lo, Jiaya Jia
arXiv 2023. [Paper]
2023 年 5 月 30 日

Photoswap: Personalized Subject Swapping in Images
Jing Gu, Yilin Wang, Nanxuan Zhao, Tsu-Jui Fu, Wei Xiong, Qing Liu, Zhifei Zhang, He Zhang, Jianming Zhang, HyunJoon Jung, Xin Eric Wang
arXiv 2023. [Paper] [Project]
2023 年 5 月 29 日

Diversify Your Vision Datasets with Automatic Diffusion-Based Augmentation
Lisa Dunlap, Alyssa Umino, Han Zhang, Jiezhi Yang, Joseph E. Gonzalez, Trevor Darrell
arXiv 2023. [Paper] [Github]
2023 年 5 月 25 日

Unpaired Image-to-Image Translation via Neural Schrödinger Bridge
Beomsu Kim, Gihyun Kwon, Kwanyoung Kim, Jong Chul Ye
arXiv 2023. [Paper] [Github]
2023 年 5 月 24 日

SAR-to-Optical Image Translation via Thermodynamics-inspired Network
Mingjin Zhang, Jiamin Xu, Chengyu He, Wenteng Shang, Yunsong Li, Xinbo Gao
arXiv 2023. [Paper]
2023 年 5 月 23 日

Null-text Guidance in Diffusion Models is Secretly a Cartoon-style Creator
Jing Zhao, Heliang Zheng, Chaoyue Wang, Long Lan, Wanrong Huang, Wenjing Yang
arXiv 2023. [Paper] [Project] [Github]
2023 年 5 月 11 日

ReGeneration Learning of Diffusion Models with Rich Prompts for Zero-Shot Image Translation
Yupei Lin, Sen Zhang, Xiaojun Yang, Xiao Wang, Yukai Shi
arXiv 2023. [Paper] [Project]
2023 年 5 月 8 日

Hierarchical Diffusion Autoencoders and Disentangled Image Manipulation
Zeyu Lu, Chengyue Wu, Xinyuan Chen, Yaohui Wang, Yu Qiao, Xihui Liu
arXiv 2023. [Paper]
2023 年 4 月 24 日

DiffusionRig: Learning Personalized Priors for Facial Appearance Editing
Zheng Ding, Xuaner Zhang, Zhihao Xia, Lars Jebe, Zhuowen Tu, Xiuming Zhang
CVPR 2023. [Paper] [Project] [Github]
2023 年 4 月 13 日

Face Animation with an Attribute-Guided Diffusion Model
Bohan Zeng, Xuhui Liu, Sicheng Gao, Boyu Liu, Hong Li, Jianzhuang Liu, Baochang Zhang
arXiv 2023. [Paper]
2023 年 4 月 6 日

Reference-based Image Composition with Sketch via Structure-aware Diffusion Model
Kangyeol Kim, Sunghyun Park, Junsoo Lee, Jaegul Choo
arXiv 2023. [Paper]
2023 年 3 月 31 日

Training-free Style Transfer Emerges from h-space in Diffusion models
Jaeseok Jeong, Mingi Kwon, Youngjung Uh
arXiv 2023. [Paper] [Project] [Github]
2023 年 3 月 27 日

Diffusion-based Target Sampler for Unsupervised Domain Adaptation
Yulong Zhang, Shuhao Chen, Yu Zhang, Jiangang Lu
arXiv 2023. [Paper]
2023 年 3 月 17 日

StyO: Stylize Your Face in Only One-Shot
Bonan Li, Zicheng Zhang, Xuecheng Nie, Congying Han, Yinhan Hu, Tiande Guo
arXiv 2023. [Paper]
6 Mar 2023

DiffFashion: Reference-based Fashion Design with Structure-aware Transfer by Diffusion Models
Shidong Cao, Wenhao Chai, Shengyu Hao, Yanting Zhang, Hangyue Chen, Gaoang Wang
arXiv 2023. [Paper]
2023 年 2 月 14 日

I2SB: Image-to-Image Schrödinger Bridge
Guan-Horng Liu, Arash Vahdat, De-An Huang, Evangelos A. Theodorou, Weili Nie, Anima Anandkumar
arXiv 2023. [Paper] [Project]
2023 年 2 月 12 日

Zero-shot-Learning Cross-Modality Data Translation Through Mutual Information Guided Stochastic Diffusion
Zihao Wang, Yingyu Yang, Maxime Sermesant, Hervé Delingette, Ona Wu
arXiv 2023. [Paper]
2023 年 1 月 31 日

DiffFace: Diffusion-based Face Swapping with Facial Guidance
Kihong Kim, Yunho Kim, Seokju Cho, Junyoung Seo, Jisu Nam, Kychul Lee, Seungryong Kim, KwangHee Lee
arXiv 2022. [Paper] [Project]
2022 年 12 月 27 日

HS-Diffusion: Learning a Semantic-Guided Diffusion Model for Head Swapping
Qinghe Wang, Lijie Liu, Miao Hua, Qian He, Pengfei Zhu, Bing Cao, Qinghua Hu
arXiv 2022. [Paper]
2022 年 12 月 13 日

Inversion-Based Creativity Transfer with Diffusion Models
Yuxin Zhang, Nisha Huang, Fan Tang, Haibin Huang, Chongyang Ma, Weiming Dong, Changsheng Xu
CVPR 2023. [Paper] [Github]
2022 年 11 月 23 日

通过去噪扩散模型进行人物图像合成
Ankan Kumar Bhunia, Salman Khan, Hisham Cholakkal, Rao Muhammad Anwer, Jorma Laaksonen, Mubarak Shah, Fahad Shahbaz Khan
arXiv 2022. [Paper]
2022 年 11 月 22 日

Unifying Diffusion Models' Latent Space, with Applications to CycleDiffusion and Guidance
Chen Henry Wu, Fernando De la Torre
arXiv 2022. [Paper] [Github-1] [Github-2]
2022 年 10 月 11 日

Diffusion-based Image Translation using Disentangled Style and Content Representation
Gihyun Kwon, Jong Chul Ye
arXiv 2022. [Paper]
2022 年 9 月 30 日

MIDMs: Matching Interleaved Diffusion Models for Exemplar-based Image Translation
Junyoung Seo, Gyuseong Lee, Seokju Cho, Jiyoung Lee, Seungryong Kim
arXiv 2022. [Paper] [Project]
2022 年 9 月 22 日

Restoring Vision in Adverse Weather Conditions with Patch-Based Denoising Diffusion Models
Ozan Özdenizci, Robert Legenstein
arXiv 2022. [Paper]
2022 年 7 月 29 日

Non-Uniform Diffusion Models
Georgios Batzolis, Jan Stanczuk, Carola-Bibiane Schönlieb, Christian Etmann
arXiv 2022. [Paper]
2022 年 7 月 20 日

Unsupervised Medical Image Translation with Adversarial Diffusion Models
Muzaffer Özbey, Salman UH Dar, Hasan A Bedel, Onat Dalmaz, Şaban Özturk, Alper Güngör, Tolga Çukur
arXiv 2022. [Paper]
2022 年 7 月 17 日

EGSDE: Unpaired Image-to-Image Translation via Energy-Guided Stochastic Differential Equations
Min Zhao, Fan Bao, Chongxuan Li, Jun Zhu
arXiv 2022. [Paper]
2022 年 7 月 14 日

Discrete Contrastive Diffusion for Cross-Modal and Conditional Generation
Ye Zhu, Yu Wu, Kyle Olszewski, Jian Ren, Sergey Tulyakov, Yan Yan
arXiv 2022. [Paper] [Github]
2022 年 6 月 15 日

Pretraining is All You Need for Image-to-Image Translation
Tengfei Wang, Ting Zhang, Bo Zhang, Hao Ouyang, Dong Chen, Qifeng Chen, Fang Wen
arXiv 2022. [Paper] [Project] [Github]
2022 年 5 月 25 日

VQBB: Image-to-image Translation with Vector Quantized Brownian Bridge
Bo Li, Kaitao Xue, Bin Liu, Yu-Kun Lai
arXiv 2022. [Paper]
2022 年 5 月 16 日

The Swiss Army Knife for Image-to-Image Translation: Multi-Task Diffusion Models
Julia Wolleb, Robin Sandkühler, Florentin Bieder, Philippe C. Cattin
arXiv 2022. [Paper]
2022 年 4 月 6 日

图像到图像翻译的双扩散隐式桥
Xuan Su, Jiaming Song, Chenlin Meng, Stefano Ermon
arXiv 2022. [Paper]
2022 年 3 月 16 日

Denoising Diffusion Restoration Models
Bahjat Kawar, Michael Elad, Stefano Ermon, Jiaming Song
NeurIPS 2022. [Paper]
2022 年 1 月 27 日

DiffuseMorph: Unsupervised Deformable Image Registration Along Continuous Trajectory Using Diffusion Models
Boah Kim, Inhwa Han, Jong Chul Ye
arXiv 2021. [Paper]
2021 年 12 月 9 日

Diffusion Autoencoders: Toward a Meaningful and Decodable Representation
Konpat Preechakul, Nattanat Chatthee, Suttisak Wizadwongsa, Supasorn Suwajanakorn
arXiv 2021. [Paper] [Project]
2021 年 12 月 30 日

Conditional Image Generation with Score-Based Diffusion Models
Georgios Batzolis, Jan Stanczuk, Carola-Bibiane Schönlieb, Christian Etmann
arXiv 2021. [Paper]
2021 年 11 月 26 日

ILVR: Conditioning Method for Denoising Diffusion Probabilistic Models
Jooyoung Choi, Sungwon Kim, Yonghyun Jeong, Youngjune Gwon, Sungroh Yoon
ICCV 2021 (Oral). [Paper] [Github]
2021 年 8 月 6 日

UNIT-DDPM: UNpaired Image Translation with Denoising Diffusion Probabilistic Models
Hiroshi Sasaki, Chris G. Willcocks, Toby P. Breckon
arXiv 2021. [Paper]
2021 年 4 月 12 日

Inverse Problems

EDiffSR: An Efficient Diffusion Probabilistic Model for Remote Sensing Image Super-Resolution
Yi Xiao, Qiangqiang Yuan, Kui Jiang, Jiang He, Xianyu Jin, Liangpei Zhang
arXiv 2023. [Paper]
2023 年 10 月 30 日

Global Structure-Aware Diffusion Process for Low-Light Image Enhancement
Jinhui Hou, Zhiyu Zhu, Junhui Hou, Hui Liu, Huanqiang Zeng, Hui Yuan
arXiv 2023. [Paper]
2023 年 10 月 26 日

From Posterior Sampling to Meaningful Diversity in Image Restoration
Noa Cohen, Hila Manor, Yuval Bahat, Tomer Michaeli
arXiv 2023. [Paper]
2023 年 10 月 24 日

Diffusion-Model-Assisted Supervised Learning of Generative Models for Density Estimation
Yanfang Liu, Minglei Yang, Zezhong Zhang, Feng Bao, Yanzhao Cao, Guannan Zhang
arXiv 2023. [Paper]
2023 年 10 月 22 日

High-Quality 3D Face Reconstruction with Affine Convolutional Networks
Zhiqian Lin, Jiangke Lin, Lincheng Li, Yi Yuan, Zhengxia Zou
arXiv 2023. [Paper]
2023 年 10 月 22 日

Image Super-resolution Via Latent Diffusion: A Sampling-space Mixture Of Experts And Frequency-augmented Decoder Approach
Feng Luo, Jinxi Xiang, Jun Zhang, Xiao Han, Wei Yang
arXiv 2023. [Paper]
2023 年 10 月 18 日

Towards image compression with perfect realism at ultra-low bitrates
Marlène Careil, Matthew J. Muckley, Jakob Verbeek, Stéphane Lathuilière
arXiv 2023. [Paper]
2023 年 10 月 16 日

AutoDIR: Automatic All-in-One Image Restoration with Latent Diffusion
Yitong Jiang, Zhaoyang Zhang, Tianfan Xue, Jinwei Gu
arXiv 2023. [Paper]
2023 年 10 月 16 日

Exploring the Design Space of Diffusion Autoencoders for Face Morphing
Zander Blasingame, Chen Liu
arXiv 2023. [Paper]
2023 年 10 月 14 日

Diffusion Prior Regularized Iterative Reconstruction for Low-dose CT
Wenjun Xia, Yongyi Shi, Chuang Niu, Wenxiang Cong, Ge Wang
arXiv 2023. [Paper]
2023 年 10 月 10 日

SMRD: SURE-based Robust MRI Reconstruction with Diffusion Models
Batu Ozturkler, Chao Liu, Benjamin Eckart, Morteza Mardani, Jiaming Song, Jan Kautz
MICCAI 2023. [Paper] [Github]
2023 年 10 月 3 日

Conditional Diffusion Distillation
Kangfu Mei, Mauricio Delbracio, Hossein Talebi, Zhengzhong Tu, Vishal M. Patel, Peyman Milanfar
arXiv 2023. [Paper]
2023 年 10 月 2 日

CommIN: Semantic Image Communications as an Inverse Problem with INN-Guided Diffusion Models
Jiakang Chen, Di You, Deniz Gündüz, Pier Luigi Dragotti
arXiv 2023. [Paper]
2023 年 10 月 2 日

及时调整逆问题的潜在扩散模型
Hyungjin Chung, Jong Chul Ye, Peyman Milanfar, Mauricio Delbracio
arXiv 2023. [Paper]
2023 年 10 月 2 日

Generating Visual Scenes from Touch
Fengyu Yang, Jiacheng Zhang, Andrew Owens
ICCV 2023. [Paper] [Project]
2023 年 9 月 26 日

Bootstrap Diffusion Model Curve Estimation for High Resolution Low-Light Image Enhancement
Jiancheng Huang, Yifan Liu, Shifeng Chen
arXiv 2023. [Paper]
2023 年 9 月 26 日

Multiple Noises in Diffusion Model for Semi-Supervised Multi-Domain Translation
Tsiry Mayet, Simon Bernard, Clement Chatelain, Romain Herault
arXiv 2023. [Paper]
2023 年 9 月 25 日

Domain-Guided Conditional Diffusion Model for Unsupervised Domain Adaptation
Yulong Zhang, Shuhao Chen, Weisen Jiang, Yu Zhang, Jiangang Lu, James T. Kwok
arXiv 2023. [Paper]
2023 年 9 月 23 日

License Plate Super-Resolution Using Diffusion Models
Sawsan AlHalawani, Bilel Benjdira, Adel Ammar, Anis Koubaa, Anas M. Ali
arXiv 2023. [Paper]
2023 年 9 月 21 日

Deshadow-Anything: When Segment Anything Model Meets Zero-shot shadow removal
Xiao Feng Zhang, Tian Yi Song, Jia Wei Yao
arXiv 2023. [Paper]
2023 年 9 月 21 日

Face Aging via Diffusion-based Editing
Xiangyi Chen, Stéphane Lathuilière
arXiv 2023. [Paper]
2023 年 9 月 20 日

PGDiff: Guiding Diffusion Models for Versatile Face Restoration via Partial Guidance
Peiqing Yang, Shangchen Zhou, Qingyi Tao, Chen Change Loy
NeurIPS 2023. [Paper] [Github]
2023 年 9 月 19 日

Reconstruct-and-Generate Diffusion Model for Detail-Preserving Image Denoising
Yujin Wang, Lingen Li, Tianfan Xue, Jinwei Gu
arXiv 2023. [Paper]
2023 年 9 月 19 日

Gradpaint: Gradient-Guided Inpainting with Diffusion Models
Asya Grechka, Guillaume Couairon, Matthieu Cord
arXiv 2023. [Paper]
2023 年 9 月 18 日

AdBooster: Personalized Ad Creative Generation using Stable Diffusion Outpainting
Veronika Shilova, Ludovic Dos Santos, Flavian Vasile, Gaëtan Racic, Ugo Tanielian
arXiv 2023. [Paper]
2023 年 9 月 8 日

Underwater Image Enhancement by Transformer-based Diffusion Model with Non-uniform Sampling for Skip Strategy
Yi Tang, Takafumi Iwaguchi, Hiroshi Kawasaki
ACM MM 2023. [Paper] [Github]
2023 年 9 月 7 日

Efficient Bayesian Computational Imaging with a Surrogate Score-Based Prior
Berthy T. Feng, Katherine L. Bouman
arXiv 2023. [Paper]
2023 年 9 月 5 日

Diffusion Modeling with Domain-conditioned Prior Guidance for Accelerated MRI and qMRI Reconstruction
Wanyu Bian, Albert Jang, Fang Liu
arXiv 2023. [Paper]
2023 年 9 月 2 日

Correlated and Multi-frequency Diffusion Modeling for Highly Under-sampled MRI Reconstruction
Yu Guan, Chuanming Yu, Shiyu Lu, Zhuoxu Cui, Dong Liang, Qiegen Liu
arXiv 2023. [Paper] [Github]
2023 年 9 月 2 日

Fast Diffusion EM: a diffusion model for blind inverse problems with application to deconvolution
Charles Laroche, Andrés Almansa, Eva Coupete
arXiv 2023. [Paper] [Github]
2023 年 9 月 1 日

Unsupervised CT Metal Artifact Reduction by Plugging Diffusion Priors in Dual Domains
Xuan Liu, Yaoqin Xie, Songhui Diao, Shan Tan, Xiaokun Liang
arXiv 2023. [Paper]
2023 年 8 月 31 日

Stage-by-stage Wavelet Optimization Refinement Diffusion Model for Sparse-View CT Reconstruction
Kai Xu, Shiyu Lu, Bin Huang, Weiwen Wu, Qiegen Liu
arXiv 2023. [Paper]
2023 年 8 月 30 日

Physics-Informed DeepMRI: Bridging the Gap from Heat Diffusion to k-Space Interpolation
Zhuo-Xu Cui, Congcong Liu, Xiaohong Fan, Chentao Cao, Jing Cheng, Qingyong Zhu, Yuanyuan Liu, Sen Jia, Yihang Zhou, Haifeng Wang, Yanjie Zhu, Jianping Zhang, Qiegen Liu, Dong Liang
arXiv 2023. [Paper]
2023 年 8 月 30 日

DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior
Xinqi Lin, Jingwen He, Ziyan Chen, Zhaoyang Lyu, Ben Fei, Bo Dai, Wanli Ouyang, Yu Qiao, Chao Dong
arXiv 2023. [Paper] [Github]
2023 年 8 月 29 日

Pixel-Aware Stable Diffusion for Realistic Image Super-resolution and Personalized Stylization
Tao Yang, Peiran Ren, Xuansong Xie, Lei Zhang
AAAI 2024. [Paper]
2023 年 8 月 28 日

Data-iterative Optimization Score Model for Stable Ultra-Sparse-View CT Reconstruction
Weiwen Wu, Yanyang Wang
arXiv 2023. [Paper]
2023 年 8 月 28 日

残差去噪扩散模型
Jiawei Liu, Qiang Wang, Huijie Fan, Yinong Wang, Yandong Tang, Liangqiong Qu
arXiv 2023. [Paper] [Github]
2023 年 8 月 25 日

Diff-Retinex: Rethinking Low-light Image Enhancement with A Generative Diffusion Model
Xunpeng Yi, Han Xu, Hao Zhang, Linfeng Tang, Jiayi Ma
ICCV 2023. [Paper]
2023 年 8 月 25 日

Full-dose PET Synthesis from Low-dose PET Using High-efficiency Diffusion Denoising Probabilistic Model
Shaoyan Pan, Elham Abouei, Junbo Peng, Joshua Qian, Jacob F Wynne, Tonghe Wang, Chih-Wei Chang, Justin Roper, Jonathon A Nye, Hui Mao, Xiaofeng Yang
arXiv 2023. [Paper]
2023 年 8 月 24 日

InverseSR: 3D Brain MRI Super-Resolution Using a Latent Diffusion Model
Jueqi Wang, Jacob Levman, Walter Hugo Lopez Pinaya, Petru-Daniel Tudosiu, M. Jorge Cardoso, Razvan Marinescu
MICCAI 2023. [Paper] [Github]
2023 年 8 月 23 日

High-quality Image Dehazing with Diffusion Model
Hu Yu, Jie Huang, Kaiwen Zheng, Man Zhou, Feng Zhao
arXiv 2023. [Paper]
2023 年 8 月 23 日

Frequency Compensated Diffusion Model for Real-scene Dehazing
Jing Wang, Songtao Wu, Kuanhong Xu, Zhiqiang Yuan
arXiv 2023. [Paper]
2023 年 8 月 21 日

Contrastive Diffusion Model with Auxiliary Guidance for Coarse-to-Fine PET Reconstruction
Zeyu Han, Yuhan Wang, Luping Zhou, Peng Wang, Binyu Yan, Jiliu Zhou, Yan Wang, Dinggang Shen
MICCAI 2023. [Paper] [Github]
2023 年 8 月 20 日

DiffLLE: Diffusion-guided Domain Calibration for Unsupervised Low-light Image Enhancement
Shuzhou Yang, Xuanyu Zhang, Yinhuai Wang, Jiwen Yu, Yuhan Wang, Jian Zhang
arXiv 2023. [Paper]
2023 年 8 月 18 日

Learning A Coarse-to-Fine Diffusion Transformer for Image Restoration
Liyan Wang, Qinyu Yang, Cong Wang, Wei Wang, Jinshan Pan, Zhixun Su
arXiv 2023. [Paper]
2023 年 8 月 17 日

Monte Carlo guided Diffusion for Bayesian linear inverse problems
Gabriel Cardoso, Yazid Janati El Idrissi, Sylvain Le Corff, Eric Moulines
arXiv 2023. [Paper]
2023 年 8 月 15 日

Geometry of the Visual Cortex with Applications to Image Inpainting and Enhancement
Francesco Ballerin, Erlend Grong
arXiv 2023. [Paper] [Github]
2023 年 8 月 15 日

YODA: You Only Diffuse Areas. An Area-Masked Diffusion Approach For Image Super-Resolution
Brian B. Moser, Stanislav Frolov, Federico Raue, Sebastian Palacio, Andreas Dengel
arXiv 2023. [Paper]
2023 年 8 月 15 日

TextDiff: Mask-Guided Residual Diffusion Models for Scene Text Image Super-Resolution
Baolin Liu, Zongyuan Yang, Pengfei Wang, Junjie Zhou, Ziqi Liu, Ziyi Song, Yan Liu, Yongping Xiong
AAAI 2024. [Paper]
2023 年 8 月 13 日

CLE Diffusion: Controllable Light Enhancement Diffusion Model
Yuyang Yin, Dejia Xu, Chuangchuang Tan, Ping Liu, Yao Zhao, Yunchao Wei
arXiv 2023. [Paper] [Project] [Github]
2023 年 8 月 13 日

Diffusion-Augmented Depth Prediction with Sparse Annotations
Jiaqi Li, Yiran Wang, Zihao Huang, Jinghong Zheng, Ke Xian, Zhiguo Cao, Jianming Zhang
arXiv 2023. [Paper]
2023 年 8 月 4 日

Painterly Image Harmonization using Diffusion Model
Lingxiao Lu, Jiangtong Li, Junyan Cao, Li Niu, Liqing Zhang
arXiv 2023. [Paper]
2023 年 8 月 4 日

Reference-Free Isotropic 3D EM Reconstruction using Diffusion Models
Kyungryun Lee, Won-Ki Jeong
arXiv 2023. [Paper]
2023 年 8 月 3 日

Learning Fourier-Constrained Diffusion Bridges for MRI Reconstruction
Muhammad U. Mirza, Onat Dalmaz, Hasan A. Bedel, Gokberk Elmas, Yilmaz Korkmaz, Alper Gungor, Salman UH Dar, Tolga Çukur
arXiv 2023. [Paper]
2023 年 8 月 2 日

Ultrasound Image Reconstruction with Denoising Diffusion Restoration Models
Yuxin Zhang, Clément Huneau, Jérôme Idier, Diana Mateus
MICCAI Workshop 2023. [Paper] [Github]
2023 年 7 月 29 日

LLDiffusion: Learning Degradation Representations in Diffusion Models for Low-Light Image Enhancement
Tao Wang, Kaihao Zhang, Ziqian Shao, Wenhan Luo, Bjorn Stenger, Tae-Kyun Kim, Wei Liu, Hongdong Li
arXiv 2023. [Paper]
2023 年 7 月 27 日

Artifact Restoration in Histology Images with Diffusion Probabilistic Models
Zhenqi He, Junjun He, Jin Ye, Yiqing Shen
arXiv 2023. [Paper] [Github]
2023 年 7 月 26 日

ResShift：通过残差移位实现图像超分辨率的高效扩散模型
岳宗盛、王建一、陈昌来
arXiv 2023. [Paper] [Github]
2023 年 7 月 23 日

Iterative Reconstruction Based on Latent Diffusion Model for Sparse Data Reconstruction
Linchao He, Hongyu Yan, Mengting Luo, Kunming Luo, Wang Wang, Wenchao Du, Hu Chen, Hongyu Yang, Yi Zhang
arXiv 2023. [Paper]
2023 年 7 月 22 日

PartDiff: Image Super-resolution with Partial Diffusion Models
Kai Zhao, Alex Ling Yu Hung, Kaifeng Pang, Haoxin Zheng, Kyunghyun Sung
arXiv 2023. [Paper]
2023 年 7 月 21 日

Reference-based Painterly Inpainting via Diffusion: Crossing the Wild Reference Domain Gap
Dejia Xu, Xingqian Xu, Wenyan Cong, Humphrey Shi, Zhangyang Wang
arXiv 2023. [Paper] [Project]
2023 年 7 月 20 日

AnyDoor: Zero-shot Object-level Image Customization
Xi Chen, Lianghua Huang, Yu Liu, Yujun Shen, Deli Zhao, Hengshuang Zhao
arXiv 2023. [Paper] [Project]
2023 年 7 月 18 日

Towards Authentic Face Restoration with Iterative Diffusion Models and Beyond
Yang Zhao, Tingbo Hou, Yu-Chuan Su, Xuhui Jia. Yandong Li, Matthias Grundmann
ICCV 2023. [Paper]
2023 年 7 月 18 日

Flow Matching in Latent Space
Quan Dao, Hao Phung, Binh Nguyen, Anh Tran
arXiv 2023. [Paper] [Project]
2023 年 7 月 17 日

Identity-Preserving Aging of Face Images via Latent Diffusion Models
Sudipta Banerjee, Govind Mittal, Ameya Joshi, Chinmay Hegde, Nasir Memon
IJCB 2023. [Paper]
2023 年 7 月 17 日

Solving Inverse Problems with Latent Diffusion Models via Hard Data Consistency
Bowen Song, Soo Min Kwon, Zecheng Zhang, Xinyu Hu, Qing Qu, Liyue Shen
arXiv 2023. [Paper]
2023 年 7 月 16 日

ExposureDiffusion: Learning to Expose for Low-light Image Enhancement
Yufei Wang, Yi Yu, Wenhan Yang, Lanqing Guo, Lap-Pui Chau, Alex C. Kot, Bihan Wen
arXiv 2023. [Paper]
2023 年 7 月 15 日

DDGM: Solving inverse problems by Diffusive Denoising of Gradient-based Minimization
Kyle Luther, H. Sebastian Seung
arXiv 2023. [Paper]
2023 年 7 月 11 日

Stimulating the Diffusion Model for Image Denoising via Adaptive Embedding and Ensembling
Tong Li, Hansen Feng, Lizhi Wang, Zhiwei Xiong, Hua Huang
arXiv 2023. [Paper]
8 Jul 2023

IPO-LDM: Depth-aided 360-degree Indoor RGB Panorama Outpainting via Latent Diffusion Model
Tianhao Wu, Chuanxia Zheng, Tat-Jen Cham
arXiv 2023. [Paper] [Github]
2023 年 7 月 6 日

Single Image LDR to HDR Conversion using Conditional Diffusion
Dwip Dalal, Gautam Vashishtha, Prajwal Singh, Shanmuganathan Raman
arXiv 2023. [Paper]
2023 年 7 月 6 日

ACDMSR: Accelerated Conditional Diffusion Models for Single Image Super-Resolution
Axi Niu, Pham Xuan Trung, Kang Zhang, Jinqiu Sun, Yu Zhu, In So Kweon, Yanning Zhang
arXiv 2023. [Paper]
2023 年 7 月 3 日

LEDITS: Real Image Editing with DDPM Inversion and Semantic Guidance
Linoy Tsaban, Apolinário Passos
arXiv 2023. [Paper]
2023 年 7 月 2 日

Solving Linear Inverse Problems Provably via Posterior Sampling with Latent Diffusion Models
Litu Rout, Negin Raoof, Giannis Daras, Constantine Caramanis, Alexandros G. Dimakis, Sanjay Shakkottai
arXiv 2023. [Paper] [Github]
2023 年 7 月 2 日

Content-Preserving Diffusion Model for Unsupervised AS-OCT image Despeckling
Li Sanqian, Higashita Risa, Fu Huazhu, Li Heng, Niu Jingxuan, Liu Jiang
arXiv 2023. [Paper]
2023 年 6 月 30 日

Self-Supervised MRI Reconstruction with Unrolled Diffusion Models
Yilmaz Korkmaz, Tolga Cukur, Vishal Patel
arXiv 2023. [Paper]
2023 年 6 月 29 日

SVNR: Spatially-variant Noise Removal with Denoising Diffusion
Naama Pearl, Yaron Brodsky, Dana Berman, Assaf Zomet, Alex Rav Acha, Daniel Cohen-Or, Dani Lischinski
arXiv 2023. [Paper]
2023 年 6 月 28 日

Easing Color Shifts in Score-Based Diffusion Models
Katherine Deck, Tobias Bischoff
arXiv 2023. [Paper]
2023 年 6 月 27 日

Diffusion Model Based Low-Light Image Enhancement for Space Satellite
Yiman Zhu, Lu Wang, Jingyi Yuan, Yu Guo
arXiv 2023. [Paper]
2023 年 6 月 25 日

DiffInfinite: Large Mask-Image Synthesis via Parallel Random Patch Diffusion in Histopathology
Marco Aversa, Gabriel Nobis, Miriam Hägele, Kai Standvoss, Mihaela Chirica, Roderick Murray-Smith, Ahmed Alaa, Lukas Ruff, Daniela Ivanova, Wojciech Samek, Frederick Klauschen, Bruno Sanguinetti, Luis Oala
arXiv 2023. [Paper]
2023 年 6 月 23 日

Wind Noise Reduction with a Diffusion-based Stochastic Regeneration Model
Jean-Marie Lemercier, Joachim Thiemann, Raphael Koning, Timo Gerkmann
arXiv 2023. [Paper]
2023 年 6 月 22 日

DiffuseIR:Diffusion Models For Isotropic Reconstruction of 3D Microscopic Images
Mingjie Pan, Yulu Gan, Fangxu Zhou, Jiaming Liu, Aimin Wang, Shanghang Zhang, Dawei Li
arXiv 2023. [Paper]
2023 年 6 月 21 日

HSR-Diff:Hyperspectral Image Super-Resolution via Conditional Diffusion Models
Chanyue Wu, Dong Wang, Hanyu Mao, Ying Li
arXiv 2023. [Paper]
2023 年 6 月 21 日

Diffusion with Forward Models: Solving Stochastic Inverse Problems Without Direct Supervision
Ayush Tewari, Tianwei Yin, George Cazenavette, Semon Rezchikov, Joshua B. Tenenbaum, Frédo Durand, William T. Freeman, Vincent Sitzmann
arXiv 2023. [Paper]
2023 年 6 月 20 日

Deep Ultrasound Denoising Using Diffusion Probabilistic Models
Hojat Asgariandehkordi, Sobhan Goudarzi, Adrian Basarab, Hassan Rivaz
arXiv 2023. [Paper]
2023 年 6 月 12 日

Towards Visual Foundational Models of Physical Scenes
Chethan Parameshwara, Alessandro Achille, Matthew Trager, Xiaolong Li, Jiawei Mo, Matthew Trager, Ashwin Swaminathan, CJ Taylor, Dheera Venkatraman, Xiaohan Fei, Stefano Soatto
arXiv 2023. [Paper]
2023 年 6 月 6 日

INDigo: An INN-Guided Probabilistic Diffusion Algorithm for Inverse Problems
Di You, Andreas Floros, Pier Luigi Dragotti
arXiv 2023. [Paper]
2023 年 6 月 5 日

The Surprising Effectiveness of Diffusion Models for Optical Flow and Monocular Depth Estimation
Saurabh Saxena, Charles Herrmann, Junhwa Hur, Abhishek Kar, Mohammad Norouzi, Deqing Sun, David J. Fleet
arXiv 2023. [Paper]
2023 年 6 月 2 日

Dissecting Arbitrary-scale Super-resolution Capability from Pre-trained Diffusion Generative Models
Ruibin Li, Qihua Zhou, Song Guo, Jie Zhang, Jingcai Guo, Xinyang Jiang, Yifei Shen, Zhenhua Han
arXiv 2023. [Paper]
2023 年 6 月 1 日

Low-Light Image Enhancement with Wavelet-based Diffusion Models
Hai Jiang, Ao Luo, Songchen Han, Haoqiang Fan, Shuaicheng Liu
arXiv 2023. [Paper]
2023 年 6 月 1 日

A Unified Conditional Framework for Diffusion-based Image Restoration
Yi Zhang, Xiaoyu Shi, Dasong Li, Xiaogang Wang, Jian Wang, Hongsheng Li
arXiv 2023. [Paper]
2023 年 5 月 31 日

Direct Diffusion Bridge using Data Consistency for Inverse Problems
Hyungjin Chung, Jeongsol Kim, Jong Chul Ye
arXiv 2023. [Paper]
2023 年 5 月 31 日

Accelerating Diffusion Models for Inverse Problems through Shortcut Sampling
Gongye Liu, Haoze Sun, Jiayi Li, Fei Yin, Yujiu Yang
arXiv 2023. [Paper]
2023 年 5 月 26 日

看，妈，没有手！ Agent-Environment Factorization of Egocentric Videos
Matthew Chang, Aditya Prakash, Saurabh Gupta
arXiv 2023. [Paper] [Project]
2023 年 5 月 25 日

A Diffusion Probabilistic Prior for Low-Dose CT Image Denoising
Xuan Liu, Yaoqin Xie, Songhui Diao, Shan Tan, Xiaokun Liang
arXiv 2023. [Paper]
2023 年 5 月 25 日

Solving Diffusion ODEs with Optimal Boundary Conditions for Better Image Super-Resolution
Yiyang Ma, Huan Yang, Wenhan Yang, Jianlong Fu, Jiaying Liu
arXiv 2023. [Paper]
2023 年 5 月 24 日

WaveDM：基于小波的图像恢复扩散模型
Yi Huang, Jiancheng Huang, Jianzhuang Liu, Yu Dong, Jiaxi Lv, Shifeng Chen
arXiv 2023. [Paper]
2023 年 5 月 23 日

Dual-Diffusion: Dual Conditional Denoising Diffusion Probabilistic Models for Blind Super-Resolution Reconstruction in RSIs
Mengze Xu, Jie Ma, Yuanyuan Zhu
arXiv 2023. [Paper] [Github]
2023 年 5 月 20 日

UniControl: A Unified Diffusion Model for Controllable Visual Generation In the Wild
Can Qin, Shu Zhang, Ning Yu, Yihao Feng, Xinyi Yang, Yingbo Zhou, Huan Wang, Juan Carlos Niebles, Caiming Xiong, Silvio Savarese, Stefano Ermon, Yun Fu, Ran Xu
arXiv 2023. [Paper]
2023 年 5 月 18 日

Pyramid Diffusion Models For Low-light Image Enhancement
Dewei Zhou, Zongxin Yang, Yi Yang
arXiv 2023. [Paper]
2023 年 5 月 17 日

A Conditional Denoising Diffusion Probabilistic Model for Radio Interferometric Image Reconstruction
Ruoqi Wang, Zhuoyang Chen, Qiong Luo, Feng Wang
arXiv 2023. [Paper] 16 May 2023

Denoising Diffusion Models for Plug-and-Play Image Restoration
Yuanzhi Zhu, Kai Zhang, Jingyun Liang, Jiezhang Cao, Bihan Wen, Radu Timofte, Luc Van Gool
arXiv 2023. [Paper] [Github]
2023 年 5 月 15 日

Exploiting Diffusion Prior for Real-World Image Super-Resolution
Jianyi Wang, Zongsheng Yue, Shangchen Zhou, Kelvin CK Chan, Chen Change Loy
arXiv 2023. [Paper] [Project] [Github]
2023 年 5 月 11 日

Atmospheric Turbulence Correction via Variational Deep Diffusion
Xijun Wang, Santiago López-Tapia, Aggelos K. Katsaggelos
arXiv 2023. [Paper]
2023 年 5 月 8 日

Controllable Light Diffusion for Portraits
David Futschik, Kelvin Ritland, James Vecore, Sean Fanello, Sergio Orts-Escolano, Brian Curless, Daniel Sýkora, Rohit Pandey
arXiv 2023. [Paper]
2023 年 5 月 8 日

DiffBFR: Bootstrapping Diffusion Model Towards Blind Face Restoration
Xinmin Qiu, Congying Han, ZiCheng Zhang, Bonan Li, Tiande Guo, Xuecheng Nie
arXiv 2023. [Paper]
2023 年 5 月 8 日

Real-World Denoising via Diffusion Model
Cheng Yang, Lijing Liang, Zhixun Su
arXiv 2023. [Paper]
2023 年 5 月 8 日

A Variational Perspective on Solving Inverse Problems with Diffusion Models
Morteza Mardani, Jiaming Song, Jan Kautz, Arash Vahdat
arXiv 2023. [Paper]
2023 年 5 月 7 日

Synthesizing PET images from High-field and Ultra-high-field MR images Using Joint Diffusion Attention Model
Taofeng Xie, Chentao Cao, Zhuoxu Cui, Yu Guo, Caiying Wu, Xuemei Wang, Qingneng Li, Zhanli Hu, Tao Sun, Ziru Sang, Yihang Zhou, Yanjie Zhu, Dong Liang, Qiyu Jin, Guoqing Chen, Haifeng Wang
arXiv 2023. [Paper]
2023 年 5 月 6 日

DocDiff: Document Enhancement via Residual Diffusion Models
Zongyuan Yang, Baolin Liu, Yongping Xiong, Lan Yi, Guibin Wu, Xiaojun Tang, Ziqi Liu, Junjie Zhou, Xing Zhang
arXiv 2023. [Paper] [Github]
2023 年 5 月 6 日

Solving Inverse Problems with Score-Based Generative Priors learned from Noisy Data
Asad Aali, Marius Arvinte, Sidharth Kumar, Jonathan I. Tamir
arXiv 2023. [Paper]
2023 年 5 月 2 日

Self-similarity-based super-resolution of photoacoustic angiography from hand-drawn doodles
Yuanzheng Ma, Wangting Zhou, Rui Ma, Sihua Yang, Yansong Tang, Xun Guan
arXiv 2023. [Paper]
2023 年 5 月 2 日

Score-Based Diffusion Models as Principled Priors for Inverse Imaging
Berthy T. Feng, Jamie Smith, Michael Rubinstein, Huiwen Chang, Katherine L. Bouman, William T. Freeman
arXiv 2023. [Paper]
2023 年 4 月 23 日

通过搭载模型改进基于扩散的图像着色
Hanyuan Liu, Jinbo Xing, Minshan Xie, Chengze Li, Tien-Tsin Wong
arXiv 2023. [Paper] [Project]
2023 年 4 月 21 日

DiFaReli: Diffusion Face Relighting
Puntawat Ponglertnapakorn, Nontawat Tritrong, Supasorn Suwajanakorn
arXiv 2023. [Paper] [Project]
2023 年 4 月 19 日

修复任何东西：分割任何东西满足图像修复
Tao Yu, Runseng Feng, Ruoyu Feng, Jinming Liu, Xin Jin, Wenjun Zeng, Zhibo Chen
arXiv 2023. [Paper] [Github]
2023 年 4 月 13 日

Refusion: Enabling Large-Size Realistic Image Restoration with Latent-Space Diffusion Models
Ziwei Luo, Fredrik K. Gustafsson, Zheng Zhao, Jens Sjölund, Thomas B. Schön
arXiv 2023. [Paper] [Github]
2023 年 4 月 17 日

SPIRiT-Diffusion: Self-Consistency Driven Diffusion Model for Accelerated MRI
Zhuo-Xu Cui, Chentao Cao, Jing Cheng, Sen Jia, Hairong Zheng, Dong Liang, Yanjie Zhu
arXiv 2023. [Paper]
2023 年 4 月 11 日

Zero-shot CT Field-of-view Completion with Unconditional Generative Diffusion Prior
Kaiwen Xu, Aravind R. Krishnan, Thomas Z. Li, Yuankai Huo, Kim L. Sandler, Fabien Maldonado, Bennett A. Landman
arXiv 2023. [Paper]
2023 年 4 月 7 日

SketchFFusion: Sketch-guided image editing with diffusion model
Weihang Mao, Bo Han, Zihao Wang
arXiv 2023. [Paper]
2023 年 4 月 6 日

Inst-Inpaint: Instructing to Remove Objects with Diffusion Models
Ahmet Burak Yildirim, Vedat Baday, Erkut Erdem, Aykut Erdem, Aysegul Dundar
arXiv 2023. [Paper] [Project]
2023 年 4 月 6 日

Towards Coherent Image Inpainting Using Denoising Diffusion Implicit Models
Guanhua Zhang, Jiabao Ji, Yang Zhang, Mo Yu, Tommi Jaakkola, Shiyu Chang
arXiv 2023. [Paper] [Github]
2023 年 4 月 6 日

Zero-shot Medical Image Translation via Frequency-Guided Diffusion Models
Yunxiang Li, Hua-Chieh Shao, Xiao Liang, Liyuan Chen, Ruiqi Li, Steve Jiang, Jing Wang, You Zhang
arXiv 2023. [Paper]
2023 年 4 月 5 日

Waving Goodbye to Low-Res: A Diffusion-Wavelet Approach for Image Super-Resolution
Brian Moser, Stanislav Frolov, Federico Raue, Sebastian Palacio, Andreas Dengel
arXiv 2023. [Paper]
2023 年 4 月 4 日

CoreDiff: Contextual Error-Modulated Generalized Diffusion Model for Low-Dose CT Denoising and Generalization
Qi Gao, Zilong Li, Junping Zhang, Yi Zhang, Hongming Shan
arXiv 2023. [Paper]
2023 年 4 月 4 日

Generative Diffusion Prior for Unified Image Restoration and Enhancement
Ben Fei, Zhaoyang Lyu, Liang Pan, Junzhe Zhang, Weidong Yang, Tianyue Luo, Bo Zhang, Bo Dai
CVPR 2023. [Paper]
2023 年 4 月 3 日

Implicit Diffusion Models for Continuous Super-Resolution
Sicheng Gao, Xuhui Liu, Bohan Zeng, Sheng Xu, Yanjing Li, Xiaoyan Luo, Jianzhuang Liu, Xiantong Zhen, Baochang Zhang
CVPR 2023. [Paper]
2023 年 3 月 29 日

DiracDiffusion: Denoising and Incremental Reconstruction with Assured Data-Consistency
Zalan Fabian, Berk Tinaz, Mahdi Soltanolkotabi
arXiv 2023. [Paper]
2023 年 3 月 25 日

MindDiffuser: Controlled Image Reconstruction from Human Brain Activity with Semantic and Structural Diffusion
Yizhuo Lu, Changde Du, Dianpeng Wang, Huiguang He
arXiv 2023. [Paper]
2023 年 3 月 24 日

DisC-Diff: Disentangled Conditional Diffusion Model for Multi-Contrast MRI Super-Resolution
Ye Mao, Lan Jiang, Xi Chen, Chao Li
arXiv 2023. [Paper]
2023 年 3 月 23 日

Sub-volume-based Denoising Diffusion Probabilistic Model for Cone-beam CT Reconstruction from Incomplete Data
Wenjun Xia, Chuang Niu, Wenxiang Cong, Ge Wang
arXiv 2023. [Paper]
2023 年 3 月 22 日

A Perceptual Quality Assessment Exploration for AIGC Images
Zicheng Zhang, Chunyi Li, Wei Sun, Xiaohong Liu, Xiongkuo Min, Guangtao Zhai
arXiv 2023. [Paper]
2023 年 3 月 22 日

Inversion by Direct Iteration: An Alternative to Denoising Diffusion for Image Restoration
Mauricio Delbracio, Peyman Milanfar
arXiv 2023. [Paper]
2023 年 3 月 20 日

Efficient Neural Generation of 4K Masks for Homogeneous Diffusion Inpainting
Karl Schrader, Pascal Peter, Niklas Kämper, Joachim Weickert
arXiv 2023. [Paper]
2023 年 3 月 17 日

Denoising Diffusion Post-Processing for Low-Light Image Enhancement
Savvas Panagiotou, Anna S. Bosman
arXiv 2023. [Paper]
2023 年 3 月 16 日

SUD2: Supervision by Denoising Diffusion Models for Image Reconstruction
Matthew A. Chan, Sean I. Young, Christopher A. Metzler
arXiv 2023. [Paper]
2023 年 3 月 16 日

DiffIR: Efficient Diffusion Model for Image Restoration
Bin Xia, Yulun Zhang, Shiyin Wang, Yitong Wang, Xinglong Wu, Yapeng Tian, Wenming Yang, Luc Van Gool
arXiv 2023. [Paper]
2023 年 3 月 16 日

ResDiff: Combining CNN and Diffusion Model for Image Super-Resolution
Shuyao Shang, Zhengyang Shan, Guangxing Liu, Jinglin Zhang
arXiv 2023. [Paper]
2023 年 3 月 15 日

Class-Guided Image-to-Image Diffusion: Cell Painting from Brightfield Images with Class Labels
Jan Oscar Cross-Zamirski, Praveen Anand, Guy Williams, Elizabeth Mouchet, Yinhai Wang, Carola-Bibiane Schönlieb
arXiv 2023. [Paper] [Github]
2023 年 3 月 15 日

磁共振图像对比度协调的扩散模型
Alicia Durrer, Julia Wolleb, Florentin Bieder, Tim Sinnecker, Matthias Weigel, Robin Sandkühler, Cristina Granziera, Özgür Yaldizli, Philippe C. Cattin
arXiv 2023. [Paper]
2023 年 3 月 14 日

Synthesizing Realistic Image Restoration Training Pairs: A Diffusion Approach
Tao Yang, Peiran Ren, Xuansong xie, Lei Zhang
arXiv 2023. [Paper]
2023 年 3 月 13 日

DR2: Diffusion-based Robust Degradation Remover for Blind Face Restoration
Zhixin Wang, Xiaoyun Zhang, Ziying Zhang, Huangjie Zheng, Mingyuan Zhou, Ya Zhang, Yanfeng Wang
CVPR 2023. [Paper]
2023 年 3 月 13 日

DDS2M: Self-Supervised Denoising Diffusion Spatio-Spectral Model for Hyperspectral Image Restoration
Yuchun Miao, Lefei Zhang, Liangpei Zhang, Dacheng Tao
arXiv 2023. [Paper]
2023 年 3 月 12 日

Fast Diffusion Sampler for Inverse Problems by Geometric Decomposition
Hyungjin Chung, Suhyeon Lee, Jong Chul Ye
arXiv 2023. [Paper]
2023 年 3 月 10 日

Generalized Diffusion MRI Denoising and Super-Resolution using Swin Transformers
Amir Sadikov, Jamie Wren-Jarvis, Xinlei Pan, Lanya T. Cai, Pratik Mukherjee
arXiv 2023. [Paper]
2023 年 3 月 10 日

DiffusionDepth: Diffusion Denoising Approach for Monocular Depth Estimation
Yiqun Duan, Zheng Zhu, Xianda Guo
arxiv 2023. [Paper] [Github]
2023 年 3 月 9 日

Learning Enhancement From Degradation: A Diffusion Model For Fundus Image Enhancement
Puijin Cheng, Li Lin, Yijin Huang, Huaqing He, Wenhan Luo, Xiaoying Tang
arXiv 2023. [Paper] [Github]
2023 年 3 月 8 日

Unlimited-Size Diffusion Restoration
Yinhuai Wang, Jiwen Yu, Runyi Yu, Jian Zhang
arXiv 2023. [Paper]
2023 年 3 月 1 日

Unsupervised Out-of-Distribution Detection with Diffusion Inpainting
Zhenzhen Liu, Jin Peng Zhou, Yufan Wang, Kilian Q. Weinberger
arXiv 2023. [Paper]
2023 年 2 月 20 日

Restoration based Generative Models
Jaemoo Choi, Yesom Park, Myungjoo Kang
arXiv 2023. [Paper]
2023 年 2 月 20 日

Explicit Diffusion of Gaussian Mixture Model Based Image Priors
Martin Zach, Thomas Pock, Erich Kobler, Antonin Chambolle
arXiv 2023. [Paper]
2023 年 2 月 16 日

Denoising Diffusion Probabilistic Models for Robust Image Super-Resolution in the Wild
Hshmat Sahak, Daniel Watson, Chitwan Saharia, David Fleet
arXiv 2023. [Paper]
2023 年 2 月 15 日

CDPMSR: Conditional Diffusion Probabilistic Models for Single Image Super-Resolution
Axi Niu, Kang Zhang, Trung X. Pham, Jinqiu Sun, Yu Zhu, In So Kweon, Yanning Zhang
arXiv 2023. [Paper]
2023 年 2 月 14 日

How to Trust Your Diffusion Model: A Convex Optimization Approach to Conformal Risk Control
Jacopo Teneggi, Matt Tivnan, J Webster Stayman, Jeremias Sulam
arXiv 2023. [Paper]
2023 年 2 月 7 日

DDM2: Self-Supervised Diffusion MRI Denoising with Generative Diffusion Models
Tiange Xiang, Mahmut Yurt, Ali B Syed, Kawin Setsompop, Akshay Chaudhari
ICLR 2023. [Paper] [Github]
2023 年 2 月 6 日

Diffusion Model for Generative Image Denoising
Yutong Xie, Minne Yuan, Bin Dong, Quanzheng Li
arXiv 2023. [Paper]
2023 年 2 月 5 日

A Theoretical Justification for Image Inpainting using Denoising Diffusion Probabilistic Models
Litu Rout, Advait Parulekar, Constantine Caramanis, Sanjay Shakkottai
arXiv 2023. [Paper]
2 Feb 2023

GibbsDDRM: A Partially Collapsed Gibbs Sampler for Solving Blind Inverse Problems with Denoising Diffusion Restoration
Naoki Murata, Koichi Saito, Chieh-Hsin Lai, Yuhta Takida, Toshimitsu Uesaka, Yuki Mitsufuji, Stefano Ermon
arXiv 2023. [Paper]
2023 年 1 月 30 日

Accelerating Guided Diffusion Sampling with Splitting Numerical Methods
Suttisak Wizadwongsa, Supasorn Suwajanakorn
ICLR 2023. [Paper]
2023 年 1 月 27 日

Diffusion Denoising for Low-Dose-CT Model
Runyi Li
arXiv 2023. [Paper]
2023 年 1 月 27 日

Screen Space Indirect Lighting with Visibility Bitmask
Olivier Therrien, Yannick Levesque, Guillaume Gilet
Visual Computer 2023. [Paper]
2023 年 1 月 26 日

Dual Diffusion Architecture for Fisheye Image Rectification: Synthetic-to-Real Generalization
Shangrong Yang, Chunyu Lin, Kang Liao, Yao Zhao
arXiv 2023. [Paper]
2023 年 1 月 26 日

RainDiffusion:When Unsupervised Learning Meets Diffusion Models for Real-world Image Deraining
Mingqiang Wei, Yiyang Shen, Yongzhen Wang, Haoran Xie, Fu Lee Wang
arXiv 2023. [Paper]
2023 年 1 月 23 日

Dif-Fusion: Towards High Color Fidelity in Infrared and Visible Image Fusion with Diffusion Models
Mingqiang Wei, Yiyang Shen, Yongzhen Wang, Haoran Xie, Fu Lee Wang
arXiv 2023. [Paper]
2023 年 1 月 23 日

Removing Structured Noise with Diffusion Models
Tristan SW Stevens, Jean-Luc Robert, Faik C. Meral Jason Yu, Jun Seob Shin, Ruud JG van Sloun
arXiv 2023. [Paper]
2023 年 1 月 20 日

Image Restoration with Mean-Reverting Stochastic Differential Equations
Ziwei Luo, Fredrik K. Gustafsson, Zheng Zhao, Jens Sjölund, Thomas B. Schön
arXiv 2023. [Paper] [Github]
2023 年 1 月 20 日

DiffusionCT: Latent Diffusion Model for CT Image Standardization
Md Selim, Jie Zhang, Michael A. Brooks, Ge Wang, Jin Chen
arXiv 2023. [Paper]
2023 年 1 月 20 日

Targeted Image Reconstruction by Sampling Pre-trained Diffusion Model
Jiageng Zheng
arXiv 2023. [Paper]
2023 年 1 月 18 日

Annealed Score-Based Diffusion Model for MR Motion Artifact Reduction
Gyutaek Oh, Jeong Eun Lee, Jong Chul Ye
arXiv 2023. [Paper]
2023 年 1 月 8 日

Exploring Vision Transformers as Diffusion Learners
He Cao, Jianan Wang, Tianhe Ren, Xianbiao Qi, Yihao Chen, Yuan Yao, Lei Zhang
arXiv 2022. [Paper]
2022 年 12 月 28 日

Towards Blind Watermarking: Combining Invertible and Non-invertible Mechanisms
Rui Ma, Mengxi Guo, Yi Hou, Fan Yang, Yuan Li, Huizhu Jia, Xiaodong Xie
arXiv 2022. [Paper] [Github]
2022 年 12 月 24 日

Bi-Noising Diffusion: Towards Conditional Diffusion Models with Generative Restoration Priors
Kangfu Mei, Nithin Gopalakrishnan Nair, Vishal M. Patel
arXiv 2022. [Paper] [Project]
2022 年 12 月 14 日

SPIRiT-Diffusion: SPIRiT-driven Score-Based Generative Modeling for Vessel Wall imaging
Chentao Cao, Zhuo-Xu Cui, Jing Cheng, Sen Jia, Hairong Zheng, Dong Liang, Yanjie Zhu
arXiv 2022. [Paper]
2022 年 12 月 14 日

Universal Generative Modeling in Dual-domain for Dynamic MR Imaging
Chuanming Yu, Yu Guan, Ziwen Ke, Dong Liang, Qiegen Liu
arXiv 2022. [Paper]
2022 年 12 月 15 日

DifFace: Blind Face Restoration with Diffused Error Contraction
Zongsheng Yue, Chen Change Loy
arXiv 2022. [Paper] [Github]
2022 年 12 月 13 日

ShadowDiffusion: When Degradation Prior Meets Diffusion Model for Shadow Removal
Lanqing Guo, Chong Wang, Wenhan Yang, Siyu Huang, Yufei Wang, Hanspeter Pfister, Bihan Wen
arXiv 2022. [Paper]
2022 年 12 月 9 日

One Sample Diffusion Model in Projection Domain for Low-Dose CT Imaging
Bin Huang, Liu Zhang, Shiyu Lu, Boyu Lin, Weiwen Wu, Qiegen Liu
arXiv 2022. [Paper]
2022 年 12 月 7 日

SDM: Spatial Diffusion Model for Large Hole Image Inpainting
Wenbo Li, Xin Yu, Kun Zhou, Yibing Song, Zhe Lin, Jiaya Jia
arXiv 2022. [Paper]
2022 年 12 月 6 日

ADIR: Adaptive Diffusion for Image Reconstruction
Shady Abu-Hussein, Tom Tirer, Raja Giryes
arXiv 2022. [Paper] [Project]
2022 年 12 月 6 日

Image Deblurring with Domain Generalizable Diffusion Models
Mengwei Ren, Mauricio Delbracio, Hossein Talebi, Guido Gerig, Peyman Milanfar
arXiv 2022. [Paper]
2022 年 12 月 4 日

Zero-Shot Image Restoration Using Denoising Diffusion Null-Space Model
Yinhuai Wang, Jiwen Yu, Jian Zhang
arXiv 2022. [Paper] [Github]
2022 年 12 月 1 日

FREDSR: Fourier Residual Efficient Diffusive GAN for Single Image Super Resolution
Kyoungwan Woo, Achyuta Rajaram
arXiv 2022. [Paper]
2022 年 11 月 30 日

CHIMLE: Conditional Hierarchical IMLE for Multimodal Conditional Image Synthesis
Shichong Peng, Alireza Moazeni, Ke Li
arXiv 2022. [Paper]
2022 年 11 月 25 日

DOLCE: A Model-Based Probabilistic Diffusion Framework for Limited-Angle CT Reconstruction
Jiaming Liu, Rushil Anirudh, Jayaraman J. Thiagarajan, Stewart He, K. Aditya Mohan, Ulugbek S. Kamilov, Hyojin Kim
arXiv 2022. [Paper]
2022 年 11 月 22 日

基于扩散模型的噪声线性逆问题的后采样
Xiangming Meng, Yoshiyuki Kabashima
arXiv 2022. [Paper] [Github]
2022 年 11 月 20 日

Parallel Diffusion Models of Operator and Image for Blind Inverse Problems
Hyungjin Chung, Jeongsol Kim, Sehui Kim, Jong Chul Ye
arXiv 2022. [Paper]
2022 年 11 月 19 日

Solving 3D Inverse Problems using Pre-trained 2D Diffusion Models
Hyungjin Chung, Dohoon Ryu, Michael T. McCann, Marc L. Klasky, Jong Chul Ye
arXiv 2022. [Paper]
2022 年 11 月 19 日

Patch-Based Denoising Diffusion Probabilistic Model for Sparse-View CT Reconstruction
Wenjun Xia, Wenxiang Cong, Ge Wang
arXiv 2022. [Paper]
2022 年 11 月 18 日

A Structure-Guided Diffusion Model for Large-Hole Diverse Image Completion
Daichi Horita, Jiaolong Yang, Dong Chen, Yuki Koyama, Kiyoharu Aizawa
BMVC 2023. [Paper]
2022 年 11 月 18 日

混乱：扩散模型的置信区间
Eliahu Horwitz, Yedid Hoshen
arXiv 2022. [Paper]
2022 年 11 月 17 日

Superresolution Reconstruction of Single Image for Latent features
Xin Wang, Jing-Ke Yan, Jing-Ye Cai, Jian-Hua Deng, Qin Qin, Qin Wang, Heng Xiao, Yao Cheng, Peng-Fei Ye
arXiv 2022. [Paper]
2022 年 11 月 16 日

Learning to Kindle the Starlight
Yu Yuan, Jiaqi Wu, Lindong Wang, Zhongliang Jing, Henry Leung, Shuyuan Zhu, Han Pan
arXiv 2022. [Paper]
2022 年 11 月 16 日

ShadowDiffusion: Diffusion-based Shadow Removal using Classifier-driven Attention and Structure Preservation
Yeying Jin, Wenhan Yang, Wei Ye, Yuan Yuan, Robby T. Tan
arXiv 2022. [Paper]
2022 年 11 月 15 日

DriftRec: Adapting diffusion models to blind image restoration tasks
Simon Welker, Henry N. Chapman, Timo Gerkmann
arXiv 2022. [Paper]
2022 年 11 月 12 日

From Denoising Diffusions to Denoising Markov Models
Joe Benton, Yuyang Shi, Valentin De Bortoli, George Deligiannidis, Arnaud Doucet
arXiv 2022. [Paper] [Github]
7 Nov 2022

Quantized Compressed Sensing with Score-Based Generative Models
Xiangming Meng, Yoshiyuki Kabashima
arXiv 2022. [Paper] [Github]
2022 年 11 月 2 日

Intelligent Painter: Picture Composition With Resampling Diffusion Model
Wing-Fung Ku, Wan-Chi Siu, Xi Cheng, H. Anthony Chan
arXiv 2022. [Paper]
2022 年 10 月 31 日

Multitask Brain Tumor Inpainting with Diffusion Models: A Methodological Report
Pouria Rouzrokh, Bardia Khosravi, Shahriar Faghani, Mana Moassefi, Sanaz Vahdati, Bradley J. Erickson
arXiv 2022. [Paper] [Github]
2022 年 10 月 21 日

DiffGAR: Model-Agnostic Restoration from Generative Artifacts Using Image-to-Image Diffusion Models
Yueqin Yin, Lianghua Huang, Yu Liu, Kaiqi Huang
arXiv 2022. [Paper]
2022 年 10 月 16 日

Low-Dose CT Using Denoising Diffusion Probabilistic Model for 20× Speedup
Wenjun Xia, Qing Lyu, Ge Wang
arXiv 2022. [Paper]
2022 年 9 月 29 日

Diffusion Posterior Sampling for General Noisy Inverse Problems
Hyungjin Chung, Jeongsol Kim, Michael T. Mccann, Marc L. Klasky, Jong Chul Ye
arXiv 2022. [Paper] [Github]
2022 年 9 月 29 日

Face Super-Resolution Using Stochastic Differential Equations
Marcelo dos Santos, Rayson Laroca, Rafael O. Ribeiro, João Neves, Hugo Proença, David Menotti
arXiv 2022. [Paper] [Github]
2022 年 9 月 24 日

JPEG Artifact Correction using Denoising Diffusion Restoration Models
Bahjat Kawar, Jiaming Song, Stefano Ermon, Michael Elad
arXiv 2022. [Paper]
2022 年 9 月 23 日

T2V-DDPM: Thermal to Visible Face Translation using Denoising Diffusion Probabilistic Models
Nithin Gopalakrishnan Nair, Vishal M. Patel
arXiv 2022. [Paper]
2022 年 9 月 19 日

Delving Globally into Texture and Structure for Image Inpainting
Haipeng Liu, Yang Wang, Meng Wang, Yong Rui
ACM 2022. [Paper] [Github]
2022 年 9 月 17 日

PET image denoising based on denoising diffusion probabilistic models
Kuang Gong, Keith A. Johnson, Georges El Fakhri, Quanzheng Li, Tinsu Pan
arXiv 2022. [Paper]
2022 年 9 月 13 日

Self-Score: Self-Supervised Learning on Score-Based Models for MRI Reconstruction
Zhuo-Xu Cui, Chentao Cao, Shaonan Liu, Qingyong Zhu, Jing Cheng, Haifeng Wang, Yanjie Zhu, Dong Liang
IEEE TMI 2022. [Paper]
2022 年 9 月 2 日

AT-DDPM: Restoring Faces degraded by Atmospheric Turbulence using Denoising Diffusion Probabilistic Models
Nithin Gopalakrishnan Nair, Kangfu Mei, Vishal M Patel
arXiv 2022. [Paper]
2022 年 8 月 24 日

Cold Diffusion: Inverting Arbitrary Image Transforms Without Noise
Arpit Bansal, Eitan Borgnia, Hong-Min Chu, Jie S. Li, Hamid Kazemi, Furong Huang, Micah Goldblum, Jonas Geiping, Tom Goldstein
arXiv 2022. [Paper] [Github]
2022 年 8 月 19 日

High-Frequency Space Diffusion Models for Accelerated MRI
Chentao Cao, Zhuo-Xu Cui, Shaonan Liu, Dong Liang, Yanjie Zhu
arXiv 2022. [Paper]
2022 年 8 月 10 日

Restoring Vision in Adverse Weather Conditions with Patch-Based Denoising Diffusion Models
Ozan Özdenizci, Robert Legenstein
arXiv 2022. [Paper] [Github]
2022 年 7 月 29 日

Non-Uniform Diffusion Models
Georgios Batzolis, Jan Stanczuk, Carola-Bibiane Schönlieb, Christian Etmann
arXiv 2022. [Paper]
2022 年 7 月 20 日

Adaptive Diffusion Priors for Accelerated MRI Reconstruction
Salman UH Dar, Şaban Öztürk, Yilmaz Korkmaz, Gokberk Elmas, Muzaffer Özbey, Alper Güngör, Tolga Çukur
arXiv 2022. [Paper]
2022 年 7 月 12 日

A Novel Unified Conditional Score-based Generative Framework for Multi-modal Medical Image Completion
Xiangxi Meng, Yuning Gu, Yongsheng Pan, Nizhuan Wang, Peng Xue, Mengkang Lu, Xuming He, Yiqiang Zhan, Dinggang Shen
arXiv 2022. [Paper]
2022 年 7 月 7 日

SAR Despeckling using a Denoising Diffusion Probabilistic Model
Malsha V. Perera, Nithin Gopalakrishnan Nair, Wele Gedara Chaminda Bandara, Vishal M. Patel
arXiv 2022. [Paper]
2022 年 6 月 9 日

Improving Diffusion Models for Inverse Problems using Manifold Constraints
Hyungjin Chung, Byeongsu Sim, Dohoon Ryu, Jong Chul Ye
arXiv 2022. [Paper]
2022 年 6 月 2 日

The Swiss Army Knife for Image-to-Image Translation: Multi-Task Diffusion Models
Julia Wolleb, Robin Sandkühler, Florentin Bieder, Philippe C. Cattin
arXiv 2022. [Paper]
2022 年 4 月 6 日

MR Image Denoising and Super-Resolution Using Regularized Reverse Diffusion
Hyungjin Chung, Eun Sun Lee, Jong Chul Ye
arXiv 2022. [Paper]
2022 年 3 月 23 日

Towards performant and reliable undersampled MR reconstruction via diffusion model sampling
Cheng Peng, Pengfei Guo, S. Kevin Zhou, Vishal Patel, Rama Chellappa
arXiv 2022. [Paper] [Github]
2022 年 3 月 8 日

Measurement-conditioned Denoising Diffusion Probabilistic Model for Under-sampled Medical Image Reconstruction
Yutong Xie, Quanzheng Li
MICCAI 2022. [Paper] [Github]
2022 年 3 月 5 日

MRI Reconstruction via Data Driven Markov Chain with Joint Uncertainty Estimation
Guanxiong Luo, Martin Heide, Martin Uecker
arXiv 2022. [Paper] [Github]
2022 年 2 月 3 日

Unsupervised Denoising of Retinal OCT with Diffusion Probabilistic Model
Dewei Hu, Yuankai K. Tao, Ipek Oguz
arXiv 2022. [Paper] [Github]
2022 年 1 月 27 日

Denoising Diffusion Restoration Models
Bahjat Kawar, Michael Elad, Stefano Ermon, Jiaming Song
ICLR 2022 Workshop (Oral). [纸]
2022 年 1 月 27 日

RePaint：使用去噪扩散概率模型进行修复
Andreas Lugmayr, Martin Danelljan, Andres Romero, Fisher Yu, Radu Timofte, Luc Van Gool
CVPR 2022. [Paper] [Github]
2022 年 1 月 24 日

DiffuseVAE: Efficient, Controllable and High-Fidelity Generation from Low-Dimensional Latents
Kushagra Pandey, Avideep Mukherjee, Piyush Rai, Abhishek Kumar
arXiv 2022. [Paper] [Github]
2022 年 1 月 2 日

High-Resolution Image Synthesis with Latent Diffusion Models
Robin Rombach, Andreas Blattmann, Dominik Lorenz, Patrick Esser, Björn Ommer
CVPR 2022. [Paper] [Github]
2021 年 12 月 20 日

Come-Closer-Diffuse-Faster: Accelerating Conditional Diffusion Models for Inverse Problems through Stochastic Contraction
Hyungjin Chung, Byeongsu Sim, Jong Chul Ye
CVPR 2022. [Paper]
2021 年 12 月 9 日

Deblurring via Stochastic Refinement
Jay Whang, Mauricio Delbracio, Hossein Talebi, Chitwan Saharia, Alexandros G. Dimakis, Peyman Milanfar
CVPR 2022. [Paper]
2021 年 12 月 5 日

Conditional Image Generation with Score-Based Diffusion Models
Georgios Batzolis, Jan Stanczuk, Carola-Bibiane Schönlieb, Christian Etmann
arXiv 2021. [Paper]
2021 年 11 月 26 日

使用基于评分的生成模型解决医学成像中的逆问题
Yang Song, Liyue Shen, Lei Xing, Stefano Ermon
NeurIPS Workshop 2021. [Paper] [Github]
2021 年 11 月 15 日

S3RP: Self-Supervised Super-Resolution and Prediction for Advection-Diffusion Process
Chulin Wang, Kyongmin Yeo, Xiao Jin, Andres Codas, Levente J. Klein, Bruce Elmegreen
NeurIPS 2022. [Paper]
2021 年 11 月 8 日

Score-based diffusion models for accelerated MRI
Hyungjin Chung, Jong chul Ye
MIA 2021. [Paper] [Github]
2021 年 10 月 8 日

自回归扩散模型
Emiel Hoogeboom, Alexey A. Gritsenko, Jasmijn Bastings, Ben Poole, Rianne van den Berg, Tim Salimans
ICLR 2022. [Paper]
2021 年 10 月 5 日

Cascaded Diffusion Models for High Fidelity Image Generation
Jonathan Ho, Chitwan Saharia, William Chan, David J. Fleet, Mohammad Norouzi, Tim Salimans
arXiv 2021. [Paper] [Project]
2021 年 5 月 30 日

SRDiff: Single Image Super-Resolution with Diffusion Probabilistic Models
Haoying Li, Yifan Yang, Meng Chang, Huajun Feng, Zhihai Xu, Qi Li, Yueting Chen
ACM 2022. [Paper]
2021 年 4 月 30 日

通过迭代细化实现图像超分辨率
Chitwan Saharia, Jonathan Ho, William Chan, Tim Salimans, David J. Fleet, Mohammad Norouzi
arXiv 2021. [Paper] [Project] [Github]
2021 年 4 月 15 日

医学影像

Diffusion-based Data Augmentation for Nuclei Image Segmentation
Xinyi Yu, Guanbin Li, Wei Lou, Siqi Liu, Xiang Wan, Yan Chen, Haofeng Li
arXiv 2023. [Paper]
2023 年 10 月 22 日

Towards Generic Semi-Supervised Framework for Volumetric Medical Image Segmentation
Haonan Wang, Xiaomeng Li
NeurIPS 2023. [Paper] [Github]
2023 年 10 月 17 日

Self-supervised Fetal MRI 3D Reconstruction Based on Radiation Diffusion Generation Model
Junpeng Tan, Xin Zhang, Yao Lv, Xiangmin Xu, Gang Li
arXiv 2023. [Paper]
2023 年 10 月 16 日

JSMoCo: Joint Coil Sensitivity and Motion Correction in Parallel MRI with a Self-Calibrating Score-Based Diffusion Model
Lixuan Chen, Xuanyu Tian, Jiangjie Wu, Ruimin Feng, Guoyan Lao, Yuyao Zhang, Hongjiang Wei
arXiv 2023. [Paper]
2023 年 10 月 14 日

Histogram- and Diffusion-Based Medical Out-of-Distribution Detection
Evi MC Huijben, Sina Amirrajab, Josien PW Pluim
arXiv 2023. [Paper]
2023 年 10 月 12 日

Echocardiography video synthesis from end diastolic semantic map via diffusion model
Phi Nguyen Van, Duc Tran Minh, Hieu Pham Huy, Long Tran Quoc
arXiv 2023. [Paper]
2023 年 10 月 11 日

Diffusion Prior Regularized Iterative Reconstruction for Low-dose CT
Wenjun Xia, Yongyi Shi, Chuang Niu, Wenxiang Cong, Ge Wang
arXiv 2023. [Paper]
2023 年 10 月 10 日

Image Compression and Decompression Framework Based on Latent Diffusion Model for Breast Mammography
InChan Hwang, MinJae Woo
arXiv 2023. [Paper]
2023 年 10 月 8 日

Latent Diffusion Model for Medical Image Standardization and Enhancement
Md Selim, Jie Zhang, Faraneh Fathi, Michael A. Brooks, Ge Wang, Guoqiang Yu, Jin Chen
arXiv 2023. [Paper]
2023 年 10 月 8 日

Characterizing the Features of Mitotic Figures Using a Conditional Diffusion Probabilistic Model
Cagla Deniz Bahadir, Benjamin Liechty, David J. Pisapia, Mert R. Sabuncu
MICCAI Workshop 2023. [Paper]
2023 年 10 月 5 日

MedSyn: Text-guided Anatomy-aware Synthesis of High-Fidelity 3D CT Images
Yanwu Xu, Li Sun, Wei Peng, Shyam Visweswaran, Kayhan Batmanghelich
arXiv 2023. [Paper]
2023 年 10 月 5 日

Blind CT Image Quality Assessment Using DDPM-derived Content and Transformer-based Evaluator
Yongyi Shi, Wenjun Xia, Ge Wang, Xuanqin Mou
arXiv 2023. [Paper]
2023 年 10 月 4 日

DiffGAN-F2S: Symmetric and Efficient Denoising Diffusion GANs for Structural Connectivity Prediction from Brain fMRI
Qiankun Zuo, Ruiheng Li, Yi Di, Hao Tian, Changhong Jing, Xuhang Chen, Shuqiang Wang
arXiv 2023. [Paper]
2023 年 9 月 28 日

Enhancing Knee Osteoarthritis severity level classification using diffusion augmented images
Paleti Nikhil Chowdary, Gorantla VNSL Vishnu Vardhan, Menta Sai Akshay, Menta Sai Aashish, Vadlapudi Sai Aravind, Garapati Venkata Krishna Rayalu, Aswathy P
arXiv 2023. [Paper]
2023 年 9 月 17 日

Treatment-aware Diffusion Probabilistic Model for Longitudinal MRI Generation and Diffuse Glioma Growth Prediction
Qinghui Liu, Elies Fuster-Garcia, Ivar Thokle Hovden, Donatas Sederevicius, Karoline Skogen, Bradley J MacIntosh, Edvard Grødem, Till Schellhorn, Petter Brandal, Atle Bjørnerud, Kyrre Eeg Emblem
arXiv 2023. [Paper]
2023 年 9 月 11 日

Efficient Bayesian Computational Imaging with a Surrogate Score-Based Prior
Berthy T. Feng, Katherine L. Bouman
arXiv 2023. [Paper]
2023 年 9 月 5 日

Segmentation of 3D pore space from CT images using curvilinear skeleton: application to numerical simulation of microbial decomposition
Olivier Monga, Zakaria Belghali, Mouad Klai, Lucie Druoton, Dominique Michelucci, Valerie Pot
arXiv 2023. [Paper]
2023 年 9 月 4 日

Diffusion Modeling with Domain-conditioned Prior Guidance for Accelerated MRI and qMRI Reconstruction
Wanyu Bian, Albert Jang, Fang Liu
arXiv 2023. [Paper]
2023 年 9 月 2 日

PathLDM: Text conditioned Latent Diffusion Model for Histopathology
Srikar Yellapragada, Alexandros Graikos, Prateek Prasanna, Tahsin Kurc, Joel Saltz, Dimitris Samaras
arXiv 2023. [Paper]
2023 年 9 月 1 日

Unsupervised CT Metal Artifact Reduction by Plugging Diffusion Priors in Dual Domains
Xuan Liu, Yaoqin Xie, Songhui Diao, Shan Tan, Xiaokun Liang
arXiv 2023. [Paper]
2023 年 8 月 31 日

Stage-by-stage Wavelet Optimization Refinement Diffusion Model for Sparse-View CT Reconstruction
Kai Xu, Shiyu Lu, Bin Huang, Weiwen Wu, Qiegen Liu
arXiv 2023. [Paper]
2023 年 8 月 30 日

Data-iterative Optimization Score Model for Stable Ultra-Sparse-View CT Reconstruction
Weiwen Wu, Yanyang Wang
arXiv 2023. [Paper]
2023 年 8 月 28 日

Augmenting medical image classifiers with synthetic data from latent diffusion models
Luke W. Sagers, James A. Diao, Luke Melas-Kyriazi, Matthew Groh, Pranav Rajpurkar, Adewole S. Adamson, Veronica Rotemberg, Roxana Daneshjou, Arjun K. Manrai
arXiv 2023. [Paper]
2023 年 8 月 23 日

Texture Generation on 3D Meshes with Point-UV Diffusion
Xin Yu, Peng Dai, Wenbo Li, Lan Ma, Zhengzhe Liu, Xiaojuan Qi
ICCV 2023. [Paper]
2023 年 8 月 21 日

Denoising diffusion-based MR to CT image translation enables whole spine vertebral segmentation in 2D and 3D without manual annotations
Robert Graf, Joachim Schmitt, Sarah Schlaeger, Hendrik Kristian Möller, Vasiliki Sideri-Lampretsa, Anjany Sekuboyina, Sandro Manuel Krieg, Benedikt Wiestler, Bjoern Menze, Daniel Rueckert, Jan Stefan Kirschke
arXiv 2023. [Paper]
2023 年 8 月 18 日

Denoising Diffusion Probabilistic Model for Retinal Image Generation and Segmentation
Alnur Alimanov, Md Baharul Islam
ICCP 2023. [Paper]
2023 年 8 月 16 日

Shape-guided Conditional Latent Diffusion Models for Synthesising Brain Vasculature
Yash Deo, Haoran Dou, Nishant Ravikumar, Alejandro F. Frangi, Toni Lassila
arXiv 2023. [Paper]
2023 年 8 月 13 日

Masked Diffusion as Self-supervised Representation Learner
Zixuan Pan, Jianxu Chen, Yiyu Shi
arXiv 2023. [Paper]
2023 年 8 月 10 日

Synthetic Augmentation with Large-scale Unconditional Pre-training
Jiarong Ye, Haomiao Ni, Peng Jin, Sharon X. Huang, Yuan Xue
MICCAI 2023. [Paper] [Github]
2023 年 8 月 8 日

Energy-Guided Diffusion Model for CBCT-to-CT Synthesis
Linjie Fu, Xia Li, Xiuding Cai, Dong Miao, Yu Yao, Yali Shen
arXiv 2023. [Paper]
2023 年 8 月 7 日

Synthesising Rare Cataract Surgery Samples with Guided Diffusion Models
Yannik Frisch, Moritz Fuchs, Antoine Sanner, Felix Anton Ucar, Marius Frenzel, Joana Wasielica-Poslednik, Adrian Gericke, Felix Mathias Wagner, Thomas Dratsch, Anirban Mukhopadhyay
arXiv 2023. [Paper]
2023 年 8 月 3 日

Diffusion Models for Counterfactual Generation and Anomaly Detection in Brain Images
Alessandro Fontanella, Grant Mair, Joanna Wardlaw, Emanuele Trucco, Amos Storkey
arXiv 2023. [Paper]
2023 年 8 月 3 日

Reference-Free Isotropic 3D EM Reconstruction using Diffusion Models
Kyungryun Lee, Won-Ki Jeong
arXiv 2023. [Paper]
2023 年 8 月 3 日

A vision transformer-based framework for knowledge transfer from multi-modal to mono-modal lymphoma subtyping models
Bilel Guetarni, Feryal Windal, Halim Benhabiles, Marianne Petit, Romain Dubois, Emmanuelle Leteurtre, Dominique Collard
arXiv 2023. [Paper]
2023 年 8 月 2 日

C-DARL: Contrastive diffusion adversarial representation learning for label-free blood vessel segmentation
Boah Kim, Yujin Oh, Bradford J. Wood, Ronald M. Summers, Jong Chul Ye
arXiv 2023. [Paper]
2023 年 7 月 31 日

FSDiffReg: Feature-wise and Score-wise Diffusion-guided Unsupervised Deformable Image Registration for Cardiac Images
Yi Qin, Xiaomeng Li
MICCAI 2023. [Paper] [Github]
2023 年 7 月 22 日

FEDD -- Fair, Efficient, and Diverse Diffusion-based Lesion Segmentation and Malignancy Classification
Héctor Carrión, Narges Norouzi
MICCAI 2023. [Paper] [Github]
2023 年 7 月 21 日

PartDiff: Image Super-resolution with Partial Diffusion Models
Kai Zhao, Alex Ling Yu Hung, Kaifeng Pang, Haoxin Zheng, Kyunghyun Sung
arXiv 2023. [Paper]
2023 年 7 月 21 日

Make-A-Volume: Leveraging Latent Diffusion Models for Cross-Modality 3D Brain MRI Synthesis
Lingting Zhu, Zeyue Xue, Zhenchao Jin, Xian Liu, Jingzhen He, Ziwei Liu, Lequan Yu
MICCAI 2023. [Paper]
2023 年 7 月 19 日

DiffDP: Radiotherapy Dose Prediction via a Diffusion Model
Zhenghao Feng, Lu Wen, Peng Wang, Binyu Yan, Xi Wu, Jiliu Zhou, Yan Wang
arXiv 2023. [Paper]
2023 年 7 月 19 日

DreaMR: Diffusion-driven Counterfactual Explanation for Functional MRI
Hasan Atakan Bedel, Tolga Çukur
arXiv 2023. [Paper]
2023 年 7 月 18 日

TractCloud: Registration-free tractography parcellation with a novel local-global streamline point cloud representation
Tengfei Xue, Yuqian Chen, Chaoyi Zhang, Alexandra J. Golby, Nikos Makris, Yogesh Rathi, Weidong Cai, Fan Zhang, Lauren J. O'Donnell
arXiv 2023. [Paper] [Project] [Github]
2023 年 7 月 18 日

Solving Inverse Problems with Latent Diffusion Models via Hard Data Consistency
Bowen Song, Soo Min Kwon, Zecheng Zhang, Xinyu Hu, Qing Qu, Liyue Shen
arXiv 2023. [Paper]
2023 年 7 月 16 日

Fast Adaptation with Bradley-Terry Preference Models in Text-To-Image Classification and Generation
Victor Gallego
EYSM 2023. [Paper]
2023 年 7 月 15 日

Improving Nonalcoholic Fatty Liver Disease Classification Performance With Latent Diffusion Models
Romain Hardy, Cornelia Ilin, Joe Klepich, Ryan Mitchell, Steve Hall, Jericho Villareal
arXiv 2023. [Paper]
2023 年 7 月 13 日

DDGM: Solving inverse problems by Diffusive Denoising of Gradient-based Minimization
Kyle Luther, H. Sebastian Seung
arXiv 2023. [Paper]
2023 年 7 月 11 日

LLCaps: Learning to Illuminate Low-Light Capsule Endoscopy with Curved Wavelet Attention and Reverse Diffusion
Long Bai, Tong Chen, Yanan Wu, An Wang, Mobarakol Islam, Hongliang Ren
arXiv 2023. [Paper] [Github]
2023 年 7 月 5 日

Synchronous Image-Label Diffusion Probability Model with Application to Stroke Lesion Segmentation on Non-contrast CT
Jianhai Zhang, Tonghua Wan, Ethan MacDonald, Bijoy Menon, Aravind Ganesh, Qiu Wu
arXiv 2023. [Paper]
4 Jul 2023

Investigating Data Memorization in 3D Latent Diffusion Models for Medical Image Synthesis
Salman Ul Hassan Dar, Arman Ghanaat, Jannik Kahmann, Isabelle Ayx, Theano Papavassiliu, Stefan O. Schoenberg, Sandy Engelhardt
arXiv 2023. [Paper]
2023 年 7 月 3 日

Content-Preserving Diffusion Model for Unsupervised AS-OCT image Despeckling
Li Sanqian, Higashita Risa, Fu Huazhu, Li Heng, Niu Jingxuan, Liu Jiang
arXiv 2023. [Paper]
2023 年 6 月 30 日

Self-Supervised MRI Reconstruction with Unrolled Diffusion Models
Yilmaz Korkmaz, Tolga Cukur, Vishal Patel
arXiv 2023. [Paper]
2023 年 6 月 29 日

DoseDiff: Distance-aware Diffusion Model for Dose Prediction in Radiotherapy
Yiwen Zhang, Chuanpu Li, Liming Zhong, Zeli Chen, Wei Yang, Xuetao Wang
arXiv 2023. [Paper]
2023 年 6 月 28 日

DiffMix: Diffusion Model-based Data Synthesis for Nuclei Segmentation and Classification in Imbalanced Pathology Image Datasets
Hyun-Jic Oh, Won-Ki Jeong
arXiv 2023. [Paper]
2023 年 6 月 25 日

TauPETGen: Text-Conditional Tau PET Image Synthesis Based on Latent Diffusion Models
Se-In Jang, Cristina Lois, Emma Thibault, J. Alex Becker, Yafei Dong, Marc D. Normandin, Julie C. Price, Keith A. Johnson, Georges El Fakhri, Kuang Gong
arXiv 2023. [Paper]
2023 年 6 月 21 日

SANO: Score-Based Diffusion Model for Anomaly Localization in Dermatology
Alvaro Gonzalez-Jimenez, Simone Lionetti, Marc Pouly, Alexander A. Navarini
CVPR Workshop 2023. [Paper]
2023 年 6 月 18 日

Aligning Synthetic Medical Images with Clinical Knowledge using Human Feedback
Shenghuan Sun, Gregory M. Goldgof, Atul Butte, Ahmed M. Alaa
arXiv 2023. [Paper]
2023 年 6 月 16 日

Annotator Consensus Prediction for Medical Image Segmentation with Diffusion Models
Tomer Amit, Shmuel Shichrur, Tal Shaharabany, Lior Wolf
arXiv 2023. [Paper]
2023 年 6 月 15 日

Deep Ultrasound Denoising Using Diffusion Probabilistic Models
Hojat Asgariandehkordi, Sobhan Goudarzi, Adrian Basarab, Hassan Rivaz
arXiv 2023. [Paper]
2023 年 6 月 12 日

Conditional Diffusion Models for Weakly Supervised Medical Image Segmentation
Xinrong Hu, Yu-Jen Chen, Tsung-Yi Ho, Yiyu Shi
arXiv 2023. [Paper]
2023 年 6 月 6 日

Interpretable Alzheimer's Disease Classification Via a Contrastive Diffusion Autoencoder
Ayodeji Ijishakin, Ahmed Abdulaal, Adamos Hadjivasiliou, Sophie Martin, James Cole
arXiv 2023. [Paper]
2023 年 6 月 5 日

Optimizing Sampling Patterns for Compressed Sensing MRI with Diffusion Generative Models
Sriram Ravula, Brett Levac, Ajil Jalal, Jonathan I. Tamir, Alexandros G. Dimakis
arXiv 2023. [Paper]
2023 年 6 月 5 日

Brain tumor segmentation using synthetic MR images -- A comparison of GANs and diffusion models
Muhammad Usman Akbar, Måns Larsson, Anders Eklund
arXiv 2023. [Paper]
2023 年 6 月 5 日

使用掩模扩散模型进行医学图像中的无监督异常检测
Hasan Iqbal, Umar Khalid, Jing Hua, Chen Chen
arXiv 2023. [Paper]
2023 年 5 月 31 日

Mask, Stitch, and Re-Sample: Enhancing Robustness and Generalizability in Anomaly Detection through Automatic Diffusion Models
Cosmin I. Bercea, Michael Neumayr, Daniel Rueckert, Julia A. Schnabel
arXiv 2023. [Paper]
2023 年 5 月 31 日

Synthetic CT Generation from MRI using 3D Transformer-based Denoising Diffusion Model
Shaoyan Pan, Elham Abouei, Jacob Wynne, Tonghe Wang, Richard LJ Qiu, Yuheng Li, Chih-Wei Chang, Junbo Peng, Justin Roper, Pretesh Patel, David S. Yu, Hui Mao, Xiaofeng Yang
arXiv 2023. [Paper]
2023 年 5 月 31 日

Conditional Diffusion Models for Semantic 3D Medical Image Synthesis
Zolnamar Dorjsembe, Hsing-Kuo Pao, Sodtavilan Odonchimed, Furen Xiao
arXiv 2023. [Paper]
2023 年 5 月 29 日

GenerateCT: Text-Guided 3D Chest CT Generation
Ibrahim Ethem Hamamci, Sezgin Er, Enis Simsar, Alperen Tezcan, Ayse Gulnihan Simsek, Furkan Almas, Sevval Nil Esirgun, Hadrien Reynaud, Sarthak Pati, Christian Bluethgen, Bjoern Menze
arXiv 2023. [Paper] [Github]
2023 年 5 月 25 日

A Diffusion Probabilistic Prior for Low-Dose CT Image Denoising
Xuan Liu, Yaoqin Xie, Songhui Diao, Shan Tan, Xiaokun Liang
arXiv 2023. [Paper]
2023 年 5 月 25 日

Beware of diffusion models for synthesizing medical images -- A comparison with GANs in terms of memorizing brain tumor images
Muhammad Usman Akbar, Wuhao Wang, Anders Eklund
arXiv 2023. [Paper]
2023 年 5 月 12 日

Generation of Structurally Realistic Retinal Fundus Images with Diffusion Models
Sojung Go, Younghoon Ji, Sang Jun Park, Soochahn Lee
arXiv 2023. [Paper]
2023 年 5 月 11 日

Solving Inverse Problems with Score-Based Generative Priors learned from Noisy Data
Asad Aali, Marius Arvinte, Sidharth Kumar, Jonathan I. Tamir
arXiv 2023. [Paper]
2023 年 5 月 2 日

High-Fidelity Image Synthesis from Pulmonary Nodule Lesion Maps using Semantic Diffusion Model
Xuan Zhao, Benjamin Hou
MIDL 2023. [Paper]
2023 年 5 月 2 日

Unsupervised Discovery of 3D Hierarchical Structure with Generative Diffusion Features
Nurislam Tursynbek, Marc Niethammer
arXiv 2023. [Paper]
2023 年 4 月 28 日

Cycle-guided Denoising Diffusion Probability Model for 3D Cross-modality MRI Synthesis
Shaoyan Pan, Chih-Wei Chang, Junbo Peng, Jiahan Zhang, Richard LJ Qiu, Tonghe Wang, Justin Roper, Tian Liu, Hui Mao, Xiaofeng Yang
arXiv 2023. [Paper]
2023 年 4 月 28 日

Realistic Data Enrichment for Robust Image Segmentation in Histopathology
Sarah Cechnicka, James Ball, Callum Arthurs, Candice Roufosse, Bernhard Kainz
arXiv 2023. [Paper]
2023 年 4 月 19 日

Denoising Diffusion Medical Models
Pham Ngoc Huy, Tran Minh Quan
IEEE ISBI 2023. [Paper]
2023 年 4 月 19 日

A Multi-Institutional Open-Source Benchmark Dataset for Breast Cancer Clinical Decision Support using Synthetic Correlated Diffusion Imaging Data
Chi-en Amy Tai, Hayden Gunraj, Alexander Wong
arXiv 2023. [Paper]
2023 年 4 月 12 日

Cancer-Net BCa-S: Breast Cancer Grade Prediction using Volumetric Deep Radiomic Features from Synthetic Correlated Diffusion Imaging
Chi-en Amy Tai, Hayden Gunraj, Alexander Wong
arXiv 2023. [Paper]
2023 年 4 月 12 日

Mask-conditioned latent diffusion for generating gastrointestinal polyp images
Roman Macháček, Leila Mozaffari, Zahra Sepasdar, Sravanthi Parasa, Pål Halvorsen, Michael A. Riegler, Vajira Thambawita
arXiv 2023. [Paper]
2023 年 4 月 11 日

BerDiff: Conditional Bernoulli Diffusion Model for Medical Image Segmentation
Tao Chen, Chenhui Wang, Hongming Shan
arXiv 2023. [Paper]
2023 年 4 月 10 日

使用扩散模型进行模糊医学图像分割
Aimon Rahman, Jeya Maria Jose Valanarasu, Ilker Hacihaliloglu, Vishal M Patel
CVPR 2023. [Paper] [Github]
2023 年 4 月 10 日

MedGen3D: A Deep Generative Framework for Paired 3D Image and Mask Generation
Kun Han, Yifeng Xiong, Chenyu You, Pooya Khosravi, Shanlin Sun, Xiangyi Yan, James Duncan, Xiaohui Xie
arxiv 2023. [Paper] [Project]
2023 年 4 月 8 日

迈向逼真的超声胎儿脑成像合成
Michelle Iskandar, Harvey Mannering, Zhanxiang Sun, Jacqueline Matthew, Hamideh Kerdegari, Laura Peralta, Miguel Xochicale
arXiv 2023. [Paper] [Gitub]
2023 年 4 月 8 日

ViT-DAE: Transformer-driven Diffusion Autoencoder for Histopathology Image Analysis
Xuan Xu, Saarthak Kapse, Rajarsi Gupta, Prateek Prasanna
MICCAI 2023. [Paper]
2023 年 4 月 3 日

Pay Attention: Accuracy Versus Interpretability Trade-off in Fine-tuned Diffusion Models
Mischa Dombrowski, Hadrien Reynaud, Johanna P. Müller, Matthew Baugh, Bernhard Kainz
arXiv 2023. [Paper]
2023 年 3 月 31 日

DDMM-Synth: A Denoising Diffusion Model for Cross-modal Medical Image Synthesis with Sparse-view Measurement Embedding
Xiaoyue Li, Kai Shang, Gaoang Wang, Mark D. Butala
arXiv 2023. [Paper]
28 Mar 2023

Diffusion Models for Memory-efficient Processing of 3D Medical Images
Florentin Bieder, Julia Wolleb, Alicia Durrer, Robin Sandkühler, Philippe C. Cattin
MIDL 2023. [Paper]
2023 年 3 月 27 日

Multi-task Learning of Histology and Molecular Markers for Classifying Diffuse Glioma
Xiaofei Wang, Stephen Price, Chao Li
arXiv 2023. [Paper]
2023 年 3 月 26 日

CoLa-Diff: Conditional Latent Diffusion Model for Multi-Modal MRI Synthesis
Lan Jiang, Ye Mao, Xi Chen, Xiangfeng Wang, Chao Li
arXiv 2023. [Paper]
2023 年 3 月 24 日

DisC-Diff: Disentangled Conditional Diffusion Model for Multi-Contrast MRI Super-Resolution
Ye Mao, Lan Jiang, Xi Chen, Chao Li
arXiv 2023. [Paper]
2023 年 3 月 23 日

Medical diffusion on a budget: textual inversion for medical image generation
Bram de Wilde, Anindo Saha, Richard PG ten Broek, Henkjan Huisman
arXiv 2023. [Paper]
2023 年 3 月 23 日

Feature-Conditioned Cascaded Video Diffusion Models for Precise Echocardiogram Synthesis
Hadrien Reynaud, Mengyun Qiao, Mischa Dombrowski, Thomas Day, Reza Razavi, Alberto Gomez, Paul Leeson, Bernhard Kainz
arXiv 2023. [Paper]
2023 年 3 月 22 日

Distribution Aligned Diffusion and Prototype-guided network for Unsupervised Domain Adaptive Segmentation
Haipeng Zhou, Lei Zhu, Yuyin Zhou
arXiv 2023. [Paper]
2023 年 3 月 22 日

NASDM: Nuclei-Aware Semantic Histopathology Image Generation Using Diffusion Models
Aman Shrivastava, P. Thomas Fletcher
arXiv 2023. [Paper]
2023 年 3 月 20 日

Cascaded Latent Diffusion Models for High-Resolution Chest X-ray Synthesis
Tobias Weber, Michael Ingrisch, Bernd Bischl, David Rügamer
arXiv 2023. [Paper]
2023 年 3 月 20 日

DiffMIC：用于医学图像分类的双引导扩散网络
Yijun Yang, Huazhu Fu, Angelica Aviles-Rivero, Carola-Bibiane Schönlieb, Lei Zhu
arXiv 2023. [Paper]
2023 年 3 月 19 日

Diff-UNet: A Diffusion Embedded Network for Volumetric Segmentation
Zhaohu Xing, Liang Wan, Huazhu Fu, Guang Yang, Lei Zhu
arXiv 2023. [Paper] [Github]
2023 年 3 月 18 日

Reversing the Abnormal: Pseudo-Healthy Generative Networks for Anomaly Detection
Cosmin I Bercea, Benedikt Wiestler, Daniel Rueckert, Julia A Schnabel
arXiv 2023. [Paper]
2023 年 3 月 15 日

Improving 3D Imaging with Pre-Trained Perpendicular 2D Diffusion Models
Suhyeon Lee, Hyungjin Chung, Minyoung Park, Jonghyuk Park, Wi-Sun Ryu, Jong Chul Ye
arXiv 2023. [Paper]
2023 年 3 月 15 日

Efficiently Training Vision Transformers on Structural MRI Scans for Alzheimer's Disease Detection
Nikhil J. Dhinagar, Sophia I. Thomopoulos, Emily Laltoo, Paul M. Thompson
arXiv 2023. [Paper]
2023 年 3 月 14 日

Diffusion-Based Hierarchical Multi-Label Object Detection to Analyze Panoramic Dental X-rays
Ibrahim Ethem Hamamci, Sezgin Er, Enis Simsar, Anjany Sekuboyina, Mustafa Gundogar, Bernd Stadlinger, Albert Mehl, Bjoern Menze
arXiv 2023. [Paper]
2023 年 3 月 11 日

AugDiff: Diffusion based Feature Augmentation for Multiple Instance Learning in Whole Slide Image
Zhuchen Shao, Liuxi Dai, Yifeng Wang, Haoqian Wang, Yongbing Zhang
arXiv 2023. [Paper]
2023 年 3 月 11 日

Brain Diffuser: An End-to-End Brain Image to Brain Network Pipeline
Xuhang Chen, Baiying Lei, Chi-Man Pun, Shuqiang Wang
arXiv 2023. [Paper]
2023 年 3 月 11 日

Fast Diffusion Sampler for Inverse Problems by Geometric Decomposition
Hyungjin Chung, Suhyeon Lee, Jong Chul Ye
arXiv 2023. [Paper]
2023 年 3 月 10 日

Patched Diffusion Models for Unsupervised Anomaly Detection in Brain MRI
Finn Behrendt, Debayan Bhattacharya, Julia Krüger, Roland Opfer, Alexander Schlaefer
MIDL 2023. [Paper]
2023 年 3 月 7 日

Bi-parametric prostate MR image synthesis using pathology and sequence-conditioned stable diffusion
Shaheer U. Saeed, Tom Syer, Wen Yan, Qianye Yang, Mark Emberton, Shonit Punwani, Matthew J. Clarkson, Dean C. Barratt, Yipeng Hu
arXiv 2023. [Paper]
2023 年 3 月 3 日

Dissolving Is Amplifying: Towards Fine-Grained Anomaly Detection
Jian Shi, Pengyi Zhang, Ni Zhang, Hakim Ghazzai, Yehia Massoud
arXiv 2023. [Paper]
2023 年 2 月 28 日

Diffusion Denoising for Low-Dose-CT Model
Runyi Li
arXiv 2023. [Paper]
2023 年 1 月 27 日

DiffusionCT: Latent Diffusion Model for CT Image Standardization
Md Selim, Jie Zhang, Michael A. Brooks, Ge Wang, Jin Chen
arXiv 2023. [Paper]
2023 年 1 月 20 日

MedSegDiff-V2: Diffusion based Medical Image Segmentation with Transformer
Junde Wu, Rao Fu, Huihui Fang, Yu Zhang, Yanwu Xu
arXiv 2023. [Paper]
2023 年 1 月 19 日

The role of noise in denoising models for anomaly detection in medical images
Antanas Kascenas, Pedro Sanchez, Patrick Schrempf, Chaoyang Wang, William Clackett, Shadia S. Mikhael, Jeremy P. Voisey, Keith Goatman, Alexander Weir, Nicolas Pugeault, Sotirios A. Tsaftaris, Alison Q. O'Neil
arXiv 2023. [Paper] [Github]
2023 年 1 月 19 日

Diffusion-based Data Augmentation for Skin Disease Classification: Impact Across Original Medical Datasets to Fully Synthetic Images
Mohamed Akrout, Bálint Gyepesi, Péter Holló, Adrienn Poór, Blága Kincső, Stephen Solis, Katrina Cirone, Jeremy Kawahara, Dekker Slade, Latif Abid, Máté Kovács, István Fazekas
arXiv 2023. [Paper]
2023 年 1 月 12 日

Annealed Score-Based Diffusion Model for MR Motion Artifact Reduction
Gyutaek Oh, Jeong Eun Lee, Jong Chul Ye
arXiv 2023. [Paper]
2023 年 1 月 8 日

Denoising Diffusion Probabilistic Models for Generation of Realistic Fully-Annotated Microscopy Image Data Sets
Dennis Eschweiler, Johannes Stegmaier
arXiv 2023. [Paper]
2023 年 1 月 2 日

Diffusion Model based Semi-supervised Learning on Brain Hemorrhage Images for Efficient Midline Shift Quantification
Shizhan Gong, Cheng Chen, Yuqi Gong, Nga Yan Chan, Wenao Ma, Calvin Hoi-Kwan Mak, Jill Abrigo, Qi Dou
arXiv 2023. [Paper]
2023 年 1 月 1 日

SADM：用于纵向医学图像生成的序列感知扩散模型
Jee Seok Yoon, Chenghao Zhang, Heung-Il Suk, Jia Guo, Xiaoxiao Li
arXiv 2022. [Paper]
2022 年 12 月 16 日

Universal Generative Modeling in Dual-domain for Dynamic MR Imaging
Chuanming Yu, Yu Guan, Ziwen Ke, Dong Liang, Qiegen Liu
arXiv 2022. [Paper]
2022 年 12 月 15 日

Generating Realistic 3D Brain MRIs Using a Conditional Diffusion Probabilistic Model
Wei Peng, Ehsan Adeli, Qingyu Zhao, Kilian M. Pohl
arXiv 2022. [Paper] [Github]
2022 年 12 月 15 日

Diffusion Probabilistic Models beat GANs on Medical Images
Gustav Müller-Franzes, Jan Moritz Niehues, Firas Khader, Soroosh Tayebi Arasteh, Christoph Haarburger, Christiane Kuhl, Tianci Wang, Tianyu Han, Sven Nebelung, Jakob Nikolas Kather, Daniel Truhn
arXiv 2022. [Paper]
2022 年 12 月 14 日

One Sample Diffusion Model in Projection Domain for Low-Dose CT Imaging
Bin Huang, Liu Zhang, Shiyu Lu, Boyu Lin, Weiwen Wu, Qiegen Liu
arXiv 2022. [Paper]
2022 年 12 月 7 日

Neural Cell Video Synthesis via Optical-Flow Diffusion
Manuel Serna-Aguilera, Khoa Luu, Nathaniel Harris, Min Zou
arXiv 2022. [Paper]
2022 年 12 月 6 日

Improving dermatology classifiers across populations using images generated by large diffusion models
Luke W. Sagers, James A. Diao, Matthew Groh, Pranav Rajpurkar, Adewole S. Adamson, Arjun K. Manrai
NeurIPS Workshop 2022. [Paper]
2022 年 11 月 23 日

RoentGen: Vision-Language Foundation Model for Chest X-ray Generation
Pierre Chambon, Christian Bluethgen, Jean-Benoit Delbrouck, Rogier Van der Sluijs, Małgorzata Połacin, Juan Manuel Zambrano Chaves, Tanishq Mathew Abraham, Shivanshu Purohit, Curtis P. Langlotz, Akshay Chaudhari
arXiv 2022. [Paper]
2022 年 11 月 23 日

Solving 3D Inverse Problems using Pre-trained 2D Diffusion Models
Hyungjin Chung, Dohoon Ryu, Michael T. McCann, Marc L. Klasky, Jong Chul Ye
arXiv 2022. [Paper]
2022 年 11 月 19 日

Patch-Based Denoising Diffusion Probabilistic Model for Sparse-View CT Reconstruction
Wenjun Xia, Wenxiang Cong, Ge Wang
arXiv 2022. [Paper]
2022 年 11 月 18 日

Brain PET Synthesis from MRI Using Joint Probability Distribution of Diffusion Model at Ultrahigh Fields
Xie Taofeng, Cao Chentao, Cui Zhuoxu, Li Fanshi, Wei Zidong, Zhu Yanjie, Li Ye, Liang Dong, Jin Qiyu, Chen Guoqing, Wang Haifeng
arXiv 2022. [Paper]
2022 年 11 月 16 日

An unobtrusive quality supervision approach for medical image annotation
Sonja Kunzmann, Mathias Öttl, Prathmesh Madhu, Felix Denzinger, Andreas Maier
arXiv 2022. [Paper]
2022 年 11 月 11 日

Medical Diffusion -- Denoising Diffusion Probabilistic Models for 3D Medical Image Generation
Firas Khader, Gustav Mueller-Franzes, Soroosh Tayebi Arasteh, Tianyu Han, Christoph Haarburger, Maximilian Schulze-Hagen, Philipp Schad, Sandy Engelhardt, Bettina Baessler, Sebastian Foersch, Johannes Stegmaier, Christiane Kuhl, Sven Nebelung, Jakob Nikolas Kather, Daniel Truhn
arXiv 2022. [Paper]
7 Nov 2022

Generation of Anonymous Chest Radiographs Using Latent Diffusion Models for Training Thoracic Abnormality Classification Systems
Kai Packhäuser, Lukas Folle, Florian Thamm, Andreas Maier
arXiv 2022. [Paper]
2022 年 11 月 2 日

Spot the fake lungs: Generating Synthetic Medical Images using Neural Diffusion Models
Hazrat Ali, Shafaq Murad, Zubair Shah
arXiv 2022. [Paper] [Project]
2022 年 11 月 2 日

MedSegDiff: Medical Image Segmentation with Diffusion Probabilistic Model
Junde Wu, Huihui Fang, Yu Zhang, Yehui Yang, Yanwu Xu
arXiv 2022. [Paper]
2022 年 11 月 1 日

Adapting Pretrained Vision-Language Foundational Models to Medical Imaging Domains
Pierre Chambon, Christian Bluethgen, Curtis P. Langlotz, Akshay Chaudhari
arXiv 2022. [Paper]
2022 年 10 月 9 日

Low-Dose CT Using Denoising Diffusion Probabilistic Model for 20× Speedup
Wenjun Xia, Qing Lyu, Ge Wang
arXiv 2022. [Paper]
2022 年 9 月 29 日

Diffusion Adversarial Representation Learning for Self-supervised Vessel Segmentation
Boah Kim, Yujin Oh, Jong Chul Ye
arXiv 2022. [Paper]
2022 年 9 月 29 日

Conversion Between CT and MRI Images Using Diffusion and Score-Matching Models
Qing Lyu, Ge Wang
arXiv 2022. [Paper]
2022 年 9 月 24 日

Brain Imaging Generation with Latent Diffusion Models
Walter HL Pinaya, Petru-Daniel Tudosiu, Jessica Dafflon, Pedro F da Costa, Virginia Fernandez, Parashkev Nachev, Sebastien Ourselin, M. Jorge Cardoso
arXiv 2022. [Paper]
2022 年 9 月 15 日

PET image denoising based on denoising diffusion probabilistic models
Kuang Gong, Keith A. Johnson, Georges El Fakhri, Quanzheng Li, Tinsu Pan
arXiv 2022. [Paper]
2022 年 9 月 13 日

High-Frequency Space Diffusion Models for Accelerated MRI
Chentao Cao, Zhuo-Xu Cui, Shaonan Liu, Dong Liang, Yanjie Zhu
arXiv 2022. [Paper]
2022 年 8 月 10 日

What is Healthy? Generative Counterfactual Diffusion for Lesion Localization
Pedro Sanchez, Antanas Kascenas, Xiao Liu, Alison Q. O'Neil, Sotirios A. Tsaftaris
MICCAI 2022. [Paper] [Github]
2022 年 7 月 25 日

Cross-Modal Transformer GAN: A Brain Structure-Function Deep Fusing Framework for Alzheimer's Disease
Junren Pan, Shuqiang Wang
arXiv 2022. [Paper]
2022 年 6 月 20 日

Diffusion Deformable Model for 4D Temporal Medical Image Generation
Boah Kim, Jong Chul Ye
MICCAI 2022. [Paper] [Github]
2022 年 6 月 27 日

Improving Diffusion Models for Inverse Problems using Manifold Constraints
Hyungjin Chung, Byeongsu Sim, Dohoon Ryu, Jong Chul Ye
arXiv 2022. [Paper]
2022 年 6 月 2 日

AnoDDPM: Anomaly Detection with Denoising Diffusion Probabilistic Models using Simplex Noise
Julian Wyatt, Adam Leach, Sebastian M. Schmon, Chris G. Willcocks
CVPR Workshop 2022. [Paper] [Github]
2022 年 6 月 1 日

The Swiss Army Knife for Image-to-Image Translation: Multi-Task Diffusion Models
Julia Wolleb, Robin Sandkühler, Florentin Bieder, Philippe C. Cattin
arXiv 2022. [Paper]
2022 年 4 月 6 日

MR Image Denoising and Super-Resolution Using Regularized Reverse Diffusion
Hyungjin Chung, Eun Sun Lee, Jong Chul Ye
arXiv 2022. [Paper]
2022 年 3 月 23 日

Diffusion Models for Medical Anomaly Detection
Julia Wolleb, Florentin Bieder, Robin Sandkühler, Philippe C. Cattin
MICCAI 2022. [Paper] [Github]
2022 年 3 月 8 日

Measurement-conditioned Denoising Diffusion Probabilistic Model for Under-sampled Medical Image Reconstruction
Yutong Xie, Quanzheng Li
MICCAI 2022. [Paper] [Github]
2022 年 3 月 5 日

MRI Reconstruction via Data Driven Markov Chain with Joint Uncertainty Estimation
Guanxiong Luo, Martin Heide, Martin Uecker
arXiv 2022. [Paper] [Github]
2022 年 2 月 3 日

Unsupervised Denoising of Retinal OCT with Diffusion Probabilistic Model
Dewei Hu, Yuankai K. Tao, Ipek Oguz
arXiv 2022. [Paper] [Github]
2022 年 1 月 27 日

使用基于评分的生成模型解决医学成像中的逆问题
Yang Song, Liyue Shen, Lei Xing, Stefano Ermon
NeurIPS Workshop 2021. [Paper] [Github]
2021 年 11 月 15 日

Score-based diffusion models for accelerated MRI
Hyungjin Chung, Jong chul Ye
MIA 2021. [Paper] [Github]
2021 年 10 月 8 日

多模式学习

IterInv: Iterative Inversion for Pixel-Level T2I Models
Chuanming Tang, Kai Wang, Joost van de Weijer
arXiv 2023. [Paper]
2023 年 10 月 30 日

VideoCrafter1：用于生成高质量视频的开放扩散模型
Haoxin Chen, Menghan Xia, Yingqing He, Yong Zhang, Xiaodong Cun, Shaoshu Yang, Jinbo Xing, Yaofang Liu, Qifeng Chen, Xintao Wang, Chao Weng, Ying Shan
arXiv 2023. [Paper]
2023 年 10 月 30 日

IMPRESS: Evaluating the Resilience of Imperceptible Perturbations Against Unauthorized Data Usage in Diffusion-Based Generative AI
Bochuan Cao, Changjiang Li, Ting Wang, Jinyuan Jia, Bo Li, Jinghui Chen
NeurIPS 2023. [Paper]
2023 年 10 月 30 日

CustomNet: Zero-shot Object Customization with Variable-Viewpoints in Text-to-Image Diffusion Models
Ziyang Yuan, Mingdeng Cao, Xintao Wang, Zhongang Qi, Chun Yuan, Ying Shan
arXiv 2023. [Paper]
2023 年 10 月 30 日

Seeing Through the Conversation: Audio-Visual Speech Separation based on Diffusion Model
Suyeon Lee, Chaeyoung Jung, Youngjoon Jang, Jaehun Kim, Joon Son Chung
arXiv 2023. [Paper]
2023 年 10 月 30 日

Text-to-3D with Classifier Score Distillation
Xin Yu, Yuan-Chen Guo, Yangguang Li, Ding Liang, Song-Hai Zhang, Xiaojuan Qi
arXiv 2023. [Paper]
2023 年 10 月 30 日

Customizing 360-Degree Panoramas through Text-to-Image Diffusion Models
Hai Wang, Xiaoyu Xiang, Yuchen Fan, Jing-Hao Xue
arXiv 2023. [Paper]
2023 年 10 月 28 日

SD4Match: Learning to Prompt Stable Diffusion Model for Semantic Matching
Xinghui Li, Jingyi Lu, Kai Han, Victor Prisacariu
arXiv 2023. [Paper]
2023 年 10 月 26 日

CADS: Unleashing the Diversity of Diffusion Models through Condition-Annealed Sampling
Seyedmorteza Sadat, Jakob Buhmann, Derek Bradely, Otmar Hilliges, Romann M. Weber
arXiv 2023. [Paper]
2023 年 10 月 26 日

Exploring Iterative Refinement with Diffusion Models for Video Grounding
Xiao Liang, Tao Shi, Yaoyuan Liang, Te Tao, Shao-Lun Huang
arXiv 2023. [Paper]
2023 年 10 月 26 日

A Picture is Worth a Thousand Words: Principled Recaptioning Improves Image Generation
Eyal Segalis, Dani Valevski, Danny Lumen, Yossi Matias, Yaniv Leviathan
arXiv 2023. [Paper]
2023 年 10 月 25 日

CommonCanvas: An Open Diffusion Model Trained with Creative-Commons Images
Aaron Gokaslan, A. Feder Cooper, Jasmine Collins, Landan Seguin, Austin Jacobson, Mihir Patel, Jonathan Frankle, Cory Stephenson, Volodymyr Kuleshov
arXiv 2023. [Paper]
2023 年 10 月 25 日

On the Proactive Generation of Unsafe Images From Text-To-Image Models Using Benign Prompts
Yixin Wu, Ning Yu, Michael Backes, Yun Shen, Yang Zhang
arXiv 2023. [Paper]
2023 年 10 月 25 日

Fuse Your Latents: Video Editing with Multi-source Latent Diffusion Models
Tianyi Lu, Xing Zhang, Jiaxi Gu, Hang Xu, Renjing Pei, Songcen Xu, Zuxuan Wu
arXiv 2023. [Paper]
2023 年 10 月 25 日

Adapt Anything: Tailor Any Image Classifiers across Domains And Categories Using Text-to-Image Diffusion Models
Weijie Chen, Haoyu Wang, Shicai Yang, Lei Zhang, Wei Wei, Yanning Zhang, Luojun Lin, Di Xie, Yueting Zhuang
arXiv 2023. [Paper]
2023 年 10 月 25 日

Text Guided Video Editing Competition
Jay Zhangjie Wu, Xiuyu Li, Difei Gao, Zhen Dong, Jinbin Bai, Aishani Singh, Xiaoyu Xiang, Youzeng Li, Zuwei Huang, Yuanxi Sun, Rui He, Feng Hu, Junhua Hu, Hai Huang, Hanyu Zhu, Xu Cheng, Jie Tang, Mike Zheng Shou, Kurt Keutzer, Forrest Iandola
arXiv 2023. [Paper]
2023 年 10 月 24 日

Language-driven Scene Synthesis using Multi-conditional Diffusion Model
An Vuong, Minh Nhat Vu, Toan Tien Nguyen, Baoru Huang, Dzung Nguyen, Thieu Vo, Anh Nguyen
arXiv 2023. [Paper]
2023 年 10 月 24 日

FreeNoise: Tuning-Free Longer Video Diffusion via Noise Rescheduling
Haonan Qiu, Menghan Xia, Yong Zhang, Yingqing He, Xintao Wang, Ying Shan, Ziwei Liu
arXiv 2023. [Paper] [Project]
2023 年 10 月 23 日

SyncFusion: Multimodal Onset-synchronized Video-to-Audio Foley Synthesis
Marco Comunità, Riccardo F. Gramaccioni, Emilian Postolache, Emanuele Rodolà, Danilo Comminiello, Joshua D. Reiss
arXiv 2023. [Paper]
2023 年 10 月 23 日

Matryoshka Diffusion Models
Jiatao Gu, Shuangfei Zhai, Yizhe Zhang, Josh Susskind, Navdeep Jaitly
arXiv 2023. [Paper]
2023 年 10 月 23 日

Large Language Models can Share Images, Too!
Young-Jun Lee, Jonghwan Hyeon, Ho-Jin Choi
arXiv 2023. [Paper]
2023 年 10 月 23 日

对文本到图像生成模型的即时特定中毒攻击
Shawn Shan, Wenxin Ding, Josephine Passananti, Haitao Zheng, Ben Y. Zhao
arXiv 2023. [Paper]
2023 年 10 月 20 日

TexFusion: Synthesizing 3D Textures with Text-Guided Image Diffusion Models
Tianshi Cao, Karsten Kreis, Sanja Fidler, Nicholas Sharp, Kangxue Yin
arXiv 2023. [Paper]
2023 年 10 月 20 日

DPM-Solver-v3: Improved Diffusion ODE Solver with Empirical Model Statistics
Kaiwen Zheng, Cheng Lu, Jianfei Chen, Jun Zhu
NeurIPS 2023. [Paper] [Project]
2023 年 10 月 20 日

Localizing and Editing Knowledge in Text-to-Image Generative Models
Samyadeep Basu, Nanxuan Zhao, Vlad Morariu, Soheil Feizi, Varun Manjunatha
arXiv 2023. [Paper]
2023 年 10 月 20 日

TapMo: Shape-aware Motion Generation of Skeleton-free Characters
Jiaxu Zhang, Shaoli Huang, Zhigang Tu, Xin Chen, Xiaohang Zhan, Gang Yu, Ying Shan
arXiv 2023. [Paper]
2023 年 10 月 19 日

CycleNet: Rethinking Cycle Consistency in Text-Guided Diffusion for Image Manipulation
Sihan Xu, Ziqiao Ma, Yidong Huang, Honglak Lee, Joyce Chai
arXiv 2023. [Paper]
2023 年 10 月 19 日

DreamSpace: Dreaming Your Room Space with Text-Driven Panoramic Texture Propagation
Bangbang Yang, Wenqi Dong, Lin Ma, Wenbo Hu, Xiao Liu, Zhaopeng Cui, Yuewen Ma
arXiv 2023. [Paper]
2023 年 10 月 19 日

Diverse Diffusion: Enhancing Image Diversity in Text-to-Image Generation
Mariia Zameshina, Olivier Teytaud, Laurent Najman
arXiv 2023. [Paper]
2023 年 10 月 19 日

DynamiCrafter：使用视频扩散先验对开放域图像进行动画处理
邢金波、夏梦涵、张勇、陈浩鑫、王新涛、黄天真、单英
arXiv 2023. [Paper]
2023 年 10 月 18 日

Progressive3D: Progressively Local Editing for Text-to-3D Content Creation with Complex Semantic Prompts
Xinhua Cheng, Tianyu Yang, Jianan Wang, Yu Li, Lei Zhang, Jian Zhang, Li Yuan
arXiv 2023. [Paper]
2023 年 10 月 18 日

Language Agents for Detecting Implicit Stereotypes in Text-to-image Models at Scale
Qichao Wang, Tian Bian, Yian Yin, Tingyang Xu, Hong Cheng, Helen M. Meng, Zibin Zheng, Liang Chen, Bingzhe Wu
arXiv 2023. [Paper]
2023 年 10 月 18 日

Elucidating The Design Space of Classifier-Guided Diffusion Generation
Jiajun Ma, Tianyang Hu, Wenjia Wang, Jiacheng Sun
arXiv 2023. [Paper] [Github]
2023 年 10 月 17 日

BayesDiff: Estimating Pixel-wise Uncertainty in Diffusion via Bayesian Inference
Siqi Kou, Lei Gan, Dequan Wang, Chongxuan Li, Zhijie Deng
arXiv 2023. [Paper]
2023 年 10 月 17 日

GenEval: An Object-Focused Framework for Evaluating Text-to-Image Alignment
Dhruba Ghosh, Hanna Hajishirzi, Ludwig Schmidt
arXiv 2023. [Paper]
2023 年 10 月 17 日

Towards Training-free Open-world Segmentation via Image Prompting Foundation Models
Lv Tang, Peng-Tao Jiang, Hao-Ke Xiao, Bo Li
arXiv 2023. [Paper]
2023 年 10 月 17 日

LAMP: Learn A Motion Pattern for Few-Shot-Based Video Generation
Ruiqi Wu, Liangyu Chen, Tong Yang, Chunle Guo, Chongyi Li, Xiangyu Zhang
arXiv 2023. [Paper] [Project] [Github]
2023 年 10 月 16 日

潜在扩散中的场景图调节
Frank Fundel
arXiv 2023. [Paper] [Github]
2023 年 10 月 16 日

Ring-A-Bell! How Reliable are Concept Removal Methods for Diffusion Models?
Yu-Lin Tsai, Chia-Yi Hsu, Chulin Xie, Chih-Hsun Lin, Jia-You Chen, Bo Li, Pin-Yu Chen, Chia-Mu Yu, Chun-Ying Huang
arXiv 2023. [Paper]
2023 年 10 月 16 日

Zero-Shot Robotic Manipulation with Pretrained Image-Editing Diffusion Models
Kevin Black, Mitsuhiko Nakamoto, Pranav Atreya, Homer Walke, Chelsea Finn, Aviral Kumar, Sergey Levine
arXiv 2023. [Paper]
2023 年 10 月 16 日

ViPE: Visualise Pretty-much Everything
Hassan Shahmohammadi, Adhiraj Ghosh, Hendrik PA Lensch
arXiv 2023. [Paper]
2023 年 10 月 16 日

TOSS:High-quality Text-guided Novel View Synthesis from a Single Image
Yukai Shi, Jianan Wang, He Cao, Boshi Tang, Xianbiao Qi, Tianyu Yang, Yukun Huang, Shilong Liu, Lei Zhang, Heung-Yeung Shum
arXiv 2023. [Paper]
2023 年 10 月 16 日

LLM Blueprint: Enabling Text-to-Image Generation with Complex and Detailed Prompts
Hanan Gani, Shariq Farooq Bhat, Muzammal Naseer, Salman Khan, Peter Wonka
arXiv 2023. [Paper]
2023 年 10 月 16 日

LOVECon: Text-driven Training-Free Long Video Editing with ControlNet
Zhenyi Liao, Zhijie Deng
arXiv 2023. [Paper]
2023 年 10 月 15 日

PaintHuman: Towards High-fidelity Text-to-3D Human Texturing via Denoised Score Distillation
Jianhui Yu, Hao Zhu, Liming Jiang, Chen Change Loy, Weidong Cai, Wayne Wu
arXiv 2023. [Paper]
2023 年 10 月 14 日

Compositional Abilities Emerge Multiplicatively: Exploring Diffusion Models on a Synthetic Task
Maya Okawa, Ekdeep Singh Lubana, Robert P. Dick, Hidenori Tanaka
ICML Workshop 2023. [Paper]
2023 年 10 月 13 日

Hypernymy Understanding Evaluation of Text-to-Image Models via WordNet Hierarchy
Anton Baryshnikov, Max Ryabinin
arXiv 2023. [Paper]
2023 年 10 月 13 日

Making Multimodal Generation Easier: When Diffusion Models Meet LLMs
Xiangyu Zhao, Bo Liu, Qijiong Liu, Guangyuan Shi, Xiao-Ming Wu
arXiv 2023. [Paper]
2023 年 10 月 13 日

R&B: Region and Boundary Aware Zero-shot Grounded Text-to-image Generation
Jiayu Xiao, Liang Li, Henglei Lv, Shuhui Wang, Qingming Huang
arXiv 2023. [Paper]
2023 年 10 月 13 日

DeltaSpace: A Semantic-aligned Feature Space for Flexible Text-guided Image Editing
Yueming Lyu, Kang Zhao, Bo Peng, Yue Jiang, Yingya Zhang, Jing Dong
arXiv 2023. [Paper]
2023 年 10 月 12 日

OmniControl: Control Any Joint at Any Time for Human Motion Generation
Yiming Xie, Varun Jampani, Lei Zhong, Deqing Sun, Huaizu Jiang
arXiv 2023. [Paper] [Project]
2023 年 10 月 12 日

HyperHuman: Hyper-Realistic Human Generation with Latent Structural Diffusion
Xian Liu, Jian Ren, Aliaksandr Siarohin, Ivan Skorokhodov, Yanyu Li, Dahua Lin, Xihui Liu, Ziwei Liu, Sergey Tulyakov
arXiv 2023. [Paper] [Project] [Github]
2023 年 10 月 12 日

GaussianDreamer: Fast Generation from Text to 3D Gaussian Splatting with Point Cloud Priors
Taoran Yi, Jiemin Fang, Guanjun Wu, Lingxi Xie, Xiaopeng Zhang, Wenyu Liu, Qi Tian, Xinggang Wang
arXiv 2023. [Paper]
2023 年 10 月 12 日

MotionDirector: Motion Customization of Text-to-Video Diffusion Models
Rui Zhao, Yuchao Gu, Jay Zhangjie Wu, David Junhao Zhang, Jiawei Liu, Weijia Wu, Jussi Keppo, Mike Zheng Shou
arXiv 2023. [Paper]
2023 年 10 月 12 日

Interpretable Diffusion via Information Decomposition
Xianghao Kong, Ollie Liu, Han Li, Dani Yogatama, Greg Ver Steeg
arXiv 2023. [Paper]
2023 年 10 月 12 日

DrivingDiffusion: Layout-Guided multi-view driving scene video generation with latent diffusion model
Xiaofan Li, Yifu Zhang, Xiaoqing Ye
arXiv 2023. [Paper] [Project] [Github]
2023 年 10 月 11 日

ScaleCrafter：使用扩散模型进行免调整的高分辨率视觉生成
Yingqing He, Shaoshu Yang, Haoxin Chen, Xiaodong Cun, Menghan Xia, Yong Zhang, Xintao Wang, Ran He, Qifeng Chen, Ying Shan
arXiv 2023. [Paper] [Project] [Github]
2023 年 10 月 11 日

ConditionVideo: Training-Free Condition-Guided Text-to-Video Generation
Bo Peng, Xinyuan Chen, Yaohui Wang, Chaochao Lu, Yu Qiao
arXiv 2023. [Paper]
2023 年 10 月 11 日

Mini-DALLE3: Interactive Text to Image by Prompting Large Language Models
Zeqiang Lai, Xizhou Zhu, Jifeng Dai, Yu Qiao, Wenhai Wang
arXiv 2023. [Paper]
2023 年 10 月 11 日

Multi-Concept T2I-Zero: Tweaking Only The Text Embeddings and Nothing Else
Hazarapet Tunanyan, Dejia Xu, Shant Navasardyan, Zhangyang Wang, Humphrey Shi
arXiv 2023. [Paper]
2023 年 10 月 11 日

Uni-paint: A Unified Framework for Multimodal Image Inpainting with Pretrained Diffusion Model
Shiyuan Yang, Xiaodong Chen, Jing Liao
arXiv 2023. [Paper]
2023 年 10 月 11 日

ObjectComposer: Consistent Generation of Multiple Objects Without Fine-tuning
Alec Helbling, Evan Montoya, Duen Horng Chau
arXiv 2023. [Paper]
2023 年 10 月 10 日

JointNet: Extending Text-to-Image Diffusion for Dense Distribution Modeling
Jingyang Zhang, Shiwei Li, Yuanxun Lu, Tian Fang, David McKinnon, Yanghai Tsin, Long Quan, Yao Yao
arXiv 2023. [Paper]
2023 年 10 月 10 日

Improving Compositional Text-to-image Generation with Large Vision-Language Models
Song Wen, Guian Fang, Renrui Zhang, Peng Gao, Hao Dong, Dimitris Metaxas
arXiv 2023. [Paper]
2023 年 10 月 10 日

Geom-Erasing: Geometry-Driven Removal of Implicit Concept in Diffusion Models
Zhili Liu, Kai Chen, Yifan Zhang, Jianhua Han, Lanqing Hong, Hang Xu, Zhenguo Li, Dit-Yan Yeung, James Kwok
arXiv 2023 [Paper]
2023 年 10 月 9 日

FLATTEN: optical FLow-guided ATTENtion for consistent text-to-video editing
Yuren Cong, Mengmeng Xu, Christian Simon, Shoufa Chen, Jiawei Ren, Yanping Xie, Juan-Manuel Perez-Rua, Bodo Rosenhahn, Tao Xiang, Sen He
arXiv 2023. [Paper]
2023 年 10 月 9 日

Language Model Beats Diffusion -- Tokenizer is Key to Visual Generation
Lijun Yu, José Lezama, Nitesh B. Gundavarapu, Luca Versari, Kihyuk Sohn, David Minnen, Yong Cheng, Agrim Gupta, Xiuye Gu, Alexander G. Hauptmann, Boqing Gong, Ming-Hsuan Yang, Irfan Essa, David A. Ross,渌江
arXiv 2023. [Paper] [Github]
2023 年 10 月 9 日

IPDreamer: Appearance-Controllable 3D Object Generation with Image Prompts
Bohan Zeng, Shanglin Li, Yutang Feng, Hong Li, Sicheng Gao, Jiaming Liu, Huaxia Li, Xu Tang, Jianzhuang Liu, Baochang Zhang
arXiv 2023. [Paper]
2023 年 10 月 9 日

作为蒙面音频-视频学习者的扩散模型
Elvis Nunez, Yanzi Jin, Mohammad Rastegari, Sachin Mehta, Maxwell Horton
arXiv 2023. [Paper]
2023 年 10 月 5 日

Aligning Text-to-Image Diffusion Models with Reward Backpropagation
Mihir Prabhudesai, Anirudh Goyal, Deepak Pathak, Katerina Fragkiadaki
arXiv 2023. [Paper]
2023 年 10 月 5 日

Ctrl-Room: Controllable Text-to-3D Room Meshes Generation with Layout Constraints
Chuan Fang, Xiaotao Hu, Kunming Luo, Ping Tan
arXiv 2023. [Paper]
2023 年 10 月 5 日

MedSyn: Text-guided Anatomy-aware Synthesis of High-Fidelity 3D CT Images
Yanwu Xu, Li Sun, Wei Peng, Shyam Visweswaran, Kayhan Batmanghelich
arXiv 2023. [Paper]
2023 年 10 月 5 日

Kandinsky: an Improved Text-to-Image Synthesis with Image Prior and Latent Diffusion
Anton Razzhigaev, Arseniy Shakhmatov, Anastasia Maltseva, Vladimir Arkhipkin, Igor Pavlov, Ilya Ryabov, Angelina Kuts, Alexander Panchenko, Andrey Kuznetsov, Denis Dimitrov
arXiv 2023. [Paper]
2023 年 10 月 5 日

Realistic Speech-to-Face Generation with Speech-Conditioned Latent Diffusion Model with Face Prior
Jinting Wang, Li Liu, Jun Wang, Hei Victor Cheng
arXiv 2023. [Paper]
2023 年 10 月 5 日

T$^3$Bench: Benchmarking Current Progress in Text-to-3D Generation
Yuze He, Yushi Bai, Matthieu Lin, Wang Zhao, Yubin Hu, Jenny Sheng, Ran Yi, Juanzi Li, Yong-Jin Liu
arXiv 2023. [Paper] [Project] [Github]
2023 年 10 月 4 日

Boosting Dermatoscopic Lesion Segmentation via Diffusion Models with Visual and Textual Prompts
Shiyi Du, Xiaosong Wang, Yongyi Lu, Yuyin Zhou, Shaoting Zhang, Alan Yuille, Kang Li, Zongwei Zhou
arXiv 2023. [Paper]
2023 年 10 月 4 日

Magicremover: Tuning-free Text-guided Image inpainting with Diffusion Models
Siyuan Yang, Lu Zhang, Liqian Ma, Yu Liu, JingJing Fu, You He
arXiv 2023. [Paper]
2023 年 10 月 4 日

ED-NeRF: Efficient Text-Guided Editing of 3D Scene using Latent Space NeRF
Jangho Park, Gihyun Kwon, Jong Chul Ye
arXiv 2023. [Paper]
2023 年 10 月 4 日

SweetDreamer: Aligning Geometric Priors in 2D Diffusion for Consistent Text-to-3D
Weiyu Li, Rui Chen, Xuelin Chen, Ping Tan
arXiv 2023. [Paper] [Project]
2023 年 10 月 4 日

EditVal: Benchmarking Diffusion Based Text-Guided Image Editing Methods
Samyadeep Basu, Mehrdad Saberi, Shweta Bhardwaj, Atoosa Malemir Chegini, Daniela Massiceti, Maziar Sanjabi, Shell Xu Hu, Soheil Feizi
arXiv 2023. [Paper] [Project] [Github]
2023 年 10 月 3 日

FT-Shield: A Watermark Against Unauthorized Fine-tuning in Text-to-Image Diffusion Models
Yingqian Cui, Jie Ren, Yuping Lin, Han Xu, Pengfei He, Yue Xing, Wenqi Fan, Hui Liu, Jiliang Tang
arXiv 2023. [Paper]
2023 年 10 月 3 日

Amazing Combinatorial Creation: Acceptable Swap-Sampling for Text-to-Image Generation
Jun Li, Zedong Zhang, Jian Yang
arXiv 2023. [Paper] [Project]
2023 年 10 月 3 日

Transcending Domains through Text-to-Image Diffusion: A Source-Free Approach to Domain Adaptation
Shivang Chopra, Suraj Kothawade, Houda Aynaou, Aman Chadha
arXiv 2023. [Paper]
2023 年 10 月 2 日

Conditional Diffusion Distillation
Kangfu Mei, Mauricio Delbracio, Hossein Talebi, Zhengzhong Tu, Vishal M. Patel, Peyman Milanfar
arXiv 2023. [Paper]
2023 年 10 月 2 日

Direct Inversion: Boosting Diffusion-based Editing with 3 Lines of Code
Xuan Ju, Ailing Zeng, Yuxuan Bian, Shaoteng Liu, Qiang Xu
arXiv 2023. [Paper]
2023 年 10 月 2 日

及时调整逆问题的潜在扩散模型
Hyungjin Chung, Jong Chul Ye, Peyman Milanfar, Mauricio Delbracio
arXiv 2023. [Paper]
2023 年 10 月 2 日

DataInf: Efficiently Estimating Data Influence in LoRA-tuned LLMs and Diffusion Models
Yongchan Kwon, Eric Wu, Kevin Wu, James Zou
arXiv 2023. [Paper]
2023 年 10 月 2 日

Ground-A-Video: Zero-shot Grounded Video Editing using Text-to-image Diffusion Models
Hyeonho Jeong, Jong Chul Ye
arXiv 2023. [Paper] [Github]
2023 年 10 月 2 日

Music- and Lyrics-driven Dance Synthesis
Wenjie Yin, Qingyuan Yao, Yi Yu, Hang Yin, Danica Kragic, Mårten Björkman
arXiv 2023. [Paper]
2023 年 9 月 30 日

DiffPoseTalk: Speech-Driven Stylistic 3D Facial Animation and Head Pose Generation via Diffusion Models
Zhiyao Sun, Tian Lv, Sheng Ye, Matthieu Gaetan Lin, Jenny Sheng, Yu-Hui Wen, Minjing Yu, Yong-jin Liu
arXiv 2023. [Paper] [Project]
2023 年 9 月 30 日

PixArt-$alpha$: Fast Training of Diffusion Transformer for Photorealistic Text-to-Image Synthesis
Junsong Chen, Jincheng Yu, Chongjian Ge, Lewei Yao, Enze Xie, Yue Wu, Zhongdao Wang, James Kwok, Ping Luo, Huchuan Lu, Zhenguo Li
arXiv 2023. [Paper] [Project] [Github]
2023 年 9 月 30 日

InstructCV: Instruction-Tuned Text-to-Image Diffusion Models as Vision Generalists
Yulu Gan, Sungwoo Park, Alexander Schubert, Anthony Philippakis, Ahmed M. Alaa
arXiv 2023. [Paper]
2023 年 9 月 30 日

Directly Fine-Tuning Diffusion Models on Differentiable Rewards
Kevin Clark, Paul Vicol, Kevin Swersky, David J Fleet
arXiv 2023. [Paper]
2023 年 9 月 29 日

Text-image Alignment for Diffusion-based Perception
Neehar Kondapaneni, Markus Marks, Manuel Knott, Rogério Guimarães, Pietro Perona
arXiv 2023. [Paper]
2023 年 9 月 29 日

LLM-grounded Video Diffusion Models
Long Lian, Baifeng Shi, Adam Yala, Trevor Darrell, Boyi Li
arXiv 2023. [Paper] [Project] [Github]
2023 年 9 月 29 日

KV Inversion: KV Embeddings Learning for Text-Conditioned Real Image Action Editing
Jiancheng Huang, Yifan Liu, Jin Qin, Shifeng Chen
arXiv 2023. [Paper]
2023 年 9 月 28 日

CCEdit: Creative and Controllable Video Editing via Diffusion Models
Ruoyu Feng, Wenming Weng, Yanhui Wang, Yuhui Yuan, Jianmin Bao, Chong Luo, Zhibo Chen, Baining Guo
arXiv 2023. [Paper]
2023 年 9 月 28 日

Show-1：将像素和潜在扩散模型结合起来生成文本到视频
David Junhao Zhang, Jay Zhangjie Wu, Jia-Wei Liu, Rui Zhao, Lingmin Ran, Yuchao Gu, Difei Gao, Mike Zheng Shou
arXiv 2023. [Paper]
2023 年 9 月 27 日

Dynamic Prompt Learning: Addressing Cross-Attention Leakage for Text-Based Image Editing
Kai Wang, Fei Yang, Shiqi Yang, Muhammad Atif Butt, Joost van de Weijer
arXiv 2023. [Paper]
2023 年 9 月 27 日

DreamCom: Finetuning Text-guided Inpainting Model for Image Composition
Lingxiao Lu, Bo Zhang, Li Niu
arXiv 2023. [Paper]
2023 年 9 月 27 日

Learning Using Generated Privileged Information by Text-to-Image Diffusion Models
Rafael-Edy Menadil, Mariana-Iuliana Georgescu, Radu Tudor Ionescu
arXiv 2023. [Paper]
2023 年 9 月 26 日

LAVIE：使用级联潜在扩散模型生成高质量视频
Yaohui Wang, Xinyuan Chen, Xin Ma, Shangchen Zhou, Ziqi Huang, Yi Wang, Ceyuan Yang, Yinan He, Jiashuo Yu, Peiqing Yang, Yuwei Guo, Tianxing Wu, Chenyang Si, Yuming Jiang, Cunjian Chen, Chen Change Loy, Bo Dai, Dahua Lin, Yu Qiao, Ziwei Liu
arXiv 2023. [Paper] [Project]
2023 年 9 月 26 日

Learning Using Generated Privileged Information by Text-to-Image Diffusion Models
Rafael-Edy Menadil, Mariana-Iuliana Georgescu, Radu Tudor Ionescu
arXiv 2023. [Paper]
2023 年 9 月 26 日

FEC: Three Finetuning-free Methods to Enhance Consistency for Real Image Editing
Songyan Chen, Jiancheng Huang
arXiv 2023. [Paper]
2023 年 9 月 26 日

Navigating Text-To-Image Customization:From LyCORIS Fine-Tuning to Model Evaluation
Shin-Ying Yeh, Yu-Guan Hsieh, Zhidong Gao, Bernard BW Yang, Giyeong Oh, Yanmin Gong
arXiv 2023. [Paper]
2023 年 9 月 26 日

Text-image guided Diffusion Model for generating Deepfake celebrity interactions
Yunzhuo Chen, Nur Al Hasan Haldar, Naveed Akhtar, Ajmal Mian
arXiv 2023. [Paper]
2023 年 9 月 26 日

Free-Bloom: Zero-Shot Text-to-Video Generator with LLM Director and LDM Animator
Hanzhuo Huang, Yufan Feng, Cheng Shi, Lan Xu, Jingyi Yu, Sibei Yang
arXiv 2023. [Paper]
2023 年 9 月 25 日

COCO-Counterfactuals: Automatically Constructed Counterfactual Examples for Image-Text Pairs
Tiep Le, Vasudev Lal, Phillip Howard
arXiv 2023. [Paper]
2023 年 9 月 23 日

Zero-Shot Object Counting with Language-Vision Models
Jingyi Xu, Hieu Le, Dimitris Samaras
CVPR 2023. [Paper] [Github]
2023 年 9 月 22 日

DurIAN-E: Duration Informed Attention Network For Expressive Text-to-Speech Synthesis
Yu Gu, Yianrao Bian, Guangzhi Lei, Chao Weng, Dan Su
arXiv 2023. [Paper]
2023 年 9 月 22 日

FreeU: Free Lunch in Diffusion U-Net
Chenyang Si, Ziqi Huang, Yuming Jiang, Ziwei Liu
arXiv 2023. [Paper]
2023 年 9 月 20 日

Investigating Personalization Methods in Text to Music Generation
Manos Plitsis, Theodoros Kouzelis, Georgios Paraskevopoulos, Vassilis Katsouros, Yannis Panagakis
arXiv 2023. [Paper] [Project]
2023 年 9 月 20 日

Accelerating Diffusion-Based Text-to-Audio Generation with Consistency Distillation
Yatong Bai, Trung Dang, Dung Tran, Kazuhito Koishida, Somayeh Sojoudi
arXiv 2023. [Paper]
2023 年 9 月 19 日

Forgedit: Text Guided Image Editing via Learning and Forgetting
Shiwen Zhang, Shuai Xiao, Weilin Huang
arXiv 2023. [Paper] [Github]
2023 年 9 月 19 日

What is a Fair Diffusion Model? Designing Generative Text-To-Image Models to Incorporate Various Worldviews
Zoe De Simone, Angie Boggust, Arvind Satyanarayan, Ashia Wilson
arXiv 2023. [Paper]
2023 年 9 月 18 日

Causal-Story: Local Causal Attention Utilizing Parameter-Efficient Tuning For Visual Story Synthesis
Tianyi Song, Jiuxin Cao, Kun Wang, Bo Liu, Xiaofeng Zhang
arXiv 2023. [Paper]
2023 年 9 月 18 日

Progressive Text-to-Image Diffusion with Soft Latent Direction
YuTeng Ye, Jiale Cai, Hang Zhou, Guanwen Li, Youjia Zhang, Zikai Song, Chenxing Gao, Junqing Yu, Wei Yang
arXiv 2023. [Paper]
2023 年 9 月 18 日

LivelySpeaker: Towards Semantic-Aware Co-Speech Gesture Generation
Yihao Zhi, Xiaodong Cun, Xuelin Chen, Xi Shen, Wen Guo, Shaoli Huang, Shenghua Gao
arXiv 2023. [Paper]
2023 年 9 月 17 日

PromptTTS++: Controlling Speaker Identity in Prompt-Based Text-to-Speech Using Natural Language Descriptions
Reo Shimizu, Ryuichi Yamamoto, Masaya Kawamura, Yuma Shirahata, Hironori Doi, Tatsuya Komatsu, Kentaro Tachibana
arXiv 2023. [Paper]
2023 年 9 月 15 日

AV2Wav: Diffusion-Based Re-synthesis from Continuous Self-supervised Features for Audio-Visual Speech Enhancement
Ju-Chieh Chou, Chung-Ming Chien, Karen Livescu
arXiv 2023. [Paper]
2023 年 9 月 14 日

Viewpoint Textual Inversion: Unleashing Novel View Synthesis with Pretrained 2D Diffusion Models
James Burgess, Kuan-Chieh Wang, Serena Yeung
arXiv 2023. [Paper] [Github]
2023 年 9 月 14 日

Text-to-Image Models for Counterfactual Explanations: a Black-Box Approach
Guillaume Jeanneret, Loïc Simon, Frédéric Jurie
arXiv 2023. [Paper]
2023 年 9 月 14 日

Large-Vocabulary 3D Diffusion Model with Transformer
Ziang Cao, Fangzhou Hong, Tong Wu, Liang Pan, Ziwei Liu
arXiv 2023. [Paper] [Project] [Github]
2023 年 9 月 14 日

DiffTalker: Co-driven audio-image diffusion for talking faces via intermediate landmarks
Zipeng Qi, Xulong Zhang, Ning Cheng, Jing Xiao, Jianzong Wang
arXiv 2023. [Paper]
2023 年 9 月 14 日

Diffusion models for audio semantic communication
Eleonora Grassucci, Christian Marinoni, Andrea Rodriguez, Danilo Comminiello
arXiv 2023. [Paper]
2023 年 9 月 13 日

DreamStyler: Paint by Style Inversion with Text-to-Image Diffusion Models
Namhyuk Ahn, Junsoo Lee, Chunggi Lee, Kunhee Kim, Daesik Kim, Seung-Hun Nam, Kibeom Hong
arXiv 2023. [Paper]
2023 年 9 月 13 日

DCTTS: Discrete Diffusion Model with Contrastive Learning for Text-to-speech Generation
Zhichao Wu, Qiulin Li, Sixing Liu, Qun Yang
arXiv 2023. [Paper]
2023 年 9 月 13 日

InstaFlow: One Step is Enough for High-Quality Diffusion-Based Text-to-Image Generation
Xingchao Liu, Xiwen Zhang, Jianzhu Ma, Jian Peng, Qiang Liu
arXiv 2023. [Paper] [Github]
2023 年 9 月 12 日

Fg-T2M: Fine-Grained Text-Driven Human Motion Generation via Diffusion Model
Yin Wang, Zhiying Leng, Frederick WB Li, Shun-Cheng Wu, Xiaohui Liang
ICCV 2023. [Paper]
2023 年 9 月 12 日

Prompting4Debugging: Red-Teaming Text-to-Image Diffusion Models by Finding Problematic Prompts
Zhi-Yi Chin, Chieh-Ming Jiang, Ching-Chun Huang, Pin-Yu Chen, Wei-Chen Chiu
arXiv 2023. [Paper]
2023 年 9 月 12 日

PhotoVerse: Tuning-Free Image Customization with Text-to-Image Diffusion Models
Li Chen, Mengyi Zhao, Yiheng Liu, Mingxu Ding, Yangyang Song, Shizun Wang, Xu Wang, Hao Yang, Jing Liu, Kang Du, Min Zheng
arXiv 2023. [Paper] [Project]
2023 年 9 月 11 日

PAI-Diffusion: Constructing and Serving a Family of Open Chinese Diffusion Models for Text-to-image Synthesis on the Cloud
Chengyu Wang, Zhongjie Duan, Bingyan Liu, Xinyi Zou, Cen Chen, Kui Jia, Jun Huang
arXiv 2023. [Paper]
2023 年 9 月 11 日

Diffusion-Based Co-Speech Gesture Generation Using Joint Text and Audio Representation
Anna Deichler, Shivam Mehta, Simon Alexanderson, Jonas Beskow
ICMI 2023. [Paper]
2023 年 9 月 11 日

Effective Real Image Editing with Accelerated Iterative Diffusion Inversion
Zhihong Pan, Riccardo Gherardi, Xiufeng Xie, Stephen Huang
ICCV 2023. [Paper]
2023 年 9 月 10 日

Prefix-diffusion: A Lightweight Diffusion Model for Diverse Image Captioning
Guisheng Liu, Yi Li, Zhengcong Fei, Haiyan Fu, Xiangyang Luo, Yanqing Guo
arXiv 2023. [Paper]
2023 年 9 月 10 日

Text-driven Editing of 3D Scenes without Retraining
Shuangkang Fang, Yufeng Wang, Yi Yang, Yi-Hsuan Tsai, Wenrui Ding, Shuchang Zhou, Ming-Hsuan Yang
arXiv 2023. [Paper]
2023 年 9 月 10 日

The Power of Sound (TPoS): Audio Reactive Video Generation with Stable Diffusion
Yujin Jeong, Wonjeong Ryoo, Seunghyun Lee, Dabin Seo, Wonmin Byeon, Sangpil Kim, Jinkyu Kim
arXiv 2023. [Paper]
2023 年 9 月 8 日

Create Your World: Lifelong Text-to-Image Diffusion
Gan Sun, Wenqi Liang, Jiahua Dong, Jun Li, Zhengming Ding, Yang Cong
arXiv 2023. [Paper]
2023 年 9 月 8 日

MaskDiffusion: Boosting Text-to-Image Consistency with Conditional Mask
Yupeng Zhou, Daquan Zhou, Zuo-Liang Zhu, Yaxing Wang, Qibin Hou, Jiashi Feng
arXiv 2023. [Paper]
2023 年 9 月 8 日

MoEController：使用混合专家控制器进行基于指令的任意图像操作
Sijia Li, Chen Chen, Haonan Lu
arXiv 2023. [Paper] [Project]
2023 年 9 月 8 日

From Text to Mask: Localizing Entities Using the Attention of Text-to-Image Diffusion Models
Changming Xiao, Qi Yang, Feng Zhou, Changshui Zhang
arXiv 2023. [Paper]
2023 年 9 月 8 日

InstructDiffusion：视觉任务的通用建模接口
Zigang Geng, Binxin Yang, Tiankai Hang, Chen Li, Shuyang Gu, Ting Zhang, Jianmin Bao, Zheng Zhang, Han Hu, Dong Chen, Baining Guo
arXiv 2023. [Paper] [Project] [Github]
2023 年 9 月 7 日

Text-to-feature diffusion for audio-visual few-shot learning
Otniel-Bogdan Mercea, Thomas Hummel, A. Sophia Koepke, Zeynep Akata
arXiv 2023. [Paper]
2023 年 9 月 7 日

Text2Control3D: Controllable 3D Avatar Generation in Neural Radiance Fields using Geometry-Guided Text-to-Image Diffusion Model
Sungwon Hwang, Junha Hyung, Jaegul Choo
arXiv 2023. [Paper] [Project]
2023 年 9 月 7 日

Reuse and Diffuse: Iterative Denoising for Text-to-Video Generation
Jiaxi Gu, Shicong Wang, Haoyu Zhao, Tianyi Lu, Xing Zhang, Zuxuan Wu, Songcen Xu, Wei Zhang, Yu-Gang Jiang, Hang Xu
arXiv 2023. [Paper]
2023 年 9 月 7 日

SyncDreamer：从单视图图像生成多视图一致的图像
Yuan Liu, Cheng Lin, Zijiao Zeng, Xiaoxiao Long, Lingjie Liu, Taku Komura, Wenping Wang
arXiv 2023. [Paper] [Project] [Github]
2023 年 9 月 7 日

MCM: Multi-condition Motion Synthesis Framework for Multi-scenario
Zeyu Ling, Bo Han, Yongkang Wong, Mohan Kangkanhalli, Weidong Geng
arXiv 2023. [Paper]
2023 年 9 月 6 日

Generating Realistic Images from In-the-wild Sounds
Taegyeong Lee, Jeonghun Kang, Hyeonyu Kim, Taehwan Kim
ICCV 2023. [Paper]
2023 年 9 月 5 日

Generative-based Fusion Mechanism for Multi-Modal Tracking
Zhangyong Tang, Tianyang Xu, Xuefeng Zhu, Xiao-Jun Wu, Josef Kittler
arXiv 2023. [Paper]
2023 年 9 月 4 日

VGDiffZero: Text-to-image Diffusion Models Can Be Zero-shot Visual Grounders
Xuyang Liu, Siteng Huang, Yachen Kang, Honggang Chen, Donglin Wang
arXiv 2023. [Paper]
2023 年 9 月 3 日

Bridge Diffusion Model: bridge non-English language-native text-to-image diffusion model with English communities
Shanyuan Liu, Dawei Leng, Yuhui Yin
arXiv 2023. [Paper]
2023 年 9 月 2 日

MagicProp: Diffusion-based Video Editing via Motion-aware Appearance Propagation
Hanshu Yan, Jun Hao Liew, Long Mai, Shanchuan Lin, Jiashi Feng
arXiv 2023. [Paper]
2023 年 9 月 2 日

Iterative Multi-granular Image Editing using Diffusion Models
KJ Joseph, Prateksha Udhayanan, Tripti Shukla, Aishwarya Agarwal, Srikrishna Karanam, Koustava Goswami, Balaji Vasan Srinivasan
arXiv 2023. [Paper]
2023 年 9 月 1 日

DiffuGen: Adaptable Approach for Generating Labeled Image Datasets using Stable Diffusion Models
Michael Shenoda, Edward Kim
arXiv 2023. [Paper]
2023 年 9 月 1 日

VideoGen: A Reference-Guided Latent Diffusion Approach for High Definition Text-to-Video Generation
Xin Li, Wenqing Chu, Ye Wu, Weihang Yuan, Fanglong Liu, Qi Zhang, Fu Li, Haocheng Feng, Errui Ding, Jingdong Wang
arXiv 2023. [Paper]
2023 年 9 月 1 日

Detecting Out-of-Context Image-Caption Pairs in News: A Counter-Intuitive Method
Eivind Moholdt, Sohail Ahmed Khan, Duc-Tien Dang-Nguyen
CBMI 2023. [Paper]
2023 年 8 月 31 日

Any-Size-Diffusion: Toward Efficient Text-Driven Synthesis for Any-Size HD Images
Qingping Zheng, Yuanfan Guo, Jiankang Deng, Jianhua Han, Ying Li, Songcen Xu, Hang Xu
arXiv 2023. [Paper]
2023 年 8 月 31 日

MVDream: Multi-view Diffusion for 3D Generation
Yichun Shi, Peng Wang, Jianglong Ye, Mai Long, Kejie Li, Xiao Yang
arXiv 2023. [Paper]
2023 年 8 月 31 日

Intriguing Properties of Diffusion Models: A Large-Scale Dataset for Evaluating Natural Attack Capability in Text-to-Image Generative Models
Takami Sato, Justin Yue, Nanze Chen, Ningfei Wang, Qi Alfred Chen
arXiv 2023. [Paper]
2023 年 8 月 30 日

DiffusionVMR: Diffusion Model for Video Moment Retrieval
Henghao Zhao, Kevin Qinghong Lin, Rui Yan, Zechao Li
ACM MM 2023. [Paper]
2023 年 8 月 29 日

C2G2: Controllable Co-speech Gesture Generation with Latent Diffusion Model
Longbin Ji, Pengfei Wei, Yi Ren, Jinglin Liu, Chen Zhang, Xiang Yin
arXiv 2023. [Paper]
2023 年 8 月 29 日

360-Degree Panorama Generation from Few Unregistered NFoV Images
Jionghao Wang, Ziyu Chen, Jun Ling, Rong Xie, Li Song
ACM MM 2023. [Paper] [Github]
2023 年 8 月 28 日

Priority-Centric Human Motion Generation in Discrete Latent Space
Hanyang Kong, Kehong Gong, Dongze Lian, Michael Bi Mi, Xinchao Wang
arXiv 2023. [Paper]
2023 年 8 月 28 日

SketchDreamer: Interactive Text-Augmented Creative Sketch Ideation
Zhiyu Qu, Tao Xiang, Yi-Zhe Song
BMVC 2023. [Paper] [Github]
2023 年 8 月 27 日

Empowering Dynamics-aware Text-to-Video Diffusion with Large Language Models
Hao Fei, Shengqiong Wu, Wei Ji, Hanwang Zhang, Tat-Seng Chua
arXiv 2023. [Paper] [Project]
2023 年 8 月 26 日

ORES: Open-vocabulary Responsible Visual Synthesis
Minheng Ni, Chenfei Wu, Xiaodong Wang, Shengming Yin, Lijuan Wang, Zicheng Liu, Nan Duan
arXiv 2023. [Paper]
2023 年 8 月 26 日

The DiffuseStyleGesture+ entry to the GENEA Challenge 2023
Sicheng Yang, Haiwei Xue, Zhensong Zhang, Minglei Li, Zhiyong Wu, Xiaofei Wu, Songcen Xu, Zonghong Dai
ICMI 2023. [Paper] [Github]
2023 年 8 月 26 日

EfficientDreamer: High-Fidelity and Robust 3D Creation via Orthogonal-view Diffusion Prior
Minda Zhao, Chaoyi Zhao, Xinyue Liang, Lincheng Li, Zeng Zhao, Zhipeng Hu, Changjie Fan, Xin Yu
arXiv 2023. [Paper]
2023 年 8 月 25 日

Unified Concept Editing in Diffusion Models
Rohit Gandikota, Hadas Orgad, Yonatan Belinkov, Joanna Materzyńska, David Bau
arXiv 2023. [Paper] [Project] [Github]
2023 年 8 月 25 日

Dense Text-to-Image Generation with Attention Modulation
Yunji Kim, Jiyoung Lee, Jin-Hwa Kim, Jung-Woo Ha, Jun-Yan Zhu
ICCV 2023. [Paper] [Github]
2023 年 8 月 24 日

APLA: Additional Perturbation for Latent Noise with Adversarial Training Enables Consistency
Yupu Yao, Shangqi Deng, Zihan Cao, Harry Zhang, Liang-Jian Deng
arXiv 2023. [Paper]
2023 年 8 月 24 日

Manipulating Embeddings of Stable Diffusion Prompts
Niklas Deckers, Julia Peters, Martin Potthast
arXiv 2023. [Paper]
2023 年 8 月 23 日

DF-3DFace: One-to-Many Speech Synchronized 3D Face Animation with Diffusion
Se Jin Park, Joanna Hong, Minsu Kim, Yong Man Ro
arXiv 2023. [Paper]
2023 年 8 月 23 日

IT3D: Improved Text-to-3D Generation with Explicit View Synthesis
Yiwen Chen, Chi Zhang, Xiaofeng Yang, Zhongang Cai, Gang Yu, Lei Yang, Guosheng Lin
arXiv 2023. [Paper] [Github]
2023 年 8 月 22 日

DiffCloth: Diffusion Based Garment Synthesis and Manipulation via Structural Cross-modal Semantic Alignment
Xujie Zhang, Binbin Yang, Michael C. Kampffmeyer, Wenqing Zhang, Shiyue Zhang, Guansong Lu, Liang Lin, Hang Xu, Xiaodan Liang
arXiv 2023. [Paper]
2023 年 8 月 22 日

MusicJam: Visualizing Music Insights via Generated Narrative Illustrations
Chuer Chen, Nan Cao, Jiani Hou, Yi Guo, Yulei Zhang, Yang Shi
arXiv 2023. [Paper]
2023 年 8 月 22 日

田田！ Text to Animatable Digital Avatars
Tingting Liao, Hongwei Yi, Yuliang Xiu, Jiaxaing Tang, Yangyi Huang, Justus Thies, Michael J. Black
arXiv 2023. [Paper]
2023 年 8 月 21 日

EVE: Efficient zero-shot text-based Video Editing with Depth Map Guidance and Temporal Consistency Constraints
Yutao Chen, Xingning Dong, Tian Gan, Chunluan Zhou, Ming Yang, Qingpei Guo
arXiv 2023. [Paper]
2023 年 8 月 21 日

Backdooring Textual Inversion for Concept Censorship
Yutong Wu, Jie Zhang, Florian Kerschbaum, Tianwei Zhang
arXiv 2023. [Paper] [Project] [Github]
2023 年 8 月 21 日

AltDiffusion: A Multilingual Text-to-Image Diffusion Model
Fulong Ye, Guang Liu, Xinya Wu, Ledell Wu
AAAI 2024. [Paper] [Github]
2023 年 8 月 19 日

DiffDis: Empowering Generative Diffusion Model with Cross-Modal Discrimination Capability
Runhui Huang, Jianhua Han, Guansong Lu, Xiaodan Liang, Yihan Zeng, Wei Zhang, Hang Xu
ICCV 2023. [Paper]
2023 年 8 月 18 日

MATLABER: Material-Aware Text-to-3D via LAtent BRDF auto-EncodeR
Xudong Xu, Zhaoyang Lyu, Xingang Pan, Bo Dai
arXiv 2023. [Paper] [Project]
2023 年 8 月 18 日

Diff2Lip: Audio Conditioned Diffusion Models for Lip-Synchronization
Soumik Mukhopadhyay, Saksham Suri, Ravi Teja Gadde, Abhinav Shrivastava
arXiv 2023. [Paper] [Project] [Github]
2023 年 8 月 18 日

Guide3D: Create 3D Avatars from Text and Image Guidance
Yukang Cao, Yan-Pei Cao, Kai Han, Ying Shan, Kwan-Yee K. Wong
arXiv 2023. [Paper]
2023 年 8 月 18 日

Language-Guided Diffusion Model for Visual Grounding
Sijia Chen, Baochun Li
arXiv 2023. [Paper]
2023 年 8 月 18 日

SimDA: Simple Diffusion Adapter for Efficient Video Generation
Zhen Xing, Qi Dai, Han Hu, Zuxuan Wu, Yu-Gang Jiang
arXiv 2023. [Paper] [Project]
2023 年 8 月 18 日

StableVideo: Text-driven Consistency-aware Diffusion Video Editing
Wenhao Chai, Xun Guo, Gaoang Wang, Yan Lu
ICCV 2023. [Paper] [Github]
2023 年 8 月 18 日

Edit Temporal-Consistent Videos with Image Diffusion Model
Yuanzhi Wang, Yong Li, Xin Liu, Anbo Dai, Antoni Chan, Zhen Cui
arXiv 2023. [Paper]
2023 年 8 月 17 日

Watch Your Steps: Local Image and Scene Editing by Text Instructions
Ashkan Mirzaei, Tristan Aumentado-Armstrong, Marcus A. Brubaker, Jonathan Kelly, Alex Levinshtein, Konstantinos G. Derpanis, Igor Gilitschenski
arXiv 2023. [Paper] [Project]
2023 年 8 月 17 日

Learning to Generate Semantic Layouts for Higher Text-Image Correspondence in Text-to-Image Synthesis
Minho Park, Jooyeol Yun, Seunghwan Choi, Jaegul Choo
ICCV 2023. [Paper] [Project] [Github]
2023 年 8 月 16 日

DragNUWA: Fine-grained Control in Video Generation by Integrating Text, Image, and Trajectory
Shengming Yin, Chenfei Wu, Jian Liang, Jie Shi, Houqiang Li, Gong Ming, Nan Duan
arXiv 2023. [Paper] [Project]
2023 年 8 月 16 日

Dual-Stream Diffusion Net for Text-to-Video Generation
Binhui Liu, Xin Liu, Anbo Dai, Zhiyong Zeng, Zhen Cui, Jian Yang
arXiv 2023. [Paper]
2023 年 8 月 16 日

DiffV2S: Diffusion-based Video-to-Speech Synthesis with Vision-guided Speaker Embedding
Jeongsoo Choi, Joanna Hong, Yong Man Ro
arXiv 2023. [Paper]
2023 年 8 月 15 日

SGDiff: A Style Guided Diffusion Model for Fashion Synthesis
Zhengwentai Sun, Yanghong Zhou, Honghong He, PY Mok
ACM MM 2023. [Paper]
2023 年 8 月 15 日

Dancing Avatar: Pose and Text-Guided Human Motion Videos Synthesis with Image Diffusion Model
Bosheng Qin, Wentao Ye, Qifan Yu, Siliang Tang, Yueting Zhuang
arXiv 2023. [Paper]
2023 年 8 月 15 日

Diffusion Based Augmentation for Captioning and Retrieval in Cultural Heritage
Dario Cioni, Lorenzo Berlincioni, Federico Becattini, Alberto del Bimbo
ICCV Workshop 2023. [Paper]
2023 年 8 月 14 日

Jurassic World Remake: Bringing Ancient Fossils Back to Life via Zero-Shot Long Image-to-Image Translation
Alexander Martin, Haitian Zheng, Jie An, Jiebo Luo
ACM MM 2023. [Paper]
2023 年 8 月 14 日

UniBrain: Unify Image Reconstruction and Captioning All in One Diffusion Model from Human Brain Activity
Weijian Mai, Zhijun Zhang
arXiv 2023. [Paper]
2023 年 8 月 14 日

Free-ATM: Exploring Unsupervised Learning on Diffusion-Generated Images with Free Attention Masks
David Junhao Zhang, Mutian Xu, Chuhui Xue, Wenqing Zhang, Xiaoguang Han, Song Bai, Mike Zheng Shou
arXiv 2023. [Paper]
2023 年 8 月 13 日

IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models
Hu Ye, Jun Zhang, Sibo Liu, Xiao Han, Wei Yang
arXiv 2023. [Paper] [Project] [Github]
2023 年 8 月 13 日

LAW-Diffusion: Complex Scene Generation by Diffusion with Layouts
Binbin Yang, Yi Luo, Ziliang Chen, Guangrun Wang, Xiaodan Liang, Liang Lin
arXiv 2023. [Paper]
2023 年 8 月 13 日

ModelScope Text-to-Video Technical Report
Jiuniu Wang, Hangjie Yuan, Dayou Chen, Yingya Zhang, Xiang Wang, Shiwei Zhang
arXiv 2023. [Paper]
2023 年 8 月 12 日

DatasetDM: Synthesizing Data with Perception Annotations Using Diffusion Models
Weijia Wu, Yuzhong Zhao, Hao Chen, Yuchao Gu, Rui Zhao, Yefei He, Hong Zhou, Mike Zheng Shou, Chunhua Shen
arXiv 2023. [Paper] [Project] [Github]
2023 年 8 月 11 日

通过扩散进行多样化的数据增强，以实现有效的测试时间提示调整
Chun-Mei Feng, Kai Yu, Yong Liu, Salman Khan, Wangmeng Zuo
ICCV 2023. [Paper] [Github]
2023 年 8 月 11 日

Masked-Attention Diffusion Guidance for Spatially Controlling Text-to-Image Generation
Yuki Endo
arXiv 2023. [Paper]
2023 年 8 月 11 日

Audio is all in one: speech-driven gesture synthetics using WavLM pre-trained model
Fan Zhang, Naye Ji, Fuxing Gao, Siyuan Zhao, Zhaohan Wang, Shunman Li
arXiv 2023. [Paper]
2023 年 8 月 11 日

Zero-shot Text-driven Physically Interpretable Face Editing
Yapeng Meng, Songru Yang, Xu Hu, Rui Zhao, Lincheng Li, Zhenwei Shi, Zhengxia Zou
arXiv 2023. [Paper]
2023 年 8 月 11 日

PromptPaint: Steering Text-to-Image Generation Through Paint Medium-like Interactions
John Joon Young Chung, Eytan Adar
UIST 2023. [Paper]
2023 年 8 月 9 日

LayoutLLM-T2I: Eliciting Layout Guidance from LLM for Text-to-Image Generation
Leigang Qu, Shengqiong Wu, Hao Fei, Liqiang Nie, Tat-Seng Chua
arXiv 2023. [Paper] [Project]
2023 年 8 月 9 日

Cloth2Tex: A Customized Cloth Texture Generation Pipeline for 3D Virtual Try-On
Daiheng Gao, Xu Chen, Xindi Zhang, Qi Wang, Ke Sun, Bang Zhang, Liefeng Bo, Qixing Huang
arXiv 2023. [Paper]
2023 年 8 月 8 日

MindDiffuser: Controlled Image Reconstruction from Human Brain Activity with Semantic and Structural Diffusion
Yizhuo Lu, Changde Du, Qiongyi zhou, Dianpeng Wang, Huiguang He
arXiv 2023. [Paper]
2023 年 8 月 8 日

FLIRT: Feedback Loop In-context Red Teaming
Ninareh Mehrabi, Palash Goyal, Christophe Dupuy, Qian Hu, Shalini Ghosh, Richard Zemel, Kai-Wei Chang, Aram Galstyan, Rahul Gupta
arXiv 2023. [Paper]
2023 年 8 月 8 日

DiffSynth: Latent In-Iteration Deflickering for Realistic Video Synthesis
Zhongjie Duan, Lizhou You, Chengyu Wang, Cen Chen, Ziheng Wu, Weining Qian, Jun Huang
arXiv 2023. [Paper] [Project] [Github]
2023 年 8 月 7 日

AvatarVerse: High-quality & Stable 3D Avatar Creation from Text and Pose
Huichao Zhang, Bowen Chen, Hao Yang, Liao Qu, Xu Wang, Li Chen, Chao Long, Feida Zhu, Kang Du, Min Zheng
arXiv 2023. [Paper] [Project]
2023 年 8 月 7 日

Towards Scene-Text to Scene-Text Translation
Onkar Susladkar, Prajwal Gatti, Anand Mishra
arXiv 2023. [Paper]
2023 年 8 月 6 日

Sketch and Text Guided Diffusion Model for Colored Point Cloud Generation
Zijie Wu, Yaonan Wang, Mingtao Feng, He Xie, Ajmal Mian
arXiv 2023. [Paper]
2023 年 8 月 5 日

ConceptLab: Creative Generation using Diffusion Prior Constraints
Elad Richardson, Kfir Goldberg, Yuval Alaluf, Daniel Cohen-Or
arXiv 2023. [Paper] [Project] [Github]
2023 年 8 月 3 日

DiffColor: Toward High Fidelity Text-Guided Image Colorization with Diffusion Models
Jianxin Lin, Peng Xiao, Yijun Wang, Rongju Zhang, Xiangxiang Zeng
arXiv 2023. [Paper]
2023 年 8 月 3 日

Synthesizing Long-Term Human Motions with Diffusion Models via Coherent Sampling
Zhao Yang, Bing Su, Ji-Rong Wen
ACM MM 2023. [Paper] [Github]
2023 年 8 月 3 日

Reverse Stable Diffusion: What prompt was used to generate this image?
Florinel-Alin Croitoru, Vlad Hondru, Radu Tudor Ionescu, Mubarak Shah
arXiv 2023. [Paper]
2023 年 8 月 2 日

Degeneration-Tuning: Using Scrambled Grid shield Unwanted Concepts from Stable Diffusion
Zixuan Ni, Longhui Wei, Jiacheng Li, Siliang Tang, Yueting Zhuang, Qi Tian
arXiv 2023. [Paper]
2023 年 8 月 2 日

ImageBrush: Learning Visual In-Context Instructions for Exemplar-Based Image Manipulation
Yasheng Sun, Yifan Yang, Houwen Peng, Yifei Shen, Yuqing Yang, Han Hu, Lili Qiu, Hideki Koike
arXiv 2023. [Paper]
2023 年 8 月 2 日

The Bias Amplification Paradox in Text-to-Image Generation
Preethi Seshadri, Sameer Singh, Yanai Elazar
arXiv 2023. [Paper]
2023 年 8 月 1 日

BAGM: A Backdoor Attack for Manipulating Text-to-Image Generative Models
Jordan Vice, Naveed Akhtar, Richard Hartley, Ajmal Mian
arXiv 2023. [Paper] [Github] [Dataset]
2023 年 7 月 31 日

MobileVidFactory: Automatic Diffusion-Based Social Media Video Generation for Mobile Devices from Text
Junchen Zhu, Huan Yang, Wenjing Wang, Huiguo He, Zixi Tuo, Yongsheng Yu, Wen-Huang Cheng, Lianli Gao, Jingkuan Song, Jianlong Fu, Jiebo Luo
arXiv 2023. [Paper]
2023 年 7 月 31 日

DAVIS: High-Quality Audio-Visual Separation with Generative Diffusion Models
Chao Huang, Susan Liang, Yapeng Tian, Anurag Kumar, Chenliang Xu
arXiv 2023. [Paper]
2023 年 7 月 31 日

Contrastive Conditional Latent Diffusion for Audio-visual Segmentation
Yuxin Mao, Jing Zhang, Mochu Xiang, Yunqiu Lv, Yiran Zhong, Yuchao Dai
arXiv 2023. [Paper]
2023 年 7 月 31 日

HD-Fusion: Detailed Text-to-3D Generation Leveraging Multiple Noise Estimation
Jinbo Wu, Xiaobo Gao, Xing Liu, Zhengyang Shen, Chen Zhao, Haocheng Feng, Jingtuo Liu, Errui Ding
arXiv 2023. [Paper]
2023 年 7 月 30 日

Seeing through the Brain: Image Reconstruction of Visual Perception from Human Brain Signals
Yu-Ting Lan, Kan Ren, Yansen Wang, Wei-Long Zheng, Dongsheng Li, Bao-Liang Lu, Lili Qiu
arXiv 2023. [Paper]
2023 年 7 月 27 日

VideoControlNet: A Motion-Guided Video-to-Video Translation Framework by Using Diffusion Model with ControlNet
Zhihao Hu, Dong Xu
arXiv 2023. [Paper] [Project]
2023 年 7 月 26 日

Points-to-3D: Bridging the Gap between Sparse Points and Shape-Controllable Text-to-3D Generation
Chaohui Yu, Qiang Zhou, Jingliang Li, Zhe Zhang, Zhibin Wang, Fan Wang
arXiv 2023. [Paper]
2023 年 7 月 26 日

Visual Instruction Inversion: Image Editing via Visual Prompting
Thao Nguyen, Yuheng Li, Utkarsh Ojha, Yong Jae Lee
arXiv 2023. [Paper] [Project] [Github]
2023 年 7 月 26 日

Composite Diffusion | whole >= Sigma parts
Vikram Jamwal, Ramaneswaran S
arXiv 2023. [Paper]
2023 年 7 月 25 日

Fashion Matrix: Editing Photos by Just Talking
Zheng Chong, Xujie Zhang, Fuwei Zhao, Zhenyu Xie, Xiaodan Liang
arXiv 2023. [Paper] [Project] [Github]
2023 年 7 月 25 日

Understanding the Latent Space of Diffusion Models through the Lens of Riemannian Geometry
Yong-Hyun Park, Mingi Kwon, Jaewoong Choi, Junghyo Jo, Youngjung Uh
arXiv 2023. [Paper]
2023 年 7 月 24 日

InFusion: Inject and Attention Fusion for Multi Concept Zero-Shot Text-based Video Editing
Anant Khandelwal
ICCV Workshop 2023. [Paper]
2023 年 7 月 22 日

Subject-Diffusion:Open Domain Personalized Text-to-Image Generation without Test-time Fine-tuning
Jian Ma, Junhao Liang, Chen Chen, Haonan Lu
arXiv 2023. [Paper] [Project] [Github]
2023 年 7 月 21 日

Divide & Bind Your Attention for Improved Generative Semantic Nursing
Yumeng Li, Margret Keuper, Dan Zhang, Anna Khoreva
arXiv 2023. [Paper] [Project]
2023 年 7 月 20 日

AdjointDPM: Adjoint Sensitivity Method for Gradient Backpropagation of Diffusion Probabilistic Models
Jiachun Pan, Jun Hao Liew, Vincent YF Tan, Jiashi Feng, Hanshu Yan
arXiv 2023. [Paper]
2023 年 7 月 20 日

BoxDiff: Text-to-Image Synthesis with Training-Free Box-Constrained Diffusion
Jinheng Xie, Yuexiang Li, Yawen Huang, Haozhe Liu, Wentian Zhang, Yefeng Zheng, Mike Zheng Shou
arXiv 2023. [Paper] [Github]
2023 年 7 月 20 日

Text2Layer: Layered Image Generation using Latent Diffusion Model
Xinyang Zhang, Wentian Zhao, Xin Lu, Jeff Chien
arXiv 2023. [Paper]
2023 年 7 月 19 日

FABRIC: Personalizing Diffusion Models with Iterative Feedback
Dimitri von Rütte, Elisabetta Fedele, Jonathan Thomm, Lukas Wolf
arXiv 2023. [Paper]
2023 年 7 月 19 日

TokenFlow：一致的扩散功能，实现一致的视频编辑
Michal Geyer, Omer Bar-Tal, Shai Bagon, Tali Dekel
arXiv 2023. [Paper] [Project] [Github]
2023 年 7 月 19 日

Multimodal Diffusion Segmentation Model for Object Segmentation from Manipulation Instructions
Yui Iioka, Yu Yoshida, Yuiga Wada, Shumpei Hatanaka, Komei Sugiura
arXiv 2023. [Paper]
2023 年 7 月 17 日

Not All Steps are Created Equal: Selective Diffusion Distillation for Image Manipulation
Luozhou Wang, Shuai Yang, Shu Liu, Ying-cong Chen
ICCV 2023. [Paper] [Github]
2023 年 7 月 17 日

用于基于骨架的视频异常检测的多模态运动条件扩散模型
Alessandro Flaborea, Luca Collorone, Guido D'Amely, Stefano D'Arrigo, Bardh Prenkaj, Fabio Galasso
arXiv 2023. [Paper]
2023 年 7 月 14 日

HyperDreamBooth: HyperNetworks for Fast Personalization of Text-to-Image Models
Nataniel Ruiz, Yuanzhen Li, Varun Jampani, Wei Wei, Tingbo Hou, Yael Pritch, Neal Wadhwa, Michael Rubinstein, Kfir Aberman
arXiv 2023. [Paper] [Project] [Github]
2023 年 7 月 13 日

Exact Diffusion Inversion via Bi-directional Integration Approximation
Guoqiang Zhang, JP Lewis, W. Bastiaan Kleijn
arXiv 2023. [Paper]
2023 年 7 月 10 日

AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning
Yuwei Guo, Ceyuan Yang, Anyi Rao, Yaohui Wang, Yu Qiao, Dahua Lin, Bo Dai
arXiv 2023. [Paper] [Project] [Github]
2023 年 7 月 10 日

Divide, Evaluate, and Refine: Evaluating and Improving Text-to-Image Alignment with Iterative VQA Feedback
Jaskirat Singh, Liang Zheng
arXiv 2023. [Paper] [Project] [Github]
2023 年 7 月 10 日

Augmenters at SemEval-2023 Task 1: Enhancing CLIP in Handling Compositionality and Ambiguity for Zero-Shot Visual WSD through Prompt Augmentation and Text-To-Image Diffusion
Jie S. Li, Yow-Ting Shiue, Yong-Siang Shih, Jonas Geiping
arXiv 2023. [Paper]
2023 年 7 月 9 日

Measuring the Success of Diffusion Models at Imitating Human Artists
Stephen Casper, Zifan Guo, Shreya Mogulothu, Zachary Marinov, Chinmay Deshpande, Rui-Jie Yew, Zheng Dai, Dylan Hadfield-Menell
ICML Workshop 2023. [Paper]
8 Jul 2023

How to Detect Unauthorized Data Usages in Text-to-image Diffusion Models
Zhenting Wang, Chen Chen, Yuchen Liu, Lingjuan Lyu, Dimitris Metaxas, Shiqing Ma
arXiv 2023. [Paper]
2023 年 7 月 6 日

Collaborative Score Distillation for Consistent Visual Synthesis
Subin Kim, Kyungmin Lee, June Suk Choi, Jongheon Jeong, Kihyuk Sohn, Jinwoo Shin
arXiv 2023. [Paper] [Project] [Github]
4 Jul 2023

SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis
Dustin Podell, Zion English, Kyle Lacey, Andreas Blattmann, Tim Dockhorn, Jonas Müller, Joe Penna, Robin Rombach
arXiv 2023. [Paper] [Github]
4 Jul 2023

MVDiffusion：通过对应感知扩散实现整体多视图图像生成
Shitao Tang, Fuyang Zhang, Jiacheng Chen, Peng Wang, Yasutaka Furukawa
arXiv 2023. [Paper] [Project]
2023 年 7 月 3 日

Counting Guidance for High Fidelity Text-to-Image Synthesis
Wonjun Kang, Kevin Galim, Hyung Il Koo
arXiv 2023. [Paper]
2023 年 6 月 30 日

Michelangelo: Conditional 3D Shape Generation based on Shape-Image-Text Aligned Latent Representation
Zibo Zhao, Wen Liu, Xin Chen, Xianfang Zeng, Rui Wang, Pei Cheng, Bin Fu, Tao Chen, Gang Yu, Shenghua Gao
arXiv 2023. [Paper]
2023 年 6 月 29 日

Generate Anything Anywhere in Any Scene
Yuheng Li, Haotian Liu, Yangming Wen, Yong Jae Lee
arXiv 2023. [Paper] [Project]
2023 年 6 月 29 日

Diff-Foley: Synchronized Video-to-Audio Synthesis with Latent Diffusion Models
Simian Luo, Chuanhao Yan, Chenxu Hu, Hang Zhao
arXiv 2023. [Paper] [Github]
2023 年 6 月 29 日

PFB-Diff: Progressive Feature Blending Diffusion for Text-driven Image Editing
Wenjing Huang, Shikui Tu, Lei Xu
arXiv 2023. [Paper]
2023 年 6 月 28 日

DiffSketcher: Text Guided Vector Sketch Synthesis through Latent Diffusion Models
Ximing Xing, Chuang Wang, Haitao Zhou, Jing Zhang, Qian Yu, Dong Xu
arXiv 2023. [Paper]
2023 年 6 月 26 日

A-STAR: Test-time Attention Segregation and Retention for Text-to-image Synthesis
Aishwarya Agarwal, Srikrishna Karanam, KJ Joseph, Apoorv Saxena, Koustava Goswami, Balaji Vasan Srinivasan
arXiv 2023. [Paper]
2023 年 6 月 26 日

Decompose and Realign: Tackling Condition Misalignment in Text-to-Image Diffusion Models
Luozhou Wang, Guibao Shen, Yijun Li, Ying-cong Chen
arXiv 2023. [Paper]
2023 年 6 月 26 日

Zero-shot spatial layout conditioning for text-to-image diffusion models
Guillaume Couairon, Marlène Careil, Matthieu Cord, Stéphane Lathuilière, Jakob Verbeek
arXiv 2023. [Paper]
2023 年 6 月 23 日

DreamTime: An Improved Optimization Strategy for Text-to-3D Content Creation
Yukun Huang, Jianan Wang, Yukai Shi, Xianbiao Qi, Zheng-Jun Zha, Lei Zhang
arXiv 2023. [Paper]
2023 年 6 月 21 日

Align, Adapt and Inject: Sound-guided Unified Image Generation
Yue Yang, Kaipeng Zhang, Yuying Ge, Wenqi Shao, Zeyue Xue, Yu Qiao, Ping Luo
arXiv 2023. [Paper]
2023 年 6 月 20 日

EMoG: Synthesizing Emotive Co-speech 3D Gesture with Diffusion Model
Lianying Yin, Yijun Wang, Tianyu He, Jinming Liu, Wei Zhao, Bohan Li, Xin Jin, Jianxin Lin
arXiv 2023. [Paper]
2023 年 6 月 20 日

RS5M: A Large Scale Vision-Language Dataset for Remote Sensing Vision-Language Foundation Model
Zilun Zhang, Tiancheng Zhao, Yulong Guo, Jianwei Yin
arXiv 2023. [Paper]
2023 年 6 月 20 日

Instruct-NeuralTalker: Editing Audio-Driven Talking Radiance Fields with Instructions
Yuqi Sun, Reian He, Weimin Tan, Bo Yan
arXiv 2023. [Paper]
2023 年 6 月 19 日

Conditional Text Image Generation with Diffusion Models
Yuanzhi Zhu, Zhaohai Li, Tianwei Wang, Mengchao He, Cong Yao
arXiv 2023. [Paper]
2023 年 6 月 19 日

Point-Cloud Completion with Pretrained Text-to-image Diffusion Models
Yoni Kasten, Ohad Rahamim, Gal Chechik
arXiv 2023. [Paper]
2023 年 6 月 18 日

Energy-Based Cross Attention for Bayesian Context Update in Text-to-Image Diffusion Models
Geon Yeong Park, Jeongsol Kim, Beomsu Kim, Sang Wan Lee, Jong Chul Ye
arXiv 2023. [Paper]
2023 年 6 月 16 日

Evaluating the Robustness of Text-to-image Diffusion Models against Real-world Attacks
Hongcheng Gao, Hao Zhang, Yinpeng Dong, Zhijie Deng
arXiv 2023. [Paper]
2023 年 6 月 16 日

CLIPSonic: Text-to-Audio Synthesis with Unlabeled Videos and Pretrained Language-Vision Models
Hao-Wen Dong, Xiaoyu Liu, Jordi Pons, Gautam Bhattacharya, Santiago Pascual, Joan Serrà, Taylor Berg-Kirkpatrick, Julian McAuley
arXiv 2023. [Paper]
2023 年 6 月 16 日

Taming Diffusion Models for Music-driven Conducting Motion Generation
Zhuoran Zhao, Jinbin Bai, Delong Chen, Debang Wang, Yubo Pan
arXiv 2023. [Paper]
2023 年 6 月 15 日

Diff-TTSG: Denoising probabilistic integrated speech and gesture synthesis
Shivam Mehta, Siyang Wang, Simon Alexanderson, Jonas Beskow, Éva Székely, Gustav Eje Henter
arXiv 2023. [Paper]
2023 年 6 月 15 日

Diffusion Models for Zero-Shot Open-Vocabulary Segmentation
Laurynas Karazija, Iro Laina, Andrea Vedaldi, Christian Rupprecht
arXiv 2023. [Paper]
2023 年 6 月 15 日

Linguistic Binding in Diffusion Models: Enhancing Attribute Correspondence through Attention Map Alignment
Royi Rassin, Eran Hirsch, Daniel Glickman, Shauli Ravfogel, Yoav Goldberg, Gal Chechik
arXiv 2023. [Paper]
2023 年 6 月 15 日

Training Multimedia Event Extraction With Generated Images and Captions
Zilin Du, Yunxin Li, Xu Guo, Yidan Sun, Boyang Li
arXiv 2023. [Paper]
2023 年 6 月 15 日

VidEdit: Zero-Shot and Spatially Aware Text-Driven Video Editing
Paul Couairon, Clément Rambour, Jean-Emmanuel Haugeard, Nicolas Thome
arXiv 2023. [Paper]
2023 年 6 月 14 日

Norm-guided latent space exploration for text-to-image generation
Dvir Samuel, Rami Ben-Ari, Nir Darshan, Haggai Maron, Gal Chechik
arXiv 2023. [Paper]
2023 年 6 月 14 日

Training-free Diffusion Model Adaptation for Variable-Sized Text-to-Image Synthesis
Zhiyu Jin, Xuli Shen, Bin Li, Xiangyang Xue
arXiv 2023. [Paper]
2023 年 6 月 14 日

GBSD: Generative Bokeh with Stage Diffusion
Jieren Deng, Xin Zhou, Hao Tian, Zhihong Pan, Derek Aguiar
arXiv 2023. [Paper]
2023 年 6 月 14 日

Diffusion in Diffusion: Cyclic One-Way Diffusion for Text-Vision-Conditioned Generation
Yongqi Yang, Ruoyu Wang, Zhihao Qian, Ye Zhu, Yu Wu
arXiv 2023. [Paper]
2023 年 6 月 14 日

Rerender A Video: Zero-Shot Text-Guided Video-to-Video Translation
Shuai Yang, Yifan Zhou, Ziwei Liu, Chen Change Loy
arXiv 2023. [Paper]
2023 年 6 月 13 日

Paste, Inpaint and Harmonize via Denoising: Subject-Driven Image Editing with Pre-Trained Diffusion Model
Xin Zhang, Jiaxian Guo, Paul Yoo, Yutaka Matsuo, Yusuke Iwasawa
arXiv 2023. [Paper]
2023 年 6 月 13 日

Controlling Text-to-Image Diffusion by Orthogonal Finetuning
Zeju Qiu, Weiyang Liu, Haiwen Feng, Yuxuan Xue, Yao Feng, Zhen Liu, Dan Zhang, Adrian Weller, Bernhard Schölkopf
arXiv 2023. [Paper]
2023 年 6 月 12 日

MovieFactory: Automatic Movie Creation from Text using Large Generative Models for Language and Images
Junchen Zhu, Huan Yang, Huiguo He, Wenjing Wang, Zixi Tuo, Wen-Huang Cheng, Lianli Gao, Jingkuan Song, Jianlong Fu
arXiv 2023. [Paper]
2023 年 6 月 12 日

InstructP2P: Learning to Edit 3D Point Clouds with Text Instructions
Jiale Xu, Xintao Wang, Yan-Pei Cao, Weihao Cheng, Ying Shan, Shenghua Gao
arXiv 2023. [Paper]
2023 年 6 月 12 日

Language-Guided Traffic Simulation via Scene-Level Diffusion
Ziyuan Zhong, Davis Rempe, Yuxiao Chen, Boris Ivanovic, Yulong Cao, Danfei Xu, Marco Pavone, Baishakhi Ray
arXiv 2023. [Paper]
2023 年 6 月 10 日

BOOT: Data-free Distillation of Denoising Diffusion Models with Bootstrapping
Jiatao Gu, Shuangfei Zhai, Yizhe Zhang, Lingjie Liu, Josh Susskind
arXiv 2023. [Paper]
2023 年 6 月 8 日

Grounded Text-to-Image Synthesis with Attention Refocusing
Quynh Phung, Songwei Ge, Jia-Bin Huang
arXiv 2023. [Paper]
2023 年 6 月 8 日

SyncDiffusion: Coherent Montage via Synchronized Joint Diffusions
Yuseung Lee, Kunho Kim, Hyunjin Kim, Minhyuk Sung
arXiv 2023. [Paper] [Project] [Github]
2023 年 6 月 8 日

Improving Tuning-Free Real Image Editing with Proximal Guidance
Ligong Han, Song Wen, Qi Chen, Zhixing Zhang, Kunpeng Song, Mengwei Ren, Ruijiang Gao, Yuxiao Chen, Di Liu, Qilong Zhangli, Anastasis Stathopoulos, Jindong Jiang, Zhaoyang Xia, Akash Srivastava, Dimitris Metaxas
arXiv 2023. [Paper]
2023 年 6 月 8 日

WOUAF: Weight Modulation for User Attribution and Fingerprinting in Text-to-Image Diffusion Models
Changhoon Kim, Kyle Min, Maitreya Patel, Sheng Cheng, Yezhou Yang
arXiv 2023. [Paper]
7 Jun 2023

ConceptBed: Evaluating Concept Learning Abilities of Text-to-Image Diffusion Models
Maitreya Patel, Tejas Gokhale, Chitta Baral, Yezhou Yang
arXiv 2023. [Paper]
7 Jun 2023

Designing a Better Asymmetric VQGAN for StableDiffusion
Zixin Zhu, Xuelu Feng, Dongdong Chen, Jianmin Bao, Le Wang, Yinpeng Chen, Lu Yuan, Gang Hua
arXiv 2023. [Paper] [Github]
7 Jun 2023

Multi-modal Latent Diffusion
Mustapha Bounoua, Giulio Franzese, Pietro Michiardi
arXiv 2023. [Paper]
7 Jun 2023

Integrating Geometric Control into Text-to-Image Diffusion Models for High-Quality Detection Data Generation via Text Prompt
Kai Chen, Enze Xie, Zhe Chen, Lanqing Hong, Zhenguo Li, Dit-Yan Yeung
arXiv 2023. [Paper]
7 Jun 2023

Improving Diffusion-based Image Translation using Asymmetric Gradient Guidance
Gihyun Kwon, Jong Chul Ye
arXiv 2023. [Paper]
7 Jun 2023

Stable Diffusion is Unstable
Chengbin Du, Yanxi Li, Zhongwei Qiu, Chang Xu
arXiv 2023. [Paper]
2023 年 6 月 5 日

LipVoicer: Generating Speech from Silent Videos Guided by Lip Reading
Yochai Yemini, Aviv Shamsian, Lior Bracha, Sharon Gannot, Ethan Fetaya
arXiv 2023. [Paper] [Project]
2023 年 6 月 5 日

HeadSculpt: Crafting 3D Head Avatars with Text
Xiao Han, Yukang Cao, Kai Han, Xiatian Zhu, Jiankang Deng, Yi-Zhe Song, Tao Xiang, Kwan-Yee K. Wong
arXiv 2023. [Paper] [Project]
2023 年 6 月 5 日

Instruct-Video2Avatar: Video-to-Avatar Generation with Instructions
Shaoxu Li
arXiv 2023. [Paper]
2023 年 6 月 5 日

Towards Unified Text-based Person Retrieval: A Large-scale Multi-Attribute and Language Search Benchmark
Shuyu Yang, Yinan Zhou, Yaxiong Wang, Yujiao Wu, Li Zhu, Zhedong Zheng
arXiv 2023. [Paper]
2023 年 6 月 5 日

User-friendly Image Editing with Minimal Text Input: Leveraging Captioning and Injection Techniques
Sunwoo Kim, Wooseok Jang, Hyunsu Kim, Junho Kim, Yunjey Choi, Seungryong Kim, Gayeong Lee
arXiv 2023. [Paper]
2023 年 6 月 5 日

Detector Guidance for Multi-Object Text-to-Image Generation
Luping Liu, Zijian Zhang, Yi Ren, Rongjie Huang, Xiang Yin, Zhou Zhao
arXiv 2023. [Paper]
2023 年 6 月 4 日

VideoComposer: Compositional Video Synthesis with Motion Controllability
Xiang Wang, Hangjie Yuan, Shiwei Zhang, Dayou Chen, Jiuniu Wang, Yingya Zhang, Yujun Shen, Deli Zhao, Jingren Zhou
NeruIPS 2023. [Paper] [Project] [Github]
3 Jun 2023

Word-Level Explanations for Analyzing Bias in Text-to-Image Models
Alexander Lin, Lucas Monteiro Paes, Sree Harsha Tanneru, Suraj Srinivas, Himabindu Lakkaraju
arXiv 2023. [Paper]
3 Jun 2023

Efficient Text-Guided 3D-Aware Portrait Generation with Score Distillation Sampling on Distribution
Yiji Cheng, Fei Yin, Xiaoke Huang, Xintong Yu, Jiaxiang Liu, Shikun Feng, Yujiu Yang, Yansong Tang
arXiv 2023. [Paper]
3 Jun 2023

Probabilistic Adaptation of Text-to-Video Models
Mengjiao Yang, Yilun Du, Bo Dai, Dale Schuurmans, Joshua B. Tenenbaum, Pieter Abbeel
arXiv 2023. [Paper] [Project]
2023 年 6 月 2 日

Video Colorization with Pre-trained Text-to-Image Diffusion Models
Hanyuan Liu, Minshan Xie, Jinbo Xing, Chengze Li, Tien-Tsin Wong
arXiv 2023. [Paper]
2023 年 6 月 2 日

Audio-Visual Speech Enhancement with Score-Based Generative Models
Julius Richter, Simone Frintrop, Timo Gerkmann
arXiv 2023. [Paper]
2023 年 6 月 2 日

Privacy Distillation: Reducing Re-identification Risk of Multimodal Diffusion Models
Virginia Fernandez, Pedro Sanchez, Walter Hugo Lopez Pinaya, Grzegorz Jacenków, Sotirios A. Tsaftaris, Jorge Cardoso
arXiv 2023. [Paper]
2023 年 6 月 2 日

StableRep: Synthetic Images from Text-to-Image Models Make Strong Visual Representation Learners
Yonglong Tian, Lijie Fan, Phillip Isola, Huiwen Chang, Dilip Krishnan
arXiv 2023. [Paper]
2023 年 6 月 1 日

Diffusion Self-Guidance for Controllable Image Generation
Dave Epstein, Allan Jabri, Ben Poole, Alexei A. Efros, Aleksander Holynski
arXiv 2023. [Paper] [Project]
2023 年 6 月 1 日

StyleDrop: Text-to-Image Generation in Any Style
Kihyuk Sohn, Nataniel Ruiz, Kimin Lee, Daniel Castro Chin, Irina Blok, Huiwen Chang, Jarred Barber, Lu Jiang, Glenn Entis, Yuanzhen Li, Yuan Hao, Irfan Essa, Michael Rubinstein, Dilip Krishnan
arXiv 2023. [Paper] [Project]
2023 年 6 月 1 日

Intriguing Properties of Text-guided Diffusion Models
Qihao Liu, Adam Kortylewski, Yutong Bai, Song Bai, Alan Yuille
arXiv 2023. [Paper]
2023 年 6 月 1 日

Intelligent Grimm -- Open-ended Visual Storytelling via Latent Diffusion Models
Chang Liu, Haoning Wu, Yujie Zhong, Xiaoyun Zhang, Weidi Xie
arXiv 2023. [Paper] [Project]
2023 年 6 月 1 日

ViCo: Detail-Preserving Visual Condition for Personalized Text-to-Image Generation
Shaozhe Hao, Kai Han, Shihao Zhao, Kwan-Yee K. Wong
arXiv 2023. [Paper] [Github]
2023 年 6 月 1 日

The Hidden Language of Diffusion Models
Hila Chefer, Oran Lang, Mor Geva, Volodymyr Polosukhin, Assaf Shocher, Michal Irani, Inbar Mosseri, Lior Wolf
arXiv 2023. [Paper] [Project]
2023 年 6 月 1 日

Cocktail: Mixing Multi-Modality Controls for Text-Conditional Image Generation
Minghui Hu, Jianbin Zheng, Daqing Liu, Chuanxia Zheng, Chaoyue Wang, Dacheng Tao, Tat-Jen Cham
arXiv 2023. [Paper] [Project] [Github]
2023 年 6 月 1 日

Make-Your-Video: Customized Video Generation Using Textual and Structural Guidance
Jinbo Xing, Menghan Xia, Yuxin Liu, Yuechen Zhang, Yong Zhang, Yingqing He, Hanyuan Liu, Haoxin Chen, Xiaodong Cun, Xintao Wang, Ying Shan, Tien-Tsin Wong
arXiv 2023. [Paper] [Project]
2023 年 6 月 1 日

Inserting Anybody in Diffusion Models via Celeb Basis
Ge Yuan, Xiaodong Cun, Yong Zhang, Maomao Li, Chenyang Qi, Xintao Wang, Ying Shan, Huicheng Zheng
arXiv 2023. [Paper] [Project]
2023 年 6 月 1 日

Wuerstchen: Efficient Pretraining of Text-to-Image Models
Pablo Pernias, Dominic Rampas, Marc Aubreville
arXiv 2023. [Paper]
2023 年 6 月 1 日

UniDiff: Advancing Vision-Language Models with Generative and Discriminative Learning
Xiao Dong, Runhui Huang, Xiaoyong Wei, Zequn Jie, Jianxing Yu, Jian Yin, Xiaodan Liang
arXiv 2023. [Paper]
2023 年 6 月 1 日

FigGen: Text to Scientific Figure Generation
Juan A. Rodriguez, David Vazquez, Issam Laradji, Marco Pedersoli, Pau Rodriguez
ICLR 2023. [Paper]
2023 年 6 月 1 日

Diffusion Brush: A Latent Diffusion Model-based Editing Tool for AI-generated Images
Peyman Gholami, Robert Xiao
arXiv 2023. [Paper]
2023 年 5 月 31 日

Understanding and Mitigating Copying in Diffusion Models
Gowthami Somepalli, Vasu Singla, Micah Goldblum, Jonas Geiping, Tom Goldstein
CVPR 2023. [Paper] [Github]
2023 年 5 月 31 日

Control4D: Dynamic Portrait Editing by Learning 4D GAN from 2D Diffusion-based Editor
Ruizhi Shao, Jingxiang Sun, Cheng Peng, Zerong Zheng, Boyao Zhou, Hongwen Zhang, Yebin Liu
arXiv 2023. [Paper] [Project]
2023 年 5 月 31 日

Boosting Text-to-Image Diffusion Models with Fine-Grained Semantic Rewards
Guian Fang, Zutao Jiang, Jianhua Han, Guansong Lu, Hang Xu, Xiaodan Liang
arXiv 2023. [Paper] [Github]
2023 年 5 月 31 日

Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty Quantification
Yifei Liu, Rex Shen, Xiaotong Shen
arXiv 2023. [Paper]
2023 年 5 月 30 日

PanoGen: Text-Conditioned Panoramic Environment Generation for Vision-and-Language Navigation
Jialu Li, Mohit Bansal
arXiv 2023. [Paper] [Project] [Github]
2023 年 5 月 30 日

Video ControlNet: Towards Temporally Consistent Synthetic-to-Real Video Translation Using Conditional Image Diffusion Models
Ernie Chu, Shuo-Yen Lin, Jun-Cheng Chen
arXiv 2023. [Paper]
2023 年 5 月 30 日

Nested Diffusion Processes for Anytime Image Generation
Noam Elata, Bahjat Kawar, Tomer Michaeli, Michael Elad
arXiv 2023. [Paper]
2023 年 5 月 30 日

StyleAvatar3D: Leveraging Image-Text Diffusion Models for High-Fidelity 3D Avatar Generation
Chi Zhang, Yiwen Chen, Yijun Fu, Zhenglin Zhou, Gang YU, Billzb Wang, Bin Fu, Tao Chen, Guosheng Lin, Chunhua Shen
arXiv 2023. [Paper]
2023 年 5 月 30 日

HiFA: High-fidelity Text-to-3D with Advanced Diffusion Guidance
Junzhe Zhu, Peiye Zhuang
arXiv 2023. [Paper]
2023 年 5 月 30 日

LayerDiffusion: Layered Controlled Image Editing with Diffusion Models
Pengzhi Li, QInxuan Huang, Yikang Ding, Zhiheng Li
arXiv 2023. [Paper]
2023 年 5 月 30 日

Controllable Text-to-Image Generation with GPT-4
Tianjun Zhang, Yi Zhang, Vibhav Vineet, Neel Joshi, Xin Wang
arXiv 2023. [Paper]
2023 年 5 月 29 日

Cognitively Inspired Cross-Modal Data Generation Using Diffusion Models
Zizhao Hu, Mohammad Rostami
NeurIPS 2023. [Paper]
2023 年 5 月 28 日

RAPHAEL: Text-to-Image Generation via Large Mixture of Diffusion Paths
Zeyue Xue, Guanglu Song, Qiushan Guo, Boxiao Liu, Zhuofan Zong, Yu Liu, Ping Luo
arXiv 2023. [Paper]
2023 年 5 月 29 日

Mix-of-Show: Decentralized Low-Rank Adaptation for Multi-Concept Customization of Diffusion Models
Yuchao Gu, Xintao Wang, Jay Zhangjie Wu, Yujun Shi, Yunpeng Chen, Zihan Fan, Wuyou Xiao, Rui Zhao, Shuning Chang, Weijia Wu, Yixiao Ge, Ying Shan, Mike Zheng Shou
arXiv 2023. [Paper] [Project]
2023 年 5 月 29 日

Gen-L-Video: Multi-Text to Long Video Generation via Temporal Co-Denoising
Fu-Yun Wang, Wenshuo Chen, Guanglu Song, Han-Jia Ye, Yu Liu, Hongsheng Li
arXiv 2023. [Paper] [Github]
2023 年 5 月 29 日

Text-Only Image Captioning with Multi-Context Data Generation
Feipeng Ma, Yizhou Zhou, Fengyun Rao, Yueyi Zhang, Xiaoyan Sun
arXiv 2023. [Paper]
2023 年 5 月 29 日

InstructEdit: Improving Automatic Masks for Diffusion-based Image Editing With User Instructions
Qian Wang, Biao Zhang, Michael Birsak, Peter Wonka
arXiv 2023. [Paper]
2023 年 5 月 29 日

Conditional Score Guidance for Text-Driven Image-to-Image Translation
Hyunsoo Lee, Minsoo Kang, Bohyung Han
arXiv 2023. [Paper]
2023 年 5 月 29 日

Text-to-image Editing by Image Information Removal
Zhongping Zhang, Jian Zheng, Jacob Zhiyuan Fang, Bryan A. Plummer
arXiv 2023. [Paper]
2023 年 5 月 27 日

Towards Consistent Video Editing with Text-to-Image Diffusion Models
Zicheng Zhang, Bonan Li, Xuecheng Nie, Congying Han, Tiande Guo, Luoqi Liu
arXiv 2023. [Paper]
2023 年 5 月 27 日

FISEdit: Accelerating Text-to-image Editing via Cache-enabled Sparse Diffusion Inference
Zihao Yu, Haoyang Li, Fangcheng Fu, Xupeng Miao, Bin Cui
arXiv 2023. [Paper]
2023 年 5 月 27 日

ControlVideo: Adding Conditional Control for One Shot Text-to-Video Editing
Min Zhao, Rongzhen Wang, Fan Bao, Chongxuan Li, Jun Zhu
arXiv 2023. [Paper] [Project]
2023 年 5 月 26 日

Improved Visual Story Generation with Adaptive Context Modeling
Zhangyin Feng, Yuchen Ren, Xinmiao Yu, Xiaocheng Feng, Duyu Tang, Shuming Shi, Bing Qin
arXiv 2023. [Paper]
2023 年 5 月 26 日

Negative-prompt Inversion: Fast Image Inversion for Editing with Text-guided Diffusion Models
Daiki Miyake, Akihiro Iohara, Yu Saito, Toshiyuki Tanaka
arXiv 2023. [Paper]
2023 年 5 月 26 日

Are Diffusion Models Vision-And-Language Reasoners?
Benno Krojer, Elinor Poole-Dayan, Vikram Voleti, Christopher Pal, Siva Reddy
arXiv 2023. [Paper] [Github]
2023 年 5 月 25 日

DPOK：用于微调文本到图像扩散模型的强化学习
Ying Fan, Olivia Watkins, Yuqing Du, Hao Liu, Moonkyung Ryu, Craig Boutilier, Pieter Abbeel, Mohammad Ghavamzadeh, Kangwook Lee, Kimin Lee
arXiv 2023. [Paper]
2023 年 5 月 25 日

Uni-ControlNet：文本到图像扩散模型的一体化控制
Shihao Zhao, Dongdong Chen, Yen-Chun Chen, Jianmin Bao, Shaozhe Hao, Lu Yuan, Kwan-Yee K. Wong
arXiv 2023. [Paper] [Project] [Github]
2023 年 5 月 25 日

Parallel Sampling of Diffusion Models
Andy Shih, Suneel Belkhale, Stefano Ermon, Dorsa Sadigh, Nima Anari
arXiv 2023. [Paper] [Github]
2023 年 5 月 25 日

Break-A-Scene: Extracting Multiple Concepts from a Single Image
Omri Avrahami, Kfir Aberman, Ohad Fried, Daniel Cohen-Or, Dani Lischinski
SIGGRAPH Asia 2023. [Paper] [Project] [Github]
2023 年 5 月 25 日

Prompt-Free Diffusion: Taking "Text" out of Text-to-Image Diffusion Models
Xingqian Xu, Jiayi Guo, Zhangyang Wang, Gao Huang, Irfan Essa, Humphrey Shi
arXiv 2023. [Paper] [Github]
2023 年 5 月 25 日

ProSpect: Expanded Conditioning for the Personalization of Attribute-aware Image Generation
Yuxin Zhang, Weiming Dong, Fan Tang, Nisha Huang, Haibin Huang, Chongyang Ma, Tong-Yee Lee, Oliver Deussen, Changsheng Xu
arXiv 2023. [Paper]
2023 年 5 月 25 日

ProlificDreamer: High-Fidelity and Diverse Text-to-3D Generation with Variational Score Distillation
Zhengyi Wang, Cheng Lu, Yikai Wang, Fan Bao, Chongxuan Li, Hang Su, Jun Zhu
arXiv 2023. [Paper] [Project]
2023 年 5 月 25 日

On Architectural Compression of Text-to-Image Diffusion Models
Bo-Kyeong Kim, Hyoung-Kyu Song, Thibault Castells, Shinkook Choi
arXiv 2023. [Paper]
2023 年 5 月 25 日

Custom-Edit: Text-Guided Image Editing with Customized Diffusion Models
Jooyoung Choi, Yunjey Choi, Yunji Kim, Junho Kim, Sungroh Yoon
arXiv 2023. [Paper]
2023 年 5 月 25 日

MultiFusion: Fusing Pre-Trained Models for Multi-Lingual, Multi-Modal Image Generation
Marco Bellagente, Manuel Brack, Hannah Teufel, Felix Friedrich, Björn Deiseroth, Constantin Eichenberg, Andrew Dai, Robert Baldock, Souradeep Nanda, Koen Oostermeijer, Andres Felipe Cruz-Salinas, Patrick Schramowski, Kristian Kersting, Samuel Weinbach
arXiv 2023. [Paper]
2023 年 5 月 24 日

ChatFace: Chat-Guided Real Face Editing via Diffusion Latent Space Manipulation
Dongxu Yue, Qin Guo, Munan Ning, Jiaxi Cui, Yuesheng Zhu, Li Yuan
arXiv 2023. [Paper]
2023 年 5 月 24 日

DiffBlender: Scalable and Composable Multimodal Text-to-Image Diffusion Models
Sungnyun Kim, Junsoo Lee, Kibeom Hong, Daesik Kim, Namhyuk Ahn
arXiv 2023. [Paper] [Github]
2023 年 5 月 24 日

I Spy a Metaphor: Large Language Models and Diffusion Models Co-Create Visual Metaphors
Tuhin Chakrabarty, Arkadiy Saakyan, Olivia Winn, Artemis Panagopoulou, Yue Yang, Marianna Apidianaki, Smaranda Muresan
arXiv 2023. [Paper]
2023 年 5 月 24 日

BLIP-Diffusion: Pre-trained Subject Representation for Controllable Text-to-Image Generation and Editing
Dongxu Li, Junnan Li, Steven CH Hoi
arXiv 2023. [Paper]
2023 年 5 月 24 日

Adversarial Nibbler: A Data-Centric Challenge for Improving the Safety of Text-to-Image Models
Alicia Parrish, Hannah Rose Kirk, Jessica Quaye, Charvi Rastogi, Max Bartolo, Oana Inel, Juan Ciro, Rafael Mosquera, Addison Howard, Will Cukierski, D. Sculley, Vijay Janapa Reddi, Lora Aroyo
arXiv 2023. [Paper]
2023 年 5 月 22 日

Compositional Text-to-Image Synthesis with Attention Map Control of Diffusion Models
Ruichen Wang, Zekang Chen, Chen Chen, Jian Ma, Haonan Lu, Xiaodong Lin
arXiv 2023. [Paper]
2023 年 5 月 23 日

不安全扩散：关于从文本到图像模型生成不安全图像和仇恨模因
Yiting Qu, Xinyue Shen, Xinlei He, Michael Backes, Savvas Zannettou, Yang Zhang
arXiv 2023. [Paper]
2023 年 5 月 23 日

Control-A-Video: Controllable Text-to-Video Generation with Diffusion Models
Weifeng Chen, Jie Wu, Pan Xie, Hefeng Wu, Jiashi Li, Xin Xia, Xuefeng Xiao, Liang Lin
arXiv 2023. [Paper]
2023 年 5 月 23 日

Understanding Text-driven Motion Synthesis with Keyframe Collaboration via Diffusion Models
Dong Wei, Xiaoning Sun, Huaijiang Sun, Bin Li, Shengxiang Hu, Weiqing Li, Jianfeng Lu
arXiv 2023. [Paper]
2023 年 5 月 23 日

LLM-grounded Diffusion: Enhancing Prompt Understanding of Text-to-Image Diffusion Models with Large Language Models
Long Lian, Boyi Li, Adam Yala, Trevor Darrell
arXiv 2023. [Paper]
2023 年 5 月 23 日

LaDI-VTON: Latent Diffusion Textual-Inversion Enhanced Virtual Try-On
Davide Morelli, Alberto Baldrati, Giuseppe Cartella, Marcella Cornia, Marco Bertini, Rita Cucchiara
arXiv 2023. [Paper]
2023 年 5 月 22 日

FACTIFY3M: A Benchmark for Multimodal Fact Verification with Explainability through 5W Question-Answering
Megha Chakraborty, Khusbu Pahwa, Anku Rani, Adarsh Mahor, Aditya Pakala, Arghya Sarkar, Harshit Dave, Ishan Paul, Janvita Reddy, Preethi Gurumurthy, Ritvik G, Samahriti Mukherjee, Shreyas Chatterjee, Kinjal Sensharma, Dwip Dalal, Suryavardan S, Shreyash Mishra, Parth Patwa, Aman Chadha, Amit Sheth, Amitava Das
arXiv 2023. [Paper]
2023 年 5 月 22 日

Training Diffusion Models with Reinforcement Learning
Kevin Black, Michael Janner, Yilun Du, Ilya Kostrikov, Sergey Levine
arXiv 2023. [Paper]
2023 年 5 月 22 日

If at First You Don't Succeed, Try, Try Again: Faithful Diffusion-based Text-to-Image Generation by Selection
Shyamgopal Karthik, Karsten Roth, Massimiliano Mancini, Zeynep Akata
arXiv 2023. [Paper] [Project]
2023 年 5 月 22 日

ControlVideo: Training-free Controllable Text-to-Video Generation
Yabo Zhang, Yuxiang Wei, Dongsheng Jiang, Xiaopeng Zhang, Wangmeng Zuo, Qi Tian
arXiv 2023. [Paper] [Github]
2023 年 5 月 22 日

AudioToken: Adaptation of Text-Conditioned Diffusion Models for Audio-to-Image Generation
Guy Yariv, Itai Gat, Lior Wolf, Yossi Adi, Idan Schwartz
arXiv 2023. [Paper]
2023 年 5 月 22 日

The CLIP Model is Secretly an Image-to-Prompt Converter
Yuxuan Ding, Chunna Tian, Haoxuan Ding, Lingqiao Liu
arXiv 2023. [Paper]
2023 年 5 月 22 日

InstructVid2Vid: Controllable Video Editing with Natural Language Instructions
Bosheng Qin, Juncheng Li, Siliang Tang, Tat-Seng Chua, Yueting Zhuang
arXiv 2023. [Paper]
2023 年 5 月 21 日

SneakyPrompt: Evaluating Robustness of Text-to-image Generative Models' Safety Filters
Yuchen Yang, Bo Hui, Haolin Yuan, Neil Gong, Yinzhi Cao
arXiv 2023. [Paper]
2023 年 5 月 20 日

Late-Constraint Diffusion Guidance for Controllable Image Synthesis
Chang Liu, Dong Liu
arXiv 2023. [Paper] [Project] [Github]
2023 年 5 月 19 日

Any-to-Any Generation via Composable Diffusion
Zineng Tang, Ziyi Yang, Chenguang Zhu, Michael Zeng, Mohit Bansal
arXiv 2023. [Paper] [Project] [Github]
2023 年 5 月 19 日

Text2NeRF: Text-Driven 3D Scene Generation with Neural Radiance Fields
Jingbo Zhang, Xiaoyu Li, Ziyu Wan, Can Wang, Jing Liao
arXiv 2023. [Paper]
2023 年 5 月 19 日

Brain Captioning: Decoding human brain activity into images and text
Matteo Ferrante, Furkan Ozcelik, Tommaso Boccato, Rufin VanRullen, Nicola Toschi
arXiv 2023. [Paper]
2023 年 5 月 19 日

Efficient Cross-Lingual Transfer for Chinese Stable Diffusion with Images as Pivots
Jinyi Hu, Xu Han, Xiaoyuan Yi, Yutong Chen, Wenhao Li, Zhiyuan Liu, Maosong Sun
arXiv 2023. [Paper]
2023 年 5 月 19 日

Discriminative Diffusion Models as Few-shot Vision and Language Learners
Xuehai He, Weixi Feng, Tsu-Jui Fu, Varun Jampani, Arjun Akula, Pradyumna Narayana, Sugato Basu, William Yang Wang, Xin Eric Wang
arXiv 2023. [Paper]
2023 年 5 月 18 日

Zero-Day Backdoor Attack against Text-to-Image Diffusion Models via Personalization
Yihao Huang, Qing Guo, Felix Juefei-Xu
arXiv 2023. [Paper]
2023 年 5 月 18 日

AIwriting: Relations Between Image Generation and Digital Writing
Scott Rettberg, Talan Memmott, Jill Walker Rettberg, Jason Nelson, Patrick Lichty
ISEA 2023. [Paper]
2023 年 5 月 18 日

TextDiffuser：作为文本画家的扩散模型
Jingye Chen, Yupan Huang, Tengchao Lv, Lei Cui, Qifeng Chen, Furu Wei
arXiv 2023. [Paper]
2023 年 5 月 18 日

VideoFactory: Swap Attention in Spatiotemporal Diffusions for Text-to-Video Generation
Wenjing Wang, Huan Yang, Zixi Tuo, Huiguo He, Junchen Zhu, Jianlong Fu, Jiaying Liu
arXiv 2023. [Paper]
2023 年 5 月 18 日

LDM3D: Latent Diffusion Model for 3D
Gabriela Ben Melech Stan, Diana Wofk, Scottie Fox, Alex Redden, Will Saxton, Jean Yu, Estelle Aflalo, Shao-Yen Tseng, Fabio Nonato, Matthias Muller, Vasudev Lal
arXiv 2023. [Paper]
2023 年 5 月 18 日

X-IQE: eXplainable Image Quality Evaluation for Text-to-Image Generation with Visual Large Language Models
Yixiong Chen
arXiv 2023. [Paper] [Github]
2023 年 5 月 18 日

Inspecting the Geographical Representativeness of Images from Text-to-Image Models
Abhipsa Basu, R. Venkatesh Babu, Danish Pruthi
arXiv 2023. [Paper]
2023 年 5 月 18 日

Preserve Your Own Correlation: A Noise Prior for Video Diffusion Models
Songwei Ge, Seungjun Nah, Guilin Liu, Tyler Poon, Andrew Tao, Bryan Catanzaro, David Jacobs, Jia-Bin Huang, Ming-Yu Liu, Yogesh Balaji
arXiv 2023. [Paper] [Project]
2023 年 5 月 17 日

AMD: Autoregressive Motion Diffusion
Bo Han, Hao Peng, Minjing Dong, Chang Xu, Yi Ren, Yixuan Shen, Yuheng Li
arXiv 2023. [Paper]
2023 年 5 月 16 日

Generating coherent comic with rich story using ChatGPT and Stable Diffusion
Ze Jin, Zorina Song
arXiv 2023. [Paper]
2023 年 5 月 16 日

Make-An-Animation: Large-Scale Text-conditional 3D Human Motion Generation
Samaneh Azadi, Akbar Shah, Thomas Hayes, Devi Parikh, Sonal Gupta
arXiv 2023. [Paper] [Project]
2023 年 5 月 16 日

Make-A-Protagonist: Generic Video Editing with An Ensemble of Experts
Yuyang Zhao, Enze Xie, Lanqing Hong, Zhenguo Li, Gim Hee Lee
arXiv 2023. [Paper] [Project] [Github]
2023 年 5 月 15 日

Common Diffusion Noise Schedules and Sample Steps are Flawed
Shanchuan Lin, Bingchen Liu, Jiashi Li, Xiao Yang
arXiv 2023. [Paper]
2023 年 5 月 15 日

Interactive Fashion Content Generation Using LLMs and Latent Diffusion Models
Krishna Sri Ipsit Mantri, Nevasini Sasikumar
arXiv 2023. [Paper]
2023 年 5 月 15 日

iEdit: Localised Text-guided Image Editing with Weak Supervision
Rumeysa Bodur, Erhan Gundogdu, Binod Bhattarai, Tae-Kyun Kim, Michael Donoser, Loris Bazzani
arXiv 2023. [Paper]
2023 年 5 月 10 日

SUR-adapter: Enhancing Text-to-Image Pre-trained Diffusion Models with Large Language Models
Shanshan Zhong, Zhongzhan Huang, Wushao Wen, Jinghui Qin, Liang Lin
arXiv 2023. [Paper] [Github]
2023 年 5 月 9 日

Style-A-Video: Agile Diffusion for Arbitrary Text-based Video Style Transfer
Nisha Huang, Yuxin Zhang, Weiming Dong
arXiv 2023. [Paper]
2023 年 5 月 9 日

DiffuseStyleGesture: Stylized Audio-Driven Co-Speech Gesture Generation with Diffusion Models
Sicheng Yang, Zhiyong Wu, Minglei Li, Zhensong Zhang, Lei Hao, Weihong Bao, Ming Cheng, Long Xiao
IJCAI 2023. [Paper] [Github]
2023 年 5 月 8 日

IIITD-20K: Dense captioning for Text-Image ReID
AV Subramanyam, Niranjan Sundararajan, Vibhu Dubey, Brejesh Lall
arXiv 2023. [Paper]
2023 年 5 月 8 日

使用扩散模型进行文本驱动图像编辑的快速调整反转
董文凯、薛松、段晓月、韩淑敏
arXiv 2023. [Paper]
2023 年 5 月 8 日

Text-to-Image Diffusion Models can be Easily Backdoored through Multimodal Data Poisoning
Shengfang Zhai, Yinpeng Dong, Qingni Shen, Shi Pu, Yuejian Fang, Hang Su
arXiv 2023. [Paper]
2023 年 5 月 7 日

AADiff: Audio-Aligned Video Synthesis with Text-to-Image Diffusion
Seungwoo Lee, Chaerin Kong, Donghyeon Jeon, Nojun Kwak
arXiv 2023. [Paper]
2023 年 5 月 6 日

Data Curation for Image Captioning with Text-to-Image Generative Models
Wenyan Li, Jonas F. Lotz, Chen Qiu, Desmond Elliott
arXiv 2023. [Paper]
2023 年 5 月 5 日

DisenBooth: Identity-Preserving Disentangled Tuning for Subject-Driven Text-to-Image Generation
Hong Chen, Yipeng Zhang, Xin Wang, Xuguang Duan, Yuwei Zhou, Wenwu Zhu
arXiv 2023. [Paper] [Project]
2023 年 5 月 5 日

通过扩散模型中的初始图像编辑引导图像合成
Jiafeng Mao, Xueting Wang, Kiyoharu Aizawa
arXiv 2023. [Paper]
2023 年 5 月 5 日

Diffusion Explainer: Visual Explanation for Text-to-image Stable Diffusion
Seongmin Lee, Benjamin Hoover, Hendrik Strobelt, Zijie J. Wang, ShengYun Peng, Austin Wright, Kevin Li, Haekyu Park, Haoyang Yang, Duen Horng Chau
arXiv 2023. [Paper] [Project]
2023 年 5 月 4 日

Multimodal-driven Talking Face Generation, Face Swapping, Diffusion Model
Chao Xu, Shaoting Zhu, Junwei Zhu, Tianxin Huang, Jiangning Zhang, Ying Tai, Yong Liu
arXiv 2023. [Paper]
2023 年 5 月 4 日

Multimodal Data Augmentation for Image Captioning using Diffusion Models
Changrong Xiao, Sean Xin Xu, Kunpeng Zhang
arXiv 2023. [Paper]
2023 年 5 月 3 日

In-Context Learning Unlocked for Diffusion Models
Zhendong Wang, Yifan Jiang, Yadong Lu, Yelong Shen, Pengcheng He, Weizhu Chen, Zhangyang Wang, Mingyuan Zhou
arXiv 2023. [Paper] [Project] [Github]
2023 年 5 月 1 日

SceneGenie: Scene Graph Guided Diffusion Models for Image Synthesis
Azade Farshad, Yousef Yeganeh, Yu Chi, Chengzhi Shen, Björn Ommer, Nassir Navab
arXiv 2023. [Paper]
2023 年 4 月 28 日

It is all about where you start: Text-to-image generation with seed selection
Dvir Samuel, Rami Ben-Ari, Simon Raviv, Nir Darshan, Gal Chechik
arXiv 2023. [Paper]
2023 年 4 月 27 日

Edit Everything: A Text-Guided Generative System for Images Editing
Defeng Xie, Ruichen Wang, Jian Ma, Chen Chen, Haonan Lu, Dong Yang, Fobo Shi, Xiaodong Lin
arXiv 2023. [Paper] [Github]
2023 年 4 月 27 日

免培训位置感知文本到图像合成
Jiafeng Mao, Xueting Wang
arXiv 2023. [Paper]
2023 年 4 月 26 日

TextMesh: Generation of Realistic 3D Meshes From Text Prompts
Christina Tsalicoglou, Fabian Manhardt, Alessio Tonioni, Michael Niemeyer, Federico Tombari
arXiv 2023. [Paper]
2023 年 4 月 24 日

Using Text-to-Image Generation for Architectural Design Ideation
Ville Paananen, Jonas Oppenlaender, Aku Visuri
arXiv 2023. [Paper]
2023 年 4 月 20 日

Anything-3D: Towards Single-view Anything Reconstruction in the Wild
Qiuhong Shen, Xingyi Yang, Xinchao Wang
arXiv 2023. [Paper] [Github]
2023 年 4 月 19 日

UPGPT: Universal Diffusion Model for Person Image Generation, Editing and Pose Transfer
Soon Yau Cheong, Armin Mustafa, Andrew Gilbert
ICCV Workshop 2023. [Paper] [Github]
18 Apr 2023

TTIDA: Controllable Generative Data Augmentation via Text-to-Text and Text-to-Image Models
Yuwei Yin, Jean Kaddour, Xiang Zhang, Yixin Nie, Zhenguang Liu, Lingpeng Kong, Qi Liu
arXiv 2023. [Paper]
18 Apr 2023

对齐你的潜在：高分辨率视频合成与潜在扩散模型
Andreas Blattmann, Robin Rombach, Huan Ling, Tim Dockhorn, Seung Wook Kim, Sanja Fidler, Karsten Kreis
CVPR 2023. [Paper] [Project]
18 Apr 2023

Text2Performer: Text-Driven Human Video Generation
Yuming Jiang, Shuai Yang, Tong Liang Koh, Wayne Wu, Chen Change Loy, Ziwei Liu
arXiv 2023. [Paper] [Project]
2023 年 4 月 17 日

Latent-Shift: Latent Diffusion with Temporal Shift for Efficient Text-to-Video Generation
Jie An, Songyang Zhang, Harry Yang, Sonal Gupta, Jia-Bin Huang, Jiebo Luo, Xi Yin
arXiv 2023. [Paper] [Project]
2023 年 4 月 17 日

MasaCtrl: Tuning-Free Mutual Self-Attention Control for Consistent Image Synthesis and Editing
Mingdeng Cao, Xintao Wang, Zhongang Qi, Ying Shan, Xiaohu Qie, Yinqiang Zheng
arXiv 2023. [Paper] [Github]
2023 年 4 月 17 日

Text-Conditional Contextualized Avatars For Zero-Shot Personalization
Samaneh Azadi, Thomas Hayes, Akbar Shah, Guan Pang, Devi Parikh, Sonal Gupta
arXiv 2023. [Paper]
2023 年 4 月 14 日

Delta 去噪分数
Amir Hertz, Kfir Aberman, Daniel Cohen-Or
arXiv 2023. [Paper] [Project]
2023 年 4 月 14 日

Expressive Text-to-Image Generation with Rich Text
Songwei Ge, Taesung Park, Jun-Yan Zhu, Jia-Bin Huang
arXiv 2023. [Paper] [Project] [Github]
2023 年 4 月 13 日

Soundini: Sound-Guided Diffusion for Natural Video Editing
Seung Hyun Lee, Sieun Kim, Innfarn Yoo, Feng Yang, Donghyeon Cho, Youngseo Kim, Huiwen Chang, Jinkyu Kim, Sangpil Kim
arXiv 2023. [Paper] [Project]
2023 年 4 月 13 日

Improving Diffusion Models for Scene Text Editing with Dual Encoders
Jiabao Ji, Guanhua Zhang, Zhaowen Wang, Bairu Hou, Zhifei Zhang, Brian Price, Shiyu Chang
arXiv 2023. [Paper] [Github]
2023 年 4 月 12 日

An Edit Friendly DDPM Noise Space: Inversion and Manipulations
Inbar Huberman-Spiegelglas, Vladimir Kulikov, Tomer Michaeli
arXiv 2023. [Paper]
2023 年 4 月 12 日

Continual Diffusion: Continual Customization of Text-to-Image Diffusion with C-LoRA
James Seale Smith, Yen-Chang Hsu, Lingyu Zhang, Ting Hua, Zsolt Kira, Yilin Shen, Hongxia Jin
arXiv 2023. [Paper] [Project]
2023 年 4 月 12 日

HRS-Bench: Holistic, Reliable and Scalable Benchmark for Text-to-Image Models
Eslam Mohamed Bakr, Pengzhan Sun, Xiaoqian Shen, Faizan Farooq Khan, Li Erran Li, Mohamed Elhoseiny
arXiv 2023. [Paper] [Project]
2023 年 4 月 11 日

Re-imagine the Negative Prompt Algorithm: Transform 2D Diffusion into 3D, alleviate Janus problem and Beyond
Mohammadreza Armandpour, Huangjie Zheng, Ali Sadeghian, Amir Sadeghian, Mingyuan Zhou
arXiv 2023. [Paper]
2023 年 4 月 11 日

Towards Real-time Text-driven Image Manipulation with Unconditional Diffusion Models
Nikita Starodubcev, Dmitry Baranchuk, Valentin Khrulkov, Artem Babenko
arXiv 2023. [Paper]
2023 年 4 月 10 日

HumanSD: A Native Skeleton-Guided Diffusion Model for Human Image Generation
Xuan Ju, Ailing Zeng, Chenchen Zhao, Jianan Wang, Lei Zhang, Qiang Xu
arXiv 2023. [Paper] [Github]
2023 年 4 月 9 日

Harnessing the Spatial-Temporal Attention of Diffusion Models for High-Fidelity Text-to-Image Synthesis
Qiucheng Wu, Yujian Liu, Handong Zhao, Trung Bui, Zhe Lin, Yang Zhang, Shiyu Chang
arXiv 2023. [Paper] [Github]
2023 年 4 月 7 日

Zero-shot Generative Model Adaptation via Image-specific Prompt Learning
Jiayi Guo, Chaofei Wang, You Wu, Eric Zhang, Kai Wang, Xingqian Xu, Shiji Song, Humphrey Shi, Gao Huang
CVPR 2023. [Paper] [Github]
2023 年 4 月 6 日

Training-Free Layout Control with Cross-Attention Guidance
Minghao Chen, Iro Laina, Andrea Vedaldi
arXiv 2023. [Paper] [Project] [Github]
2023 年 4 月 6 日

Benchmarking Robustness to Text-Guided Corruptions
Mohammadreza Mofayezi, Yasamin Medghalchi
arXiv 2023. [Paper]
2023 年 4 月 6 日

DITTO-NeRF: Diffusion-based Iterative Text To Omni-directional 3D Model
Hoigi Seo, Hayeon Kim, Gwanghyun Kim, Se Young Chun
arXiv 2023. [Paper] [Project]
2023 年 4 月 6 日

Taming Encoder for Zero Fine-tuning Image Customization with Text-to-Image Diffusion Models
Xuhui Jia, Yang Zhao, Kelvin CK Chan, Yandong Li, Han Zhang, Boqing Gong, Tingbo Hou, Huisheng Wang, Yu-Chuan Su
arXiv 2023. [Paper]
2023 年 4 月 5 日

A Diffusion-based Method for Multi-turn Compositional Image Generation
Chao Wang, Xiaoyu Yang, Jinmiao Huang, Kevin Ferreira
arXiv 2023. [Paper]
2023 年 4 月 5 日

viz2viz: Prompt-driven stylized visualization generation using a diffusion model
Jiaqi Wu, John Joon Young Chung, Eytan Adar
arXiv 2023. [Paper]
2023 年 4 月 4 日

多模态服装设计师：用于时尚图像编辑的以人为中心的潜在扩散模型
Alberto Baldrati, Davide Morelli, Giuseppe Cartella, Marcella Cornia, Marco Bertini, Rita Cucchiara
arXiv 2023. [Paper]
2023 年 4 月 4 日

PODIA-3D: Domain Adaptation of 3D Generative Model Across Large Domain Gap Using Pose-Preserved Text-to-Image Diffusion
Gwanghyun Kim, Ji Ha Jang, Se Young Chun
arXiv 2023. [Paper] [Project]
2023 年 4 月 4 日

Text-Conditioned Sampling Framework for Text-to-Image Generation with Masked Generative Models
Jaewoong Lee, Sangwon Jang, Jaehyeong Jo, Jaehong Yoon, Yunji Kim, Jin-Hwa Kim, Jung-Woo Ha, Sung Ju Hwang
arXiv 2023. [Paper]
2023 年 4 月 4 日

ReMoDiffuse: Retrieval-Augmented Motion Diffusion Model
Mingyuan Zhang, Xinying Guo, Liang Pan, Zhongang Cai, Fangzhou Hong, Huirong Li, Lei Yang, Ziwei Liu
arXiv 2023. [Paper] [Project] [Github]
2023 年 4 月 3 日

DreamAvatar: Text-and-Shape Guided 3D Human Avatar Generation via Diffusion Models
Yukang Cao, Yan-Pei Cao, Kai Han, Ying Shan, Kwan-Yee K. Wong
arXiv 2023. [Paper]
2023 年 4 月 3 日

DreamFace: Progressive Generation of Animatable 3D Faces under Text Guidance
Longwen Zhang, Qiwei Qiu, Hongyang Lin, Qixuan Zhang, Cheng Shi, Wei Yang, Ye Shi, Sibei Yang, Lan Xu, Jingyi Yu
arXiv 2023. [Paper] [Project]
2023 年 4 月 1 日

GlyphDraw: Learning to Draw Chinese Characters in Image Synthesis Models Coherently
Jian Ma, Mingjun Zhao, Chen Chen, Ruichen Wang, Di Niu, Haonan Lu, Xiaodong Lin
arXiv 2023. [Paper] [Project]
2023 年 3 月 31 日

AvatarCraft: Transforming Text into Neural Human Avatars with Parameterized Shape and Pose Control
Ruixiang Jiang, Can Wang, Jingbo Zhang, Menglei Chai, Mingming He, Dongdong Chen, Jing Liao
arXiv 2023. [Paper] [Project] [Github]
2023 年 3 月 30 日

PAIR-Diffusion: Object-Level Image Editing with Structure-and-Appearance Paired Diffusion Models
Vidit Goel, Elia Peruzzo, Yifan Jiang, Dejia Xu, Nicu Sebe, Trevor Darrell, Zhangyang Wang, Humphrey Shi
arXiv 2023. [Paper] [Github]
2023 年 3 月 30 日

Social Biases through the Text-to-Image Generation Lens
Ranjita Naik, Besmira Nushi
arXiv 2023. [Paper]
2023 年 3 月 30 日

Forget-Me-Not: Learning to Forget in Text-to-Image Diffusion Models
Eric Zhang, Kai Wang, Xingqian Xu, Zhangyang Wang, Humphrey Shi
arXiv 2023. [Paper] [Github]
2023 年 3 月 30 日

DiffCollage: Parallel Generation of Large Content with Diffusion Models
Qinsheng Zhang, Jiaming Song, Xun Huang, Yongxin Chen, Ming-Yu Liu
CVPR 2023. [Paper] [Project]
2023 年 3 月 30 日

Zero-Shot Video Editing Using Off-The-Shelf Image Diffusion Models
Wen Wang, Kangyang Xie, Zide Liu, Hao Chen, Yue Cao, Xinlong Wang, Chunhua Shen
arXiv 2023. [Paper]
2023 年 3 月 30 日

Discriminative Class Tokens for Text-to-Image Diffusion Models
Idan Schwartz, Vésteinn Snæbjarnarson, Sagie Benaim, Hila Chefer, Ryan Cotterell, Lior Wolf, Serge Belongie
arXiv 2023. [Paper]
2023 年 3 月 30 日

DAE-Talker: High Fidelity Speech-Driven Talking Face Generation with Diffusion Autoencoder
Chenpng Du, Qi Chen, Tianyu He, Xu Tan, Xie Chen, Kai Yu, Sheng Zhao, Jiang Bian
arXiv 2023. [Paper]
2023 年 3 月 30 日

LayoutDiffusion: Controllable Diffusion Model for Layout-to-image Generation
Guangcong Zheng, Xianpan Zhou, Xuewei Li, Zhongang Qi, Ying Shan, Xi Li
CVPR 2023. [Paper] [Github]
2023 年 3 月 30 日

4D Facial Expression Diffusion Model
Kaifeng Zou, Sylvain Faisan, Boyang Yu, Sébastien Valette, Hyewon Seo
arXiv 2023. [Paper] [Github]
2023 年 3 月 29 日

MDP: A Generalized Framework for Text-Guided Image Editing by Manipulating the Diffusion Path
Qian Wang, Biao Zhang, Michael Birsak, Peter Wonka
arXiv 2023. [Paper] [Github]
2023 年 3 月 29 日

Instruct 3D-to-3D: Text Instruction Guided 3D-to-3D conversion
Hiromichi Kamata, Yuiko Sakuma, Akio Hayakawa, Masato Ishii, Takuya Narihira
arXiv 2023. [Paper] [Github]
28 Mar 2023

StyleDiffusion: Prompt-Embedding Inversion for Text-Based Editing
Senmao Li, Joost van de Weijer, Taihang Hu, Fahad Shahbaz Khan, Qibin Hou, Yaxing Wang, Jian Yang
arXiv 2023. [Paper]
28 Mar 2023

Seer: Language Instructed Video Prediction with Latent Diffusion Models
Xianfan Gu, Chuan Wen, Jiaming Song, Yang Gao
CVPR Workshop 2023. [Paper]
2023 年 3 月 27 日

Debiasing Scores and Prompts of 2D Diffusion for Robust Text-to-3D Generation
Susung Hong, Donghoon Ahn, Seungryong Kim
arXiv 2023. [Paper]
2023 年 3 月 27 日

Anti-DreamBooth: Protecting users from personalized text-to-image synthesis
Thanh Van Le, Hao Phung, Thuan Hoang Nguyen, Quan Dao, Ngoc Tran, Anh Tran
SIGGRAPH 2023. [Paper] [Github]
2023 年 3 月 27 日

GestureDiffuCLIP: Gesture Diffusion Model with CLIP Latents
Tenglong Ao, Zeyi Zhang, Libin Liu
arXiv 2023. [Paper]
2023 年 3 月 26 日

Better Aligning Text-to-Image Models with Human Preference
Xiaoshi Wu, Keqiang Sun, Feng Zhu, Rui Zhao, Hongsheng Li
arXiv 2023. [Paper] [Github]
2023 年 3 月 25 日

ISS++: Image as Stepping Stone for Text-Guided 3D Shape Generation
Zhengzhe Liu, Peng Dai, Ruihui Li, Xiaojuan Qi, Chi-Wing Fu
ICLR 2023. [Paper]
2023 年 3 月 24 日

DiffuScene: Scene Graph Denoising Diffusion Probabilistic Model for Generative Indoor Scene Synthesis
Jiapeng Tang, Yinyu Nie, Lev Markhasin, Angela Dai, Justus Thies, Matthias Nießner
arXiv 2023. [Paper] [Project]
2023 年 3 月 24 日

CompoNeRF: Text-guided Multi-object Compositional NeRF with Editable 3D Scene Layout
Yiqi Lin, Haotian Bai, Sijia Li, Haonan Lu, Xiaodong Lin, Hui Xiong, Lin Wang
arXiv 2023. [Paper] [Project]
2023 年 3 月 24 日

Fantasia3D: Disentangling Geometry and Appearance for High-quality Text-to-3D Content Creation
Rui Chen, Yongwei Chen, Ningxin Jiao, Kui Jia
arXiv 2023. [Paper]
2023 年 3 月 24 日

ReVersion: Diffusion-Based Relation Inversion from Images
Ziqi Huang, Tianxing Wu, Yuming Jiang, Kelvin CK Chan, Ziwei Liu
arXiv 2023. [Paper] [Project] [Github] 23 Mar 2023

Ablating Concepts in Text-to-Image Diffusion Models
Nupur Kumari, Bingliang Zhang, Sheng-Yu Wang, Eli Shechtman, Richard Zhang, Jun-Yan Zhu
arXiv 2023. [Paper] [Project] [Github]
2023 年 3 月 23 日

Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators
Levon Khachatryan, Andranik Movsisyan, Vahram Tadevosyan, Roberto Henschel, Zhangyang Wang, Shant Navasardyan, Humphrey Shi
arXiv 2023. [Paper] [Github]
2023 年 3 月 23 日

MagicFusion: Boosting Text-to-Image Generation Performance by Fusing Diffusion Models
Jing Zhao, Heliang Zheng, Chaoyue Wang, Long Lan, Wenjing Yang
arXiv 2023. [Paper] [Project] [Github]
2023 年 3 月 23 日

Pix2Video: Video Editing using Image Diffusion
Duygu Ceylan, Chun-Hao Paul Huang, Niloy J. Mitra
arXiv 2023. [Paper] [Project]
2023 年 3 月 22 日

Instruct-NeRF2NeRF: Editing 3D Scenes with Instructions
Ayaan Haque, Matthew Tancik, Alexei A. Efros, Aleksander Holynski, Angjoo Kanazawa
arXiv 2023. [Paper] [Project]
2023 年 3 月 22 日

SALAD: Part-Level Latent Diffusion for 3D Shape Generation and Manipulation
Juil Koo, Seungwoo Yoo, Minh Hieu Nguyen, Minhyuk Sung
arXiv 2023. [Paper] [Project]
2023 年 3 月 21 日

Vox-E: Text-guided Voxel Editing of 3D Objects
Etai Sella, Gal Fiebelman, Peter Hedman, Hadar Averbuch-Elor
arXiv 2023. [Paper] [Project]
2023 年 3 月 21 日

CompoDiff: Versatile Composed Image Retrieval With Latent Diffusion
Geonmo Gu, Sanghyuk Chun, Wonjae Kim, HeeJae Jun, Yoohoon Kang, Sangdoo Yun
arXiv 2023. [Paper]
2023 年 3 月 21 日

3D-CLFusion: Fast Text-to-3D Rendering with Contrastive Latent Diffusion
Yu-Jhe Li, Kris Kitani
arXiv 2023. [Paper]
2023 年 3 月 21 日

Text2Tex: Text-driven Texture Synthesis via Diffusion Models
Dave Zhenyu Chen, Yawar Siddiqui, Hsin-Ying Lee, Sergey Tulyakov, Matthias Nießner
arXiv 2023. [Paper] [Project]
2023 年 3 月 20 日

Localizing Object-level Shape Variations with Text-to-Image Diffusion Models
Or Patashnik, Daniel Garibi, Idan Azuri, Hadar Averbuch-Elor, Daniel Cohen-Or
arXiv 2023. [Paper] [Project]
2023 年 3 月 20 日

SVDiff: Compact Parameter Space for Diffusion Fine-Tuning
Ligong Han, Yinxiao Li, Han Zhang, Peyman Milanfar, Dimitris Metaxas, Feng Yang
arXiv 2023. [Paper]
2023 年 3 月 20 日

Discovering Interpretable Directions in the Semantic Latent Space of Diffusion Models
René Haas, Inbar Huberman-Spiegelglas, Rotem Mulayoff, Tomer Michaeli
arXiv 2023. [Paper]
2023 年 3 月 20 日

SKED: Sketch-guided Text-based 3D Editing
Aryan Mikaeili, Or Perel, Daniel Cohen-Or, Ali Mahdavi-Amiri
arxiv 2023. [Paper]
2023 年 3 月 19 日

DialogPaint: A Dialog-based Image Editing Model
Jingxuan Wei, Shiyu Wu, Xin Jiang, Yequan Wang
arXiv 2023. [Paper]
2023 年 3 月 17 日

GlueGen: Plug and Play Multi-modal Encoders for X-to-image Generation
Can Qin, Ning Yu, Chen Xing, Shu Zhang, Zeyuan Chen, Stefano Ermon, Yun Fu, Caiming Xiong, Ran Xu
arXiv 2023. [Paper]
2023 年 3 月 17 日

DiffusionRet: Generative Text-Video Retrieval with Diffusion Model
Peng Jin, Hao Li, Zesen Cheng, Kehan Li, Xiangyang Ji, Chang Liu, Li Yuan, Jie Chen
arXiv 2023. [Paper]
2023 年 3 月 17 日

FreeDoM: Training-Free Energy-Guided Conditional Diffusion Model
Jiwen Yu, Yinhuai Wang, Chen Zhao, Bernard Ghanem, Jian Zhang
arXiv 2023. [Paper] [Github]
2023 年 3 月 17 日

Unified Multi-Modal Latent Diffusion for Joint Subject and Text Conditional Image Generation
Yiyang Ma, Huan Yang, Wenjing Wang, Jianlong Fu, Jiaying Liu
arXiv 2023. [Paper]
2023 年 3 月 16 日

FateZero: Fusing Attentions for Zero-shot Text-based Video Editing
Chenyang Qi, Xiaodong Cun, Yong Zhang, Chenyang Lei, Xintao Wang, Ying Shan, Qifeng Chen
arXiv 2023. [Paper] [Project] [Github]
2023 年 3 月 16 日

HIVE: Harnessing Human Feedback for Instructional Visual Editing
Shu Zhang, Xinyi Yang, Yihao Feng, Can Qin, Chia-Chih Chen, Ning Yu, Zeyuan Chen, Huan Wang, Silvio Savarese, Stefano Ermon, Caiming Xiong, Ran Xu
arXiv 2023. [Paper]
2023 年 3 月 16 日

P+: Extended Textual Conditioning in Text-to-Image Generation
Andrey Voynov, Qinghao Chu, Daniel Cohen-Or, Kfir Aberman
arXiv 2023. [Paper] [Project]
2023 年 3 月 16 日

Highly Personalized Text Embedding for Image Manipulation by Stable Diffusion
Inhwa Han, Serin Yang, Taesung Kwon, Jong Chul Ye
arXiv 2023. [Paper]
2023 年 3 月 15 日

Aerial Diffusion: Text Guided Ground-to-Aerial View Translation from a Single Image using Diffusion Models
Divya Kothandaraman, Tianyi Zhou, Ming Lin, Dinesh Manocha
arXiv 2023. [Paper] [Github]
2023 年 3 月 15 日

Zero-Shot Contrastive Loss for Text-Guided Diffusion Image Style Transfer
Serin Yang, Hyunmin Hwang, Jong Chul Ye
arXiv 2023. [Paper]
2023 年 3 月 15 日

Edit-A-Video: Single Video Editing with Object-Aware Consistency
Chaehun Shin, Heeseung Kim, Che Hyun Lee, Sang-gil Lee, Sungroh Yoon
arXiv 2023. [Paper] [Project]
2023 年 3 月 14 日

Editing Implicit Assumptions in Text-to-Image Diffusion Models
Hadas Orgad, Bahjat Kawar, Yonatan Belinkov
arXiv 2023. [Paper] [Project] [Github]
2023 年 3 月 14 日

让 2D 扩散模型了解 3D 一致性，以实现稳健的文本到 3D 生成
Junyoung Seo, Wooseok Jang, Min-Seop Kwak, Jaehoon Ko, Hyeonsu Kim, Junho Kim, Jin-Hwa Kim, Jiyoung Lee, Seungryong Kim
arXiv 2023. [Paper]
2023 年 3 月 14 日

Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models
Chenfei Wu, Shengming Yin, Weizhen Qi, Xiaodong Wang, Zecheng Tang, Nan Duan
arXiv 2023. [Paper] [Github]
2023 年 3 月 8 日

Video-P2P: Video Editing with Cross-attention Control
Shaoteng Liu, Yuechen Zhang, Wenbo Li, Zhe Lin, Jiaya Jia
arXiv 2023. [Paper] [Project]
2023 年 3 月 8 日

Erasing Concepts from Diffusion Models
Rohit Gandikota, Joanna Materzynska, Jaden Fiotto-Kaufman, David Bau
arXiv 2023. [Paper] [Project] [Github]
2023 年 3 月 13 日

One Transformer Fits All Distributions in Multi-Modal Diffusion at Scale
Fan Bao, Shen Nie, Kaiwen Xue, Chongxuan Li, Shi Pu, Yaole Wang, Gang Yue, Yue Cao, Hang Su, Jun Zhu
arXiv 2023. [Paper] [Github]
2023 年 3 月 12 日

Cones: Concept Neurons in Diffusion Models for Customized Generation
Zhiheng Liu, Ruili Feng, Kai Zhu, Yifei Zhang, Kecheng Zheng, Yu Liu, Deli Zhao, Jingren Zhou, Yang Cao
arXiv 2023. [Paper]
2023 年 3 月 9 日

A Prompt Log Analysis of Text-to-Image Generation Systems
Yutong Xie, Zhaoying Pan, Jinge Ma, Jie Luo, Qiaozhu Mei
arXiv 2023. [Paper]
2023 年 3 月 8 日

Zeroth-Order Optimization Meets Human Feedback: Provable Learning via Ranking Oracles
Zhiwei Tang, Dmitry Rybin, Tsung-Hui Chang
arXiv 2023. [Paper] [Github]
2023 年 3 月 7 日

释放文本到图像的扩散模型以实现视觉感知
Wenliang Zhao, Yongming Rao, Zuyan Liu, Benlin Liu, Jie Zhou, Jiwen Lu
arXiv 2023. [Paper] [Github]
2023 年 3 月 3 日

Collage Diffusion
Vishnu Sarukkai, Linden Li, Arden Ma, Christopher Ré, Kayvon Fatahalian
arXiv 2023. [Paper]
2023 年 3 月 1 日

Towards Enhanced Controllability of Diffusion Models
Wonwoong Cho, Hareesh Ravi, Midhun Harikumar, Vinh Khuc, Krishna Kumar Singh, Jingwan Lu, David I. Inouye, Ajinkya Kale
arXiv 2023. [Paper]
2023 年 2 月 28 日

Directed Diffusion: Direct Control of Object Placement through Attention Guidance
Wan-Duo Kurt Ma, JP Lewis, W. Bastiaan Kleijn, Thomas Leung
arXiv 2023. [Paper]
2023 年 2 月 25 日

调制用于多模态图像合成的预训练扩散模型
Cusuh Ham, James Hays, Jingwan Lu, Krishna Kumar Singh, Zhifei Zhang, Tobias Hinz
arXiv 2023. [Paper]
2023 年 2 月 24 日

Region-Aware Diffusion for Zero-shot Text-driven Image Editing
Nisha Huang, Fan Tang, Weiming Dong, Tong-Yee Lee, Changsheng Xu
arXiv 2023. [Paper] [Github]
2023 年 2 月 23 日

Controlled and Conditional Text to Image Generation with Diffusion Prior
Pranav Aggarwal, Hareesh Ravi, Naveen Marri, Sachin Kelkar, Fengbin Chen, Vinh Khuc, Midhun Harikumar, Ritiz Tambi, Sudharshan Reddy Kakumanu, Purvak Lapsiya, Alvin Ghouas, Sarah Saber, Malavika Ramprasad, Baldo Faieta, Ajinkya Kale
arXiv 2023. [Paper]
2023 年 2 月 23 日

Reduce, Reuse, Recycle: Compositional Generation with Energy-Based Diffusion Models and MCMC
Yilun Du, Conor Durkan, Robin Strudel, Joshua B. Tenenbaum, Sander Dieleman, Rob Fergus, Jascha Sohl-Dickstein, Arnaud Doucet, Will Grathwohl
arXiv 2023. [Paper] [Project]
2023 年 2 月 22 日

Learning 3D Photography Videos via Self-supervised Diffusion on Single Images
Xiaodong Wang, Chenfei Wu, Shengming Yin, Minheng Ni, Jianfeng Wang, Linjie Li, Zhengyuan Yang, Fan Yang, Lijuan Wang, Zicheng Liu, Yuejian Fang, Nan Duan
arXiv 2023. [Paper]
2023 年 2 月 21 日

Exploring the Representation Manifolds of Stable Diffusion Through the Lens of Intrinsic Dimension
Henry Kvinge, Davis Brown, Charles Godfrey
arXiv 2023. [Paper]
2023 年 2 月 16 日

Text-driven Visual Synthesis with Latent Diffusion Prior
Ting-Hsuan Liao, Songwei Ge, Yiran Xu, Yao-Chih Lee, Badour AlBahar, Jia-Bin Huang
arXiv 2023. [Paper] [Project]
2023 年 2 月 16 日

T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models
Chong Mou, Xintao Wang, Liangbin Xie, Jian Zhang, Zhongang Qi, Ying Shan, Xiaohu Qie
arXiv 2023. [Paper] [Github]
2023 年 2 月 16 日

MultiDiffusion: Fusing Diffusion Paths for Controlled Image Generation
Omer Bar-Tal, Lior Yariv, Yaron Lipman, Tali Dekel
arXiv 2023. [Paper] Project] [Github]
2023 年 2 月 16 日

Boundary Guided Mixing Trajectory for Semantic Control with Diffusion Models
Ye Zhu, Yu Wu, Zhiwei Deng, Olga Russakovsky, Yan Yan
arXiv 2023. [Paper]
2023 年 2 月 16 日

Dataset Interfaces: Diagnosing Model Failures Using Controllable Counterfactual Generation
Joshua Vendrow, Saachi Jain, Logan Engstrom, Aleksander Madry
arXiv 2023. [Paper] [Github]
2023 年 2 月 15 日

PRedItOR: Text Guided Image Editing with Diffusion Prior
Hareesh Ravi, Sachin Kelkar, Midhun Harikumar, Ajinkya Kale
arXiv 2023. [Paper]
2023 年 2 月 15 日

Text-Guided Scene Sketch-to-Photo Synthesis
AprilPyone MaungMaung, Makoto Shing, Kentaro Mitsui, Kei Sawada, Fumio Okura
arXiv 2023. [Paper]
2023 年 2 月 14 日

Universal Guidance for Diffusion Models
Arpit Bansal, Hong-Min Chu, Avi Schwarzschild, Soumyadip Sengupta, Micah Goldblum, Jonas Geiping, Tom Goldstein
arXiv 2023. [Paper] [Github]
2023 年 2 月 14 日

向文本到图像扩散模型添加条件控制
Lvmin Zhang, Maneesh Agrawala
arXiv 2023. [Paper] [Github]
2023 年 2 月 10 日

Analyzing Multimodal Objectives Through the Lens of Generative Diffusion Guidance
Chaerin Kong, Nojun Kwak
arXiv 2023. [Paper]
2023 年 2 月 10 日

Is This Loss Informative? Speeding Up Textual Inversion with Deterministic Objective Evaluation
Anton Voronov, Mikhail Khoroshikh, Artem Babenko, Max Ryabinin
arXiv 2023. [Paper]
2023 年 2 月 9 日

Q-扩散：量化扩散模型
Xiuyu Li, Long Lian, Yijiang Liu, Huanrui Yang, Zhen Dong, Daniel Kang, Shanghang Zhang, Kurt Keutzer
arXiv 2023. [Paper] [Github]
2023 年 2 月 8 日

GLAZE: Protecting Artists from Style Mimicry by Text-to-Image Models
Shawn Shan, Jenna Cryan, Emily Wenger, Haitao Zheng, Rana Hanocka, Ben Y. Zhao
arXiv 2023. [Paper]
2023 年 2 月 8 日

Zero-shot Generation of Coherent Storybook from Plain Text Story using Diffusion Models
Hyeonho Jeong, Gihyun Kwon, Jong Chul Ye
arXiv 2023. [Paper]
2023 年 2 月 8 日

Fair Diffusion: Instructing Text-to-Image Generation Models on Fairness
Felix Friedrich, Patrick Schramowski, Manuel Brack, Lukas Struppek, Dominik Hintersdorf, Sasha Luccioni, Kristian Kersting
arXiv 2023. [Paper]
2023 年 2 月 7 日

硬提示变得简单：基于梯度的离散优化，用于提示调整和发现
Yuxin Wen, Neel Jain, John Kirchenbauer, Micah Goldblum, Jonas Geiping, Tom Goldstein
arXiv 2023. [Paper] [Github]
2023 年 2 月 7 日

Zero-shot Image-to-Image Translation
Gaurav Parmar, Krishna Kumar Singh, Richard Zhang, Yijun Li, Jingwan Lu, Jun-Yan Zhu
arXiv 2023. [Paper]
2023 年 2 月 6 日

Structure and Content-Guided Video Synthesis with Diffusion Models
Patrick Esser, Johnathan Chiu, Parmida Atighehchian, Jonathan Granskog, Anastasis Germanidis
arXiv 2023. [Paper] [Project]
2023 年 2 月 6 日

Mixture of Diffusers for scene composition and high resolution image generation
Álvaro Barbero Jiménez
arXiv 2023. [Paper] [Github]
2023 年 2 月 5 日

ReDi: Efficient Learning-Free Diffusion Inference via Trajectory Retrieval
Kexun Zhang, Xianjun Yang, William Yang Wang, Lei Li
arXiv 2023. [Paper]
2023 年 2 月 5 日

Eliminating Prior Bias for Semantic Image Editing via Dual-Cycle Diffusion
Zuopeng Yang, Tianshu Chu, Xin Lin, Erdun Gao, Daqing Liu, Jie Yang, Chaoyue Wang
arXiv 2023. [Paper]
2023 年 2 月 5 日

Semantic-Guided Image Augmentation with Pre-trained Models
Bohan Li, Xinghao Wang, Xiao Xu, Yutai Hou, Yunlong Feng, Feng Wang, Wanxiang Che
SIGGRAPH 2023. [Paper] [Project]
2023 年 2 月 4 日

TEXTure: Text-Guided Texturing of 3D Shapes
Elad Richardson, Gal Metzer, Yuval Alaluf, Raja Giryes, Daniel Cohen-Or
arXiv 2023. [Paper] [Project] [Github]
2023 年 2 月 3 日

Dreamix: Video Diffusion Models are General Video Editors
Eyal Molad, Eliahu Horwitz, Dani Valevski, Alex Rav Acha, Yossi Matias, Yael Pritch, Yaniv Leviathan, Yedid Hoshen
arXiv 2023. [Paper] [Project]
2 Feb 2023

Trash to Treasure: Using text-to-image models to inform the design of physical artefacts
Amy Smith, Hope Schroeder, Ziv Epstein, Michael Cook, Simon Colton, Andrew Lippman
AAAI 2023. [Paper]
2023 年 2 月 1 日

Attend-and-Excite: Attention-Based Semantic Guidance for Text-to-Image Diffusion Models
Hila Chefer, Yuval Alaluf, Yael Vinker, Lior Wolf, Daniel Cohen-Or
SIGGRAPH 2023. [Paper] [Project] [Github]
2023 年 1 月 31 日

Zero3D: Semantic-Driven Multi-Category 3D Shape Generation
Bo Han, Yitong Liu, Yixuan Shen
arXiv 2023. [Paper]
2023 年 1 月 31 日

Shape-aware Text-driven Layered Video Editing
Yao-Chih Lee, Ji-Ze Genevieve Jang, Yi-Ting Chen, Elizabeth Qiu, Jia-Bin Huang
arXiv 2023. [Paper] [Project]
2023 年 1 月 30 日

PromptMix: Text-to-image diffusion models enhance the performance of lightweight networks
Arian Bakhtiarnia, Qi Zhang, Alexandros Iosifidis
arXiv 2023. [Paper] [Github]
2023 年 1 月 30 日

GALIP：用于文本到图像合成的生成对抗性 CLIP
Ming Tao, Bing-Kun Bao, Hao Tang, Changsheng Xu
CVPR 2023. [Paper] [Github]
2023 年 1 月 30 日

SEGA: Instructing Diffusion using Semantic Dimensions
Manuel Brack, Felix Friedrich, Dominik Hintersdorf, Lukas Struppek, Patrick Schramowski, Kristian Kersting
arXiv 2023. [Paper]
2023 年 1 月 28 日

Towards Equitable Representation in Text-to-Image Synthesis Models with the Cross-Cultural Understanding Benchmark (CCUB) Dataset
Zhixuan Liu, Youeun Shin, Beverley-Claire Okogwu, Youngsik Yun, Lia Coleman, Peter Schaldenbrand, Jihie Kim, Jean Oh
arXiv 2023. [Paper]
2023 年 1 月 28 日

Text-To-4D Dynamic Scene Generation
Uriel Singer, Shelly Sheynin, Adam Polyak, Oron Ashual, Iurii Makarov, Filippos Kokkinos, Naman Goyal, Andrea Vedaldi, Devi Parikh, Justin Johnson, Yaniv Taigman
arXiv 2023. [Paper]
2023 年 1 月 26 日

Guiding Text-to-Image Diffusion Model Towards Grounded Generation
Ziyi Li, Qinye Zhou, Xiaoyun Zhang, Ya Zhang, Yanfeng Wang, Weidi Xie
arXiv 2023. [Paper] [Project]
2023 年 1 月 12 日

Speech Driven Video Editing via an Audio-Conditioned Diffusion Model
Dan Bigioi, Shubhajit Basak, Hugh Jordan, Rachel McDonnell, Peter Corcoran
arXiv 2023. [Paper] [Project] [Github]
2023 年 1 月 10 日

Visual Story Generation Based on Emotion and Keywords
Yuetian Chen, Ruohua Li, Bowen Shi, Peiru Liu, Mei Si
AIIDE INT 2022. [Paper]
2023 年 1 月 7 日

DiffTalk: Crafting Diffusion Models for Generalized Talking Head Synthesis
Shuai Shen, Wenliang Zhao, Zibin Meng, Wanhua Li, Zheng Zhu, Jie Zhou, Jiwen Lu
arXiv 2023. [Paper]
2023 年 1 月 10 日

Speech Driven Video Editing via an Audio-Conditioned Diffusion Model
Dan Bigioi, Shubhajit Basak, Hugh Jordan, Rachel McDonnell, Peter Corcoran
arXiv 2023. [Paper]
2023 年 1 月 10 日

Diffused Heads: Diffusion Models Beat GANs on Talking-Face Generation
Michał Stypułkowski, Konstantinos Vougioukas, Sen He, Maciej Zięba, Stavros Petridis, Maja Pantic
arXiv 2023. [Paper] [Project]
2023 年 1 月 6 日

Muse: Text-To-Image Generation via Masked Generative Transformers
Huiwen Chang, Han Zhang, Jarred Barber, AJ Maschinot, Jose Lezama, Lu Jiang, Ming-Hsuan Yang, Kevin Murphy, William T. Freeman, Michael Rubinstein, Yuanzhen Li, Dilip Krishnan
arXiv 2023. [Paper] [Project]
2023 年 1 月 2 日

Dream3D: Zero-Shot Text-to-3D Synthesis Using 3D Shape Prior and Text-to-Image Diffusion Models
Jiale Xu, Xintao Wang, Weihao Cheng, Yan-Pei Cao, Ying Shan, Xiaohu Qie, Shenghua Gao
CVPR 2023. [Paper] [Project]
2022 年 12 月 28 日

Exploring Vision Transformers as Diffusion Learners
He Cao, Jianan Wang, Tianhe Ren, Xianbiao Qi, Yihao Chen, Yuan Yao, Lei Zhang
arXiv 2022. [Paper]
2022 年 12 月 28 日

Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation
Jay Zhangjie Wu, Yixiao Ge, Xintao Wang, Weixian Lei, Yuchao Gu, Wynne Hsu, Ying Shan, Xiaohu Qie, Mike Zheng Shou
arXiv 2022. [Paper] [Project]
2022 年 12 月 22 日

Contrastive Language-Vision AI Models Pretrained on Web-Scraped Multimodal Data Exhibit Sexual Objectification Bias
Robert Wolfe, Yiwei Yang, Bill Howe, Aylin Caliskan
arXiv 2022. [Paper]
2022 年 12 月 21 日

Optimizing Prompts for Text-to-Image Generation
Yaru Hao, Zewen Chi, Li Dong, Furu Wei
arXiv 2022. [Paper] [Project] [Github]
2022 年 12 月 19 日

Uncovering the Disentanglement Capability in Text-to-Image Diffusion Models
Qiucheng Wu, Yujian Liu, Handong Zhao, Ajinkya Kale, Trung Bui, Tong Yu, Zhe Lin, Yang Zhang, Shiyu Chang
arXiv 2022. [Paper] [Github]
2022 年 12 月 16 日

TeTIm-Eval: a novel curated evaluation data set for comparing text-to-image models
Federico A. Galatolo, Mario GCA Cimino, Edoardo Cogotti
arXiv 2022. [Paper]
2022 年 12 月 15 日

The Infinite Index: Information Retrieval on Generative Text-To-Image Models
Niklas Deckers, Maik Fröbe, Johannes Kiesel, Gianluca Pandolfo, Christopher Schröder, Benno Stein, Martin Potthast
CHIIR 2023. [Paper]
2022 年 12 月 14 日

LidarCLIP or: How I Learned to Talk to Point Clouds
Georg Hess, Adam Tonderski, Christoffer Petersson, Lennart Svensson, Kalle Åström
arXiv 2022. [Paper] [Github]
2022 年 12 月 13 日

Imagen Editor and EditBench: Advancing and Evaluating Text-Guided Image Inpainting
Su Wang, Chitwan Saharia, Ceslee Montgomery, Jordi Pont-Tuset, Shai Noy, Stefano Pellegrini, Yasumasa Onoe, Sarah Laszlo, David J. Fleet, Radu Soricut, Jason Baldridge, Mohammad Norouzi, Peter Anderson, William Chan
CVPR 2023. [Paper]
2022 年 12 月 13 日

The Stable Artist: Steering Semantics in Diffusion Latent Space
Manuel Brack, Patrick Schramowski, Felix Friedrich, Dominik Hintersdorf, Kristian Kersting
arXiv 2022. [Paper]
2022 年 12 月 12 日

SmartBrush: Text and Shape Guided Object Inpainting with Diffusion Model
Shaoan Xie, Zhifei Zhang, Zhe Lin, Tobias Hinz, Kun Zhang
arXiv 2022. [Paper]
2022 年 12 月 9 日

Training-Free Structured Diffusion Guidance for Compositional Text-to-Image Synthesis
Weixi Feng, Xuehai He, Tsu-Jui Fu, Varun Jampani, Arjun Akula, Pradyumna Narayana, Sugato Basu, Xin Eric Wang, William Yang Wang
ICLR 2023. [Paper] [Github]
2022 年 12 月 9 日

MoFusion: A Framework for Denoising-Diffusion-based Motion Synthesis
Rishabh Dabral, Muhammad Hamza Mughal, Vladislav Golyanik, Christian Theobalt
arXiv 2022. [Paper] [Project]
2022 年 12 月 8 日

SDFusion: Multimodal 3D Shape Completion, Reconstruction, and Generation
Yen-Chi Cheng, Hsin-Ying Lee, Sergey Tulyakov, Alexander Schwing, Liangyan Gui
arXiv 2022. [Paper] [Project]
2022 年 12 月 8 日

SINE: SINgle Image Editing with Text-to-Image Diffusion Models
Zhixing Zhang, Ligong Han, Arnab Ghosh, Dimitris Metaxas, Jian Ren
arXiv 2022. [Paper] [Project] [Github]
2022 年 12 月 8 日

Multi-Concept Customization of Text-to-Image Diffusion
Nupur Kumari, Bingliang Zhang, Richard Zhang, Eli Shechtman, Jun-Yan Zhu
arXiv 2022. [Paper] [Project]
2022 年 12 月 8 日

Diffusion Guided Domain Adaptation of Image Generators
Kunpeng Song, Ligong Han, Bingchen Liu, Dimitris Metaxas, Ahmed Elgammal
arXiv 2022. [Paper] [Project]
2022 年 12 月 8 日

Executing your Commands via Motion Diffusion in Latent Space
Xin Chen, Biao Jiang, Wen Liu, Zilong Huang, Bin Fu, Tao Chen, Jingyi Yu, Gang Yu
arXiv 2022. [Paper] [Project]
2022 年 12 月 8 日

Talking Head Generation with Probabilistic Audio-to-Visual Diffusion Priors
Zhentao Yu, Zixin Yin, Deyu Zhou, Duomin Wang, Finn Wong, Baoyuan Wang
arXiv 2022. [Paper] [Project]
2022 年 12 月 7 日

Magic: Multi Art Genre Intelligent Choreography Dataset and Network for 3D Dance Generation
Ronghui Li, Junfan Zhao, Yachao Zhang, Mingyang Su, Zeping Ren, Han Zhang, Xiu Li
arXiv 2022. [Paper]
2022 年 12 月 7 日

Judge, Localize, and Edit: Ensuring Visual Commonsense Morality for Text-to-Image Generation
Seongbeom Park, Suhong Moon, Jinkyu Kim
arXiv 2022. [Paper]
2022 年 12 月 7 日

NeRDi：以语言引导扩散作为一般图像先验的单视图 NeRF 合成
Congyue Deng, Chiyu "Max'' Jiang, Charles R. Qi, Xinchen Yan, Yin Zhou, Leonidas Guibas, Dragomir Anguelov
arXiv 2022. [Paper]
2022 年 12 月 6 日

Semantic-Conditional Diffusion Networks for Image Captioning
Jianjie Luo, Yehao Li, Yingwei Pan, Ting Yao, Jianlin Feng, Hongyang Chao, Tao Mei
CVPR 2023. [Paper] [Github]
2022 年 12 月 6 日

Diffusion-SDF: Text-to-Shape via Voxelized Diffusion
Muheng Li, Yueqi Duan, Jie Zhou, Jiwen Lu
CVPR 2023. [Paper] [Project] [Github]
2022 年 12 月 6 日

ADIR: Adaptive Diffusion for Image Reconstruction
Shady Abu-Hussein, Tom Tirer, Raja Giryes
arXiv 2022. [Paper] [Project]
2022 年 12 月 6 日

M-VADER: A Model for Diffusion with Multimodal Context
Samuel Weinbach, Marco Bellagente, Constantin Eichenberg, Andrew Dai, Robert Baldock, Souradeep Nanda, Björn Deiseroth, Koen Oostermeijer, Hannah Teufel, Andres Felipe Cruz-Salinas
arXiv 2022. [Paper]
2022 年 12 月 6 日

Diffusion Video Autoencoders: Toward Temporally Consistent Face Video Editing via Disentangled Video Encoding
Gyeongman Kim, Hajin Shim, Hyunsu Kim, Yunjey Choi, Junho Kim, Eunho Yang
CVPR 2023. [Paper] [Project] [Github]
2022 年 12 月 6 日

Unite and Conquer: Cross Dataset Multimodal Synthesis using Diffusion Models
Nithin Gopalakrishnan Nair, Wele Gedara Chaminda Bandara, Vishal M. Patel
arXiv 2022. [Paper] [Project]
2022 年 12 月 1 日

Shape-Guided Diffusion with Inside-Outside Attention
Dong Huk Park, Grace Luo, Clayton Toste, Samaneh Azadi, Xihui Liu, Maka Karalashvili, Anna Rohrbach, Trevor Darrell
arXiv 2022. [Paper] [Project]
2022 年 12 月 1 日

SinDDM: A Single Image Denoising Diffusion Model
Vladimir Kulikov, Shahar Yadin, Matan Kleiner, Tomer Michaeli
arXiv 2022. [Paper] [Project]
2022 年 11 月 29 日

DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model
Gwanghyun Kim, Se Young Chun
CVPR 2023. [Paper] [Github]
2022 年 11 月 29 日

Refined Semantic Enhancement towards Frequency Diffusion for Video Captioning
Xian Zhong, Zipeng Li, Shuqin Chen, Kui Jiang, Chen Chen, Mang Ye
arXiv 2022. [Paper] [Github]
2022 年 11 月 28 日

Unified Discrete Diffusion for Simultaneous Vision-Language Generation
Minghui Hu, Chuanxia Zheng, Heliang Zheng, Tat-Jen Cham, Chaoyue Wang, Zuopeng Yang, Dacheng Tao, Ponnuthurai N. Suganthan
arXiv 2022. [Paper]
2022 年 11 月 27 日

3DDesigner: Towards Photorealistic 3D Object Generation and Editing with Text-guided Diffusion Models
Gang Li, Heliang Zheng, Chaoyue Wang, Chang Li, Changwen Zheng, Dacheng Tao
arXiv 2022. [Paper]
2022 年 11 月 25 日

SpaText: Spatio-Textual Representation for Controllable Image Generation
Omri Avrahami, Thomas Hayes, Oran Gafni, Sonal Gupta, Yaniv Taigman, Devi Parikh, Dani Lischinski, Ohad Fried, Xi Yin
CVPR 2023. [Paper] [Project]
2022 年 11 月 25 日

Sketch-Guided Text-to-Image Diffusion Models
Andrey Voynov, Kfir Aberman, Daniel Cohen-Or
arXiv 2022. [Paper] [Project]
2022 年 11 月 24 日

Shifted Diffusion for Text-to-image Generation
Yufan Zhou, Bingchen Liu, Yizhe Zhu, Xiao Yang, Changyou Chen, Jinhui Xu
CVPR 2023. [Paper]
2022 年 11 月 24 日

Make-A-Story: Visual Memory Conditioned Consistent Story Generation
Tanzila Rahman, Hsin-Ying Lee, Jian Ren, Sergey Tulyakov, Shweta Mahajan, Leonid Sigal
CVPR 2023. [Paper]
2022 年 11 月 23 日

Schrödinger's Bat: Diffusion Models Sometimes Generate Polysemous Words in Superposition
Jennifer C. White, Ryan Cotterell
arXiv 2022. [Paper]
2022 年 11 月 23 日

EDICT: Exact Diffusion Inversion via Coupled Transformations
Bram Wallace, Akash Gokul, Nikhil Naik
arXiv 2022. [Paper] [Github]
2022 年 11 月 22 日

用于文本驱动的图像到图像翻译的即插即用扩散功能
Narek Tumanyan, Michal Geyer, Shai Bagon, Tali Dekel
CVPR 2023. [Paper] [Github]
2022 年 11 月 22 日

Human Evaluation of Text-to-Image Models on a Multi-Task Benchmark
Vitali Petsiuk, Alexander E. Siemenn, Saisamrit Surbehera, Zad Chin, Keith Tyser, Gregory Hunter, Arvind Raghavan, Yann Hicke, Bryan A. Plummer, Ori Kerret, Tonio Buonassisi, Kate Saenko, Armando Solar-Lezama, Iddo Drori
NeurIPS Workshop 2022. [Paper]
2022 年 11 月 22 日

SinDiffusion: Learning a Diffusion Model from a Single Natural Image
Weilun Wang, Jianmin Bao, Wengang Zhou, Dongdong Chen, Dong Chen, Lu Yuan, Houqiang Li
arXiv 2022. [Paper] [Github]
2022 年 11 月 22 日

SinFusion: Training Diffusion Models on a Single Image or Video
Yaniv Nikankin, Niv Haim, Michal Irani
arXiv 2022. [Paper] [Github]
2022 年 11 月 21 日

Exploring Discrete Diffusion Models for Image Captioning
Zixin Zhu, Yixuan Wei, Jianfeng Wang, Zhe Gan, Zheng Zhang, Le Wang, Gang Hua, Lijuan Wang, Zicheng Liu, Han Hu
arXiv 2022. [Paper] [Github]
2022 年 11 月 21 日

研究扩散模型中的即时工程
Sam Witteveen, Martin Andrews
NeurIPS Workshop 2022. [Paper]
2022 年 11 月 21 日

VectorFusion: Text-to-SVG by Abstracting Pixel-Based Diffusion Models
Ajay Jain, Amber Xie, Pieter Abbeel
arXiv 2022. [Paper] [Project]
2022 年 11 月 21 日

Synthesizing Coherent Story with Auto-Regressive Latent Diffusion Models
Xichen Pan, Pengda Qin, Yuhong Li, Hui Xue, Wenhu Chen
arXiv 2022. [Paper] [Github]
2022 年 11 月 20 日

DiffStyler: Controllable Dual Diffusion for Text-Driven Image Stylization
Nisha Huang, Yuxin Zhang, Fan Tang, Chongyang Ma, Haibin Huang, Yong Zhang, Weiming Dong, Changsheng Xu
arXiv 2022. [Paper]
2022 年 11 月 19 日

Magic3D: High-Resolution Text-to-3D Content Creation
Chen-Hsuan Lin, Jun Gao, Luming Tang, Towaki Takikawa, Xiaohui Zeng, Xun Huang, Karsten Kreis, Sanja Fidler, Ming-Yu Liu, Tsung-Yi Lin
CVPR 2023. [Paper] [Project]
2022 年 11 月 18 日

Invariant Learning via Diffusion Dreamed Distribution Shifts
Priyatham Kattakinda, Alexander Levine, Soheil Feizi
arXiv 2022. [Paper]
2022 年 11 月 18 日

Null-text Inversion for Editing Real Images using Guided Diffusion Models
Ron Mokady, Amir Hertz, Kfir Aberman, Yael Pritch, Daniel Cohen-Or
arXiv 2022. [Paper]
2022 年 11 月 17 日

InstructPix2Pix: Learning to Follow Image Editing Instructions
Tim Brooks, Aleksander Holynski, Alexei A. Efros
CVPR 2023. [Paper] [Project] [Github]
2022 年 11 月 17 日

多功能扩散：文本、图像和变体合二为一的扩散模型
Xingqian Xu, Zhangyang Wang, Eric Zhang, Kai Wang, Humphrey Shi
arXiv 2022. [Paper] [Github]
2022 年 11 月 15 日

Direct Inversion: Optimization-Free Text-Driven Real Image Editing with Diffusion Models
Adham Elarabawy, Harish Kamath, Samuel Denton
arXiv 2022. [Paper]
2022 年 11 月 15 日

Arbitrary Style Guidance for Enhanced Diffusion-Based Text-to-Image Generation
Zhihong Pan, Xin Zhou, Hao Tian
WACV 2023. [Paper]
2022 年 11 月 14 日

Safe Latent Diffusion: Mitigating Inappropriate Degeneration in Diffusion Models
Patrick Schramowski, Manuel Brack, Björn Deiseroth, Kristian Kersting
CVPR 2023. [Paper] [Github]
9 Nov 2022

Rickrolling the Artist: Injecting Invisible Backdoors into Text-Guided Image Generation Models
Lukas Struppek, Dominik Hintersdorf, Kristian Kersting
arXiv 2022. [Paper] [Github]
2022 年 11 月 4 日

eDiffi：具有专家降噪器集合的文本到图像扩散模型
Yogesh Balaji, Seungjun Nah, Xun Huang, Arash Vahdat, Jiaming Song, Karsten Kreis, Miika Aittala, Timo Aila, Samuli Laine, Bryan Catanzaro, Tero Karras, Ming-Yu Liu
arXiv 2022. [Paper] [Github]
2022 年 11 月 2 日

MagicMix: Semantic Mixing with Diffusion Models
Jun Hao Liew, Hanshu Yan, Daquan Zhou, Jiashi Feng
arXiv 2022. [Paper] [Project]
2022 年 10 月 28 日

UPainting: Unified Text-to-Image Diffusion Generation with Cross-modal Guidance
Wei Li, Xue Xu, Xinyan Xiao, Jiachen Liu, Hu Yang, Guohao Li, Zhanpeng Wang, Zhifan Feng, Qiaoqiao She, Yajuan Lyu, Hua Wu
arXiv 2022. [Paper]
2022 年 10 月 28 日

How well can Text-to-Image Generative Models understand Ethical Natural Language Interventions?
Hritik Bansal, Da Yin, Masoud Monajatipoor, Kai-Wei Chang
EMNLP 2022. [Paper] [Github]
2022 年 10 月 27 日

ERNIE-ViLG 2.0：利用知识增强的去噪专家组合改进文本到图像的扩散模型
Zhida Feng, Zhenyu Zhang, Xintong Yu, Yewei Fang, Lanxin Li, Xuyi Chen, Yuxiang Lu, Jiaxiang Liu, Weichong Yin, Shikun Feng, Yu Sun, Hao Tian, Hua Wu, Haifeng Wang
CVPR 2023. [Paper]
2022 年 10 月 27 日

DiffusionDB: A Large-scale Prompt Gallery Dataset for Text-to-Image Generative Models
Zijie J. Wang, Evan Montoya, David Munechika, Haoyang Yang, Benjamin Hoover, Duen Horng Chau
arXiv 2022. [Paper] [Project] [Github]
2022 年 10 月 26 日

Lafite2: Few-shot Text-to-Image Generation
Yufan Zhou, Chunyuan Li, Changyou Chen, Jianfeng Gao, Jinhui Xu
arXiv 2022. [Paper]
2022 年 10 月 25 日

High-Resolution Image Editing via Multi-Stage Blended Diffusion
Johannes Ackermann, Minjun Li
NeurIPS Workshop 2022. [Paper] [Github]
2022 年 10 月 24 日

Conditional Diffusion with Less Explicit Guidance via Model Predictive Control
Max W. Shen, Ehsan Hajiramezanali, Gabriele Scalia, Alex Tseng, Nathaniel Diamant, Tommaso Biancalani, Andreas Loukas
arXiv 2022. [Paper]
2022 年 10 月 21 日

A Visual Tour Of Current Challenges In Multimodal Language Models
Shashank Sonkar, Naiming Liu, Richard G. Baraniuk
arXiv 2022. [Paper]
2022 年 10 月 22 日

DiffEdit: Diffusion-based semantic image editing with mask guidance
Guillaume Couairon, Jakob Verbeek, Holger Schwenk, Matthieu Cord
ICLR 2023. [Paper]
2022 年 10 月 20 日

Diffusion Models already have a Semantic Latent Space
Mingi Kwon, Jaeseok Jeong, Youngjung Uh
ICLR 2023. [Paper] [Project]
2022 年 10 月 20 日

UniTune: Text-Driven Image Editing by Fine Tuning an Image Generation Model on a Single Image
Dani Valevski, Matan Kalman, Yossi Matias, Yaniv Leviathan
arXiv 2022. [Paper]
2022 年 10 月 18 日

Swinv2-Imagen: Hierarchical Vision Transformer Diffusion Models for Text-to-Image Generation
Ruijun Li, Weihua Li, Yi Yang, Hanyu Wei, Jianhua Jiang, Quan Bai
arXiv 2022. [Paper]
2022 年 10 月 18 日

Imagic: Text-Based Real Image Editing with Diffusion Models
Bahjat Kawar, Shiran Zada, Oran Lang, Omer Tov, Huiwen Chang, Tali Dekel, Inbar Mosseri, Michal Irani
CVPR 2023. [Paper] [Project]
2022 年 10 月 17 日

Leveraging Off-the-shelf Diffusion Model for Multi-attribute Fashion Image Manipulation
Chaerin Kong, DongHyeon Jeon, Ohjoon Kwon, Nojun Kwak
WACV 2022. [Paper]
2022 年 10 月 12 日

Unifying Diffusion Models' Latent Space, with Applications to CycleDiffusion and Guidance
Chen Henry Wu, Fernando De la Torre
arXiv 2022. [Paper] [Github-1] [Github-2]
2022 年 10 月 11 日

Imagen Video: High Definition Video Generation with Diffusion Models
Jonathan Ho, William Chan, Chitwan Saharia, Jay Whang, Ruiqi Gao, Alexey Gritsenko, Diederik P. Kingma, Ben Poole, Mohammad Norouzi, David J. Fleet, Tim Salimans
arXiv 2022. [Paper]
2022 年 10 月 5 日

DALL-E-Bot: Introducing Web-Scale Diffusion Models to Robotics
Ivan Kapelyukh, Vitalis Vosylius, Edward Johns
IEEE RA-L 2022. [Paper]
2022 年 10 月 5 日

LDEdit: Towards Generalized Text Guided Image Manipulation via Latent Diffusion Models
Paramanand Chandramouli, Kanchana Vaishnavi Gandikota
BMVC 2022. [Paper]
2022 年 10 月 5 日

clip2latent: Text driven sampling of a pre-trained StyleGAN using denoising diffusion and CLIP
Justin NM Pinkney, Chuan Li
BMVC 2022. [Paper] [Github]
2022 年 10 月 5 日

Membership Inference Attacks Against Text-to-image Generation Models
Yixin Wu, Ning Yu, Zheng Li, Michael Backes, Yang Zhang
arXiv 2022. [Paper]
2022 年 10 月 3 日

Make-A-Video: Text-to-Video Generation without Text-Video Data
Uriel Singer, Adam Polyak, Thomas Hayes, Xi Yin, Jie An, Songyang Zhang, Qiyuan Hu, Harry Yang, Oron Ashual, Oran Gafni, Devi Parikh, Sonal Gupta, Yaniv Taigman
arXiv 2022. [Paper]
2022 年 9 月 29 日

DreamFusion: Text-to-3D using 2D Diffusion
Ben Poole, Ajay Jain, Jonathan T. Barron, Ben Mildenhall
arXiv 2022. [Paper] [Github]
2022 年 9 月 29 日

Re-Imagen: Retrieval-Augmented Text-to-Image Generator
Wenhu Chen, Hexiang Hu, Chitwan Saharia, William W. Cohen
arXiv 2022. [Paper]
2022 年 9 月 29 日

使用潜在扩散模型进行创意绘画
Xianchao Wu
arXiv 2022. [Paper]
2022 年 9 月 29 日

Draw Your Art Dream: Diverse Digital Art Synthesis with Multimodal Guided Diffusion
Nisha Huang, Fan Tang, Weiming Dong, Changsheng Xu
ACM MM 2022. [Paper] [Github]
2022 年 9 月 27 日

Personalizing Text-to-Image Generation via Aesthetic Gradients
Victor Gallego
NeurIPS Workshop 2022. [Paper] [Github]
2022 年 9 月 25 日

Best Prompts for Text-to-Image Models and How to Find Them
Nikita Pavlichenko, Dmitry Ustalov
NeurIPS Workshop 2022. [Paper]
2022 年 9 月 23 日

The Biased Artist: Exploiting Cultural Biases via Homoglyphs in Text-Guided Image Generation Models
Lukas Struppek, Dominik Hintersdorf, Kristian Kersting
arXiv 2022. [Paper] [Github]
2022 年 9 月 19 日

Generative Visual Prompt: Unifying Distributional Control of Pre-Trained Generative Models
Chen Henry Wu, Saman Motamed, Shaunak Srivastava, Fernando De la Torre
NeurIPS 2022. [Paper] [Github]
2022 年 9 月 14 日

ISS: Image as Stepping Stone for Text-Guided 3D Shape Generation
Zhengzhe Liu, Peng Dai, Ruihui Li, Xiaojuan Qi, Chi-Wing Fu
ICLR 2023. [Paper] [Github]
2022 年 9 月 9 日

DreamBooth：微调文本到图像的扩散模型以实现主题驱动的生成
Nataniel Ruiz, Yuanzhen Li, Varun Jampani, Yael Pritch, Michael Rubinstein, Kfir Aberman
CVPR 2023. [Paper] [Project] [Github]
2022 年 8 月 25 日

Text-Guided Synthesis of Artistic Images with Retrieval-Augmented Diffusion Models
Robin Rombach, Andreas Blattmann, Björn Ommer
arXiv 2022. [Paper] [Github]
2022 年 7 月 26 日

Discrete Contrastive Diffusion for Cross-Modal and Conditional Generation
Ye Zhu, Yu Wu, Kyle Olszewski, Jian Ren, Sergey Tulyakov, Yan Yan
ICLR 2023. [Paper] [Github]
2022 年 6 月 15 日

Blended Latent Diffusion
Omri Avrahami, Ohad Fried, Dani Lischinski
ACM 2022. [Paper] [Project] [Github]
2022 年 6 月 6 日

Compositional Visual Generation with Composable Diffusion Models
Nan Liu, Shuang Li, Yilun Du, Antonio Torralba, Joshua B. Tenenbaum
ECCV 2022. [Paper] [Project] [Github]
2022 年 6 月 3 日

DiVAE: Photorealistic Images Synthesis with Denoising Diffusion Decoder
Jie Shi, Chenfei Wu, Jian Liang, Xiang Liu, Nan Duan
arXiv 2022. [Paper]
2022 年 6 月 1 日

Improved Vector Quantized Diffusion Models
Zhicong Tang, Shuyang Gu, Jianmin Bao, Dong Chen, Fang Wen
arXiv 2022. [Paper] [Github]
2022 年 5 月 31 日

Text2Human: Text-Driven Controllable Human Image Generation
Yuming Jiang, Shuai Yang, Haonan Qiu, Wayne Wu, Chen Change Loy, Ziwei Liu
ACM 2022. [Paper] [Github]
2022 年 5 月 31 日

具有深度语言理解的真实感文本到图像扩散模型
Chitwan Saharia, William Chan, Saurabh Saxena, Lala Li, Jay Whang, Emily Denton, Seyed Kamyar Seyed Ghasemipour, Burcu Karagol Ayan, S. Sara Mahdavi, Rapha Gontijo Lopes, Tim Salimans, Jonathan Ho, David J Fleet, Mohammad Norouzi
NeurIPS 2022. [Paper] [Github]
2022 年 5 月 23 日

Retrieval-Augmented Diffusion Models
Andreas Blattmann, Robin Rombach, Kaan Oktay, Björn Ommer
NeurIPS 2022. [Paper] [Github]
2022 年 4 月 25 日

Hierarchical Text-Conditional Image Generation with CLIP Latents
Aditya Ramesh, Prafulla Dhariwal, Alex Nichol, Casey Chu, Mark Chen
arXiv 2022. [Paper] [Github]
2022 年 4 月 13 日

KNN-Diffusion: Image Generation via Large-Scale Retrieval
Oron Ashual, Shelly Sheynin, Adam Polyak, Uriel Singer, Oran Gafni, Eliya Nachmani, Yaniv Taigman
ICLR 2023. [Paper]
2022 年 4 月 6 日

High-Resolution Image Synthesis with Latent Diffusion Models
Robin Rombach, Andreas Blattmann, Dominik Lorenz, Patrick Esser, Björn Ommer
CVPR 2022. [Paper] [Github]
2021 年 12 月 20 日

更多免费控制！ Image Synthesis with Semantic Diffusion Guidance
Xihui Liu, Dong Huk Park, Samaneh Azadi, Gong Zhang, Arman Chopikyan, Yuxiao Hu, Humphrey Shi, Anna Rohrbach, Trevor Darrell
WACV 2021. [Paper] [Project]
2021 年 12 月 10 日

Vector Quantized Diffusion Model for Text-to-Image Synthesis
Shuyang Gu, Dong Chen, Jianmin Bao, Fang Wen, Bo Zhang, Dongdong Chen, Lu Yuan, Baining Guo
CVPR 2022. [Paper] [Github]
2021 年 11 月 29 日

Blended Diffusion for Text-driven Editing of Natural Images
Omri Avrahami, Dani Lischinski, Ohad Fried
CVPR 2022. [Paper] [Project] [Github]
2021 年 11 月 29 日

Tackling the Generative Learning Trilemma with Denoising Diffusion GANs
Zhisheng Xiao, Karsten Kreis, Arash Vahdat
ICLR 2022 (Spotlight). [论文] [项目]
2021 年 12 月 15 日

DiffusionCLIP: Text-guided Image Manipulation Using Diffusion Models
Gwanghyun Kim, Jong Chul Ye
CVPR 2022. [Paper] [Github]
2021 年 10 月 6 日

3D视觉

Text-to-3D with Classifier Score Distillation
Xin Yu, Yuan-Chen Guo, Yangguang Li, Ding Liang, Song-Hai Zhang, Xiaojuan Qi
arXiv 2023. [Paper]
2023 年 10 月 30 日

Controllable Group Choreography using Contrastive Diffusion
Nhat Le, Tuong Do, Khoa Do, Hien Nguyen, Erman Tjiputra, Quang D. Tran, Anh Nguyen
ACM ToG 2023. [Paper]
2023 年 10 月 29 日

SE(3) Diffusion Model-based Point Cloud Registration for Robust 6D Object Pose Estimation
Haobo Jiang, Mathieu Salzmann, Zheng Dang, Jin Xie, Jian Yang
arXiv 2023. [Paper]
2023 年 10 月 26 日

6-DoF Stability Field via Diffusion Models
Takuma Yoneda, Tianchong Jiang, Gregory Shakhnarovich, Matthew R. Walter
arXiv 2023. [Paper]
2023 年 10 月 26 日

DreamCraft3D: Hierarchical 3D Generation with Bootstrapped Diffusion Prior
Jingxiang Sun, Bo Zhang, Ruizhi Shao, Lizhen Wang, Wen Liu, Zhenda Xie, Yebin Liu
arXiv 2023. [Paper]
2023 年 10 月 25 日

DiffRef3D: A Diffusion-based Proposal Refinement Framework for 3D Object Detection
Se-Ho Kim, Inyong Koo, Inyoung Lee, Byeongjun Park, Changick Kim
arXiv 2023. [Paper]
2023 年 10 月 25 日

iNVS: Repurposing Diffusion Inpainters for Novel View Synthesis
Yash Kant, Aliaksandr Siarohin, Michael Vasilkovsky, Riza Alp Guler, Jian Ren, Sergey Tulyakov, Igor Gilitschenski
SIGGRAPH ASIA 2023. [Paper] [Project]
2023 年 10 月 24 日

Wonder3D：使用跨域扩散将单图像转为 3D
Xiaoxiao Long, Yuan-Chen Guo, Cheng Lin, Yuan Liu, Zhiyang Dou, Lingjie Liu, Yuexin Ma, Song-Hai Zhang, Marc Habermann, Christian Theobalt, Wenping Wang
arXiv 2023. [Paper]
2023 年 10 月 23 日

MAS: Multi-view Ancestral Sampling for 3D motion generation using 2D diffusion
Roy Kapon, Guy Tevet, Daniel Cohen-Or, Amit H. Bermano
arXiv 2023. [Paper]
2023 年 10 月 23 日

High-Quality 3D Face Reconstruction with Affine Convolutional Networks
Zhiqian Lin, Jiangke Lin, Lincheng Li, Yi Yuan, Zhengxia Zou
arXiv 2023. [Paper]
2023 年 10 月 22 日

TexFusion: Synthesizing 3D Textures with Text-Guided Image Diffusion Models
Tianshi Cao, Karsten Kreis, Sanja Fidler, Nicholas Sharp, Kangxue Yin
arXiv 2023. [Paper]
2023 年 10 月 20 日

Conditional Generative Modeling for Images, 3D Animations, and Video
Vikram Voleti
arXiv 2023. [Paper]
2023 年 10 月 19 日

TapMo: Shape-aware Motion Generation of Skeleton-free Characters
Jiaxu Zhang, Shaoli Huang, Zhigang Tu, Xin Chen, Xiaohang Zhan, Gang Yu, Ying Shan
arXiv 2023. [Paper]
2023 年 10 月 19 日

Enhancing High-Resolution 3D Generation through Pixel-wise Gradient Clipping
Zijie Pan, Jiachen Lu, Xiatian Zhu, Li Zhang
arXiv 2023. [Paper]
2023 年 10 月 19 日

3D Structure-guided Network for Tooth Alignment in 2D Photograph
Yulong Dou, Lanzhuju Mei, Dinggang Shen, Zhiming Cui
arXiv 2023. [Paper]
2023 年 10 月 17 日

DynVideo-E: Harnessing Dynamic NeRF for Large-Scale Motion- and View-Change Human-Centric Video Editing
Jia-Wei Liu, Yan-Pei Cao, Jay Zhangjie Wu, Weijia Mao, Yuchao Gu, Rui Zhao, Jussi Keppo, Ying Shan, Mike Zheng Shou
arXiv 2023. [Paper]
2023 年 10 月 16 日

ConsistNet: Enforcing 3D Consistency for Multi-view Images Diffusion
Jiayu Yang, Ziang Cheng, Yunfei Duan, Pan Ji, Hongdong Li
arXiv 2023. [Paper]
2023 年 10 月 16 日

OmniControl: Control Any Joint at Any Time for Human Motion Generation
Yiming Xie, Varun Jampani, Lei Zhong, Deqing Sun, Huaizu Jiang
arXiv 2023. [Paper] [Project]
2023 年 10 月 12 日

Consistent123: Improve Consistency for One Image to 3D Object Synthesis
Haohan Weng, Tianyu Yang, Jianan Wang, Yu Li, Tong Zhang, CL Philip Chen, Lei Zhang
arXiv 2023. [Paper] [Project]
2023 年 10 月 12 日

What Does Stable Diffusion Know about the 3D Scene?
Guanqi Zhan, Chuanxia Zheng, Weidi Xie, Andrew Zisserman
arXiv 2023. [Paper]
2023 年 10 月 10 日

HiFi-123: Towards High-fidelity One Image to 3D Content Generation
Wangbo Yu, Li Yuan, Yan-Pei Cao, Xiangjun Gao, Xiaoyu Li, Long Quan, Ying Shan, Yonghong Tian
arXiv 2023. [Paper]
2023 年 10 月 10 日

DragD3D: Vertex-based Editing for Realistic Mesh Deformations using 2D Diffusion Priors
Tianhao Xie, Eugene Belilovsky, Sudhir Mudur, Tiberiu Popa
arXiv 2023. [Paper]
2023 年 10 月 6 日

Ctrl-Room: Controllable Text-to-3D Room Meshes Generation with Layout Constraints
Chuan Fang, Xiaotao Hu, Kunming Luo, Ping Tan
arXiv 2023. [Paper]
2023 年 10 月 5 日

FreeReg: Image-to-Point Cloud Registration Leveraging Pretrained Diffusion Models and Monocular Depth Estimators
Haiping Wang, Yuan Liu, Bing Wang, Yujing Sun, Zhen Dong, Wenping Wang, Bisheng Yang
arXiv 2023. [Paper]
2023 年 10 月 5 日

Consistent-1-to-3: Consistent Image to 3D View Synthesis via Geometry-aware Diffusion Models
Jianglong Ye, Peng Wang, Kejie Li, Yichun Shi, Heng Wang
arXiv 2023. [Paper] [Project]
2023 年 10 月 4 日

Efficient-3DiM: Learning a Generalizable Single-image Novel-view Synthesizer in One Day
Yifan Jiang, Hao Tang, Jen-Hao Rick Chang, Liangchen Song, Zhangyang Wang, Liangliang Cao
arXiv 2023. [Paper]
2023 年 10 月 4 日

ED-NeRF: Efficient Text-Guided Editing of 3D Scene using Latent Space NeRF
Jangho Park, Gihyun Kwon, Jong Chul Ye
arXiv 2023. [Paper]
2023 年 10 月 4 日

MagicDrive: Street View Generation with Diverse 3D Geometry Control
Ruiyuan Gao, Kai Chen, Enze Xie, Lanqing Hong, Zhenguo Li, Dit-Yan Yeung, Qiang Xu
arXiv 2023. [Paper] [Project]
2023 年 10 月 4 日

SweetDreamer: Aligning Geometric Priors in 2D Diffusion for Consistent Text-to-3D
Weiyu Li, Rui Chen, Xuelin Chen, Ping Tan
arXiv 2023. [Paper] [Project]
2023 年 10 月 4 日

Hierarchical Generation of Human-Object Interactions with Diffusion Probabilistic Models
Huaijin Pi, Sida Peng, Minghui Yang, Xiaowei Zhou, Hujun Bao
arXiv 2023. [Paper] [Project] [Github]
2023 年 10 月 3 日

HumanNorm: Learning Normal Diffusion Model for High-quality and Realistic 3D Human Generation
Xin Huang, Ruizhi Shao, Qi Zhang, Hongwen Zhang, Ying Feng, Yebin Liu, Qing Wang
arXiv 2023. [Paper] [Project]
2023 年 10 月 2 日

Diffusion Posterior Illumination for Ambiguity-aware Inverse Rendering
Linjie Lyu, Ayush Tewari, Marc Habermann, Shunsuke Saito, Michael Zollhöfer, Thomas Leimkühler, Christian Theobalt
arXiv 2023. [Paper]
2023 年 9 月 30 日

EPiC-ly Fast Particle Cloud Generation with Flow-Matching and Diffusion
Erik Buhmann, Cedric Ewen, Darius A. Faroughy, Tobias Golling, Gregor Kasieczka, Matthew Leigh, Guillaume Quétant, John Andrew Raine, Debajyoti Sengupta, David Shih
arXiv 2023. [Paper]
2023 年 9 月 29 日

Consistent123: One Image to Highly Consistent 3D Asset Using Case-Aware Diffusion Priors
Yukang Lin, Haonan Han, Chaoqun Gong, Zunnan Xu, Yachao Zhang, Xiu Li
arXiv 2023. [Paper]
2023 年 9 月 29 日

Object Motion Guided Human Motion Synthesis
Jiaman Li, Jiajun Wu, C. Karen Liu
arXiv 2023. [Paper]
2023 年 9 月 28 日

ITEM3D: Illumination-Aware Directional Texture Editing for 3D Models
Shengqi Liu, Zhuo Chen, Jingnan Gao, Yichao Yan, Wenhan Zhu, Xiaobo Li, Ke Gao, Jiangjing Lyu, Xiaokang Yang
arXiv 2023. [Paper]
2023 年 9 月 26 日

Light Field Diffusion for Single-View Novel View Synthesis
Yifeng Xiong, Haoyu Ma, Shanlin Sun, Kun Han, Xiaohui Xie
arXiv 2023. [Paper]
2023 年 9 月 20 日

Latent Diffusion Models for Structural Component Design
Ethan Herron, Jaydeep Rade, Anushrut Jignasu, Baskar Ganapathysubramanian, Aditya Balu, Soumik Sarkar, Adarsh Krishnamurthy
arXiv 2023. [Paper]
2023 年 9 月 20 日

FaceDiffuser: Speech-Driven 3D Facial Animation Synthesis Using Diffusion
Stefan Stan, Kazi Injamamul Haque, Zerrin Yumak
arXiv 2023. [Paper]
2023 年 9 月 20 日

TwinTex: Geometry-aware Texture Generation for Abstracted 3D Architectural Models
Weidan Xiong, Hongqian Zhang, Botao Peng, Ziyu Hu, Yongli Wu, Jianwei Guo, Hui Huang
SIGGRAPH ASIA 2023. [Paper]
2023 年 9 月 20 日

Language-Conditioned Affordance-Pose Detection in 3D Point Clouds
Toan Nguyen, Minh Nhat Vu, Baoru Huang, Tuan Van Vo, Vy Truong, Ngan Le, Thieu Vo, Bac Le, Anh Nguyen
arXiv 2023. [Paper]
2023 年 9 月 19 日

Large Intestine 3D Shape Refinement Using Point Diffusion Models for Digital Phantom Generation
Kaouther Mouheb, Mobina Ghojogh Nejad, Lavsen Dahal, Ehsan Samei, W. Paul Segars, Joseph Y. Lo
arXiv 2023. [Paper]
2023 年 9 月 15 日

Unsupervised Disentangling of Facial Representations with 3D-aware Latent Diffusion Models
Ruian He, Zhen Xing, Weimin Tan, Bo Yan
arXiv 2023. [Paper]
2023 年 9 月 15 日

M3Dsynth: A dataset of medical 3D images with AI-generated local manipulations
Giada Zingarini, Davide Cozzolino, Riccardo Corvi, Giovanni Poggi, Luisa Verdoliva
arXiv 2023. [Paper]
2023 年 9 月 14 日

Large-Vocabulary 3D Diffusion Model with Transformer
Ziang Cao, Fangzhou Hong, Tong Wu, Liang Pan, Ziwei Liu
arXiv 2023. [Paper] [Project] [Github]
2023 年 9 月 14 日

UnifiedGesture: A Unified Gesture Synthesis Model for Multiple Skeletons
Sicheng Yang, Zilin Wang, Zhiyong Wu, Minglei Li, Zhensong Zhang, Qiaochu Huang, Lei Hao, Songcen Xu, Xiaofei Wu, changpeng yang, Zonghong Dai
ACM MM 2023. [Paper]
2023 年 9 月 13 日

Fg-T2M: Fine-Grained Text-Driven Human Motion Generation via Diffusion Model
Yin Wang, Zhiying Leng, Frederick WB Li, Shun-Cheng Wu, Xiaohui Liang
ICCV 2023. [Paper]
2023 年 9 月 12 日

SADIR: Shape-Aware Diffusion Models for 3D Image Reconstruction
Nivetha Jayakumar, Tonmoy Hossain, Miaomiao Zhang
arXiv 2023. [Paper]
2023 年 9 月 6 日

MCM: Multi-condition Motion Synthesis Framework for Multi-scenario
Zeyu Ling, Bo Han, Yongkang Wong, Mohan Kangkanhalli, Weidong Geng
arXiv 2023. [Paper]
2023 年 9 月 6 日

DiverseMotion: Towards Diverse Human Motion Generation via Discrete Diffusion
Yunhong Lou, Linchao Zhu, Yaxiong Wang, Xiaohan Wang, Yi Yang
AAAI 2024. [Paper]
2023 年 9 月 4 日

BuilDiff: 3D Building Shape Generation using Single-Image Conditional Point Cloud Diffusion Models
Yao Wei, George Vosselman, Michael Ying Yang
ICCV Workshop 2023. [Paper]
2023 年 8 月 31 日

MVDream: Multi-view Diffusion for 3D Generation
Yichun Shi, Peng Wang, Jianglong Ye, Mai Long, Kejie Li, Xiao Yang
arXiv 2023. [Paper]
2023 年 8 月 31 日

Diffusion Inertial Poser: Human Motion Reconstruction from Arbitrary Sparse IMU Configurations
Tom Van Wouwe, Seunghwan Lee, Antoine Falisse, Scott Delp, C. Karen Liu
arXiv 2023. [Paper]
2023 年 8 月 31 日

InterDiff: Generating 3D Human-Object Interactions with Physics-Informed Diffusion
Sirui Xu, Zhengyuan Li, Yu-Xiong Wang, Liang-Yan Gui
ICCV 2023. [Paper] [Project] [Github]
2023 年 8 月 31 日

Priority-Centric Human Motion Generation in Discrete Latent Space
Hanyang Kong, Kehong Gong, Dongze Lian, Michael Bi Mi, Xinchao Wang
arXiv 2023. [Paper]
2023 年 8 月 28 日

HoloFusion: Towards Photo-realistic 3D Generative Modeling
Animesh Karnewar, Niloy J. Mitra, Andrea Vedaldi, David Novotny
ICCV 2023. [Paper] [Project]
2023 年 8 月 28 日

Unaligned 2D to 3D Translation with Conditional Vector-Quantized Code Diffusion using Transformers
Abril Corona-Figueroa, Sam Bond-Taylor, Neelanjan Bhowmik, Yona Falinie A. Gaus, Toby P. Breckon, Hubert PH Shum, Chris G. Willcocks
ICCV 2023. [Paper]
2023 年 8 月 27 日

Sparse3D: Distilling Multiview-Consistent Diffusion for Object Reconstruction from Sparse Views
Zi-Xin Zou, Weihao Cheng, Yan-Pei Cao, Shi-Sheng Huang, Ying Shan, Song-Hai Zhang
arXiv 2023. [Paper]
2023 年 8 月 27 日

Multi-plane denoising diffusion-based dimensionality expansion for 2D-to-3D reconstruction of microstructures with harmonized sampling
Kang-Hyun Lee, Gun Jin Yun
arXiv 2023. [Paper]
2023 年 8 月 27 日

Distribution-Aligned Diffusion for Human Mesh Recovery
Lin Geng Foo, Jia Gong, Hossein Rahmani, Jun Liu
ICCV 2023. [Paper] [Project]
2023 年 8 月 25 日

DF-3DFace: One-to-Many Speech Synchronized 3D Face Animation with Diffusion
Se Jin Park, Joanna Hong, Minsu Kim, Yong Man Ro
arXiv 2023. [Paper]
2023 年 8 月 23 日

LongDanceDiff: Long-term Dance Generation with Conditional Diffusion Model
Siqi Yang, Zejun Yang, Zhisheng Wang
arXiv 2023. [Paper]
2023 年 8 月 23 日

Texture Generation on 3D Meshes with Point-UV Diffusion
Xin Yu, Peng Dai, Wenbo Li, Lan Ma, Zhengzhe Liu, Xiaojuan Qi
ICCV 2023. [Paper]
2023 年 8 月 21 日

Physics-Guided Human Motion Capture with Pose Probability Modeling
Jingyi Ju, Buzhen Huang, Chen Zhu, Zhihao Li, Yangang Wang
IJCAI 2023. [Paper] [Github]
2023 年 8 月 19 日

Unsupervised 3D Pose Estimation with Non-Rigid Structure-from-Motion Modeling
Haorui Ji, Hui Deng, Yuchao Dai, Hongdong Li
arXiv 2023. [Paper]
2023 年 8 月 18 日

MATLABER: Material-Aware Text-to-3D via LAtent BRDF auto-EncodeR
Xudong Xu, Zhaoyang Lyu, Xingang Pan, Bo Dai
arXiv 2023. [Paper] [Project]
2023 年 8 月 18 日

O^2-Recon: Completing 3D Reconstruction of Occluded Objects in the Scene with a Pre-trained 2D Diffusion Model
Yubin Hu, Sheng Ye, Wang Zhao, Matthieu Lin, Yuze He, Yu-Hui Wen, Ying He, Yong-Jin Liu
arXiv 2023. [Paper]
2023 年 8 月 18 日

Denoising Diffusion for 3D Hand Pose Estimation from Images
Maksym Ivashechkin, Oscar Mendez, Richard Bowden
arXiv 2023. [Paper]
2023 年 8 月 18 日

PoSynDA: Multi-Hypothesis Pose Synthesis Domain Adaptation for Robust 3D Human Pose Estimation
Hanbing Liu, Jun-Yan He, Zhi-Qi Cheng, Wangmeng Xiang, Qize Yang, Wenhao Chai, Gaoang Wang, Xu Bao, Bin Luo, Yifeng Geng, Xuansong Xie
ACM MM 2023. [Paper] [Github]
2023 年 8 月 18 日

Guide3D: Create 3D Avatars from Text and Image Guidance
Yukang Cao, Yan-Pei Cao, Kai Han, Ying Shan, Kwan-Yee K. Wong
arXiv 2023. [Paper]
2023 年 8 月 18 日

HumanLiff: Layer-wise 3D Human Generation with Diffusion Model
Shoukang Hu, Fangzhou Hong, Tao Hu, Liang Pan, Haiyi Mei, Weiye Xiao, Lei Yang, Ziwei Liu
arXiv 2023. [Paper] [Project]
2023 年 8 月 18 日

TeCH: Text-guided Reconstruction of Lifelike Clothed Humans
Yangyi Huang, Hongwei Yi, Yuliang Xiu, Tingting Liao, Jiaxiang Tang, Deng Cai, Justus Thies
arXiv 2023. [Paper] [Project] [Github]
2023 年 8 月 16 日

CCD-3DR: Consistent Conditioning in Diffusion for Single-Image 3D Reconstruction
Yan Di, Chenyangguang Zhang, Pengyuan Wang, Guangyao Zhai, Ruida Zhang, Fabian Manhardt, Benjamin Busam, Xiangyang Ji, Federico Tombari
arXiv 2023. [Paper]
2023 年 8 月 15 日

3D Scene Diffusion Guidance using Scene Graphs
Mohammad Naanaa, Katharina Schmid, Yinyu Nie
arXiv 2023. [Paper]
2023 年 8 月 8 日

Generative Approach for Probabilistic Human Mesh Recovery using Diffusion Models
Hanbyel Cho, Junmo Kim
ICCV Workshop 2023. [Paper] [Github]
2023 年 8 月 5 日

DiffDance: Cascaded Human Motion Diffusion Model for Dance Generation
Qiaosong Qi, Le Zhuo, Aixi Zhang, Yue Liao, Fei Fang, Si Liu, Shuicheng Yan
ACM MM 2023. [Paper]
2023 年 8 月 5 日

Sketch and Text Guided Diffusion Model for Colored Point Cloud Generation
Zijie Wu, Yaonan Wang, Mingtao Feng, He Xie, Ajmal Mian
arXiv 2023. [Paper]
2023 年 8 月 5 日

On the Transition from Neural Representation to Symbolic Knowledge
Junyan Cheng, Peter Chin
arXiv 2023. [Paper]
2023 年 8 月 3 日

Synthesizing Long-Term Human Motions with Diffusion Models via Coherent Sampling
Zhao Yang, Bing Su, Ji-Rong Wen
ACM MM 2023. [Paper] [Github]
2023 年 8 月 3 日

TransFusion: A Practical and Effective Transformer-based Diffusion Model for 3D Human Motion Prediction
Sibo Tian, Minghui Zheng, Xiao Liang
arXiv 2023. [Paper]
2023 年 7 月 30 日

TEDi: Temporally-Entangled Diffusion for Long-Term Motion Synthesis
Zihan Zhang, Richard Liu, Kfir Aberman, Rana Hanocka
arXiv 2023. [Paper]
2023 年 7 月 27 日

Fake It Without Making It: Conditioned Face Generation for Accurate 3D Face Shape Estimation
Will Rowan, Patrik Huber, Nick Pears, Andrew Keeling
arXiv 2023. [Paper]
2023 年 7 月 25 日

NIFTY: Neural Object Interaction Fields for Guided Human Motion Synthesis
Nilesh Kulkarni, Davis Rempe, Kyle Genova, Abhijit Kundu, Justin Johnson, David Fouhey, Leonidas Guibas
arXiv 2023. [Paper] [Project]
2023 年 7 月 14 日

AvatarFusion: Zero-shot Generation of Clothing-Decoupled 3D Avatars Using 2D Diffusion
Shuo Huang, Zongxin Yang, Liangting Li, Yi Yang, Jia Jia
arXiv 2023. [Paper]
2023 年 7 月 13 日

Articulated 3D Head Avatar Generation using Text-to-Image Diffusion Models
Alexander W. Bergman, Wang Yifan, Gordon Wetzstein
arXiv 2023. [Paper]
2023 年 7 月 10 日

Back to Optimization: Diffusion-based Zero-Shot 3D Human Pose Estimation
Zhongyu Jiang, Zhuoran Zhou, Lei Li, Wenhao Chai, Cheng-Yen Yang, Jenq-Neng Hwang
arXiv 2023. [Paper]
2023 年 7 月 7 日

AutoDecoding Latent 3D Diffusion Models
Evangelos Ntavelis, Aliaksandr Siarohin, Kyle Olszewski, Chaoyang Wang, Luc Van Gool, Sergey Tulyakov
arXiv 2023. [Paper]
2023 年 7 月 7 日

SVDM: Single-View Diffusion Model for Pseudo-Stereo 3D Object Detection
施玉光
arXiv 2023. [Paper]
2023 年 7 月 5 日

DiT-3D: Exploring Plain Diffusion Transformers for 3D Shape Generation
Shentong Mo, Enze Xie, Ruihang Chu, Lewei Yao, Lanqing Hong, Matthias Nießner, Zhenguo Li
arXiv 2023. [Paper]
4 Jul 2023

Magic123: One Image to High-Quality 3D Object Generation Using Both 2D and 3D Diffusion Priors
Guocheng Qian, Jinjie Mai, Abdullah Hamdi, Jian Ren, Aliaksandr Siarohin, Bing Li, Hsin-Ying Lee, Ivan Skorokhodov, Peter Wonka, Sergey Tulyakov, Bernard Ghanem
arXiv 2023. [Paper] [Project]
2023 年 6 月 30 日

DiffComplete: Diffusion-based Generative 3D Shape Completion
Ruihang Chu, Enze Xie, Shentong Mo, Zhenguo Li, Matthias Nießner, Chi-Wing Fu, Jiaya Jia
arXiv 2023. [Paper]
2023 年 6 月 28 日

DreamTime: An Improved Optimization Strategy for Text-to-3D Content Creation
Yukun Huang, Jianan Wang, Yukai Shi, Xianbiao Qi, Zheng-Jun Zha, Lei Zhang
arXiv 2023. [Paper]
2023 年 6 月 21 日

Point-Cloud Completion with Pretrained Text-to-image Diffusion Models
Yoni Kasten, Ohad Rahamim, Gal Chechik
arXiv 2023. [Paper]
2023 年 6 月 18 日

AvatarBooth: High-Quality and Customizable 3D Human Avatar Generation
Yifei Zeng, Yuanxun Lu, Xinya Ji, Yao Yao, Hao Zhu, Xun Cao
arXiv 2023. [Paper]
2023 年 6 月 16 日

Edit-DiffNeRF: Editing 3D Neural Radiance Fields using 2D Diffusion Model
Lu Yu, Wei Xiang, Kang Han
arXiv 2023. [Paper]
2023 年 6 月 15 日

Adding 3D Geometry Control to Diffusion Models
Wufei Ma, Qihao Liu, Jiahao Wang, Angtian Wang, Yaoyao Liu, Adam Kortylewski, Alan Yuille
arXiv 2023. [Paper]
2023 年 6 月 13 日

Viewset Diffusion: (0-)Image-Conditioned 3D Generative Models from 2D Data
Stanislaw Szymanowicz, Christian Rupprecht, Andrea Vedaldi
arXiv 2023. [Paper]
2023 年 6 月 13 日

3D molecule generation by denoising voxel grids
Pedro O. Pinheiro, Joshua Rackers, Joseph Kleinhenz, Michael Maser, Omar Mahmood, Andrew Martin Watkins, Stephen Ra, Vishnu Sresht, Saeed Saremi
arXiv 2023. [Paper]
2023 年 6 月 13 日

InstructP2P: Learning to Edit 3D Point Clouds with Text Instructions
Jiale Xu, Xintao Wang, Yan-Pei Cao, Weihao Cheng, Ying Shan, Shenghua Gao
arXiv 2023. [Paper]
2023 年 6 月 12 日

RePaint-NeRF: NeRF Editting via Semantic Masks and Diffusion Models
Xingchen Zhou, Ying He, F. Richard Yu, Jianqiang Li, You Li
arXiv 2023. [Paper]
2023 年 6 月 9 日

Stochastic Multi-Person 3D Motion Forecasting
Sirui Xu, Yu-Xiong Wang, Liang-Yan Gui
arXiv 2023. [Paper]
2023 年 6 月 8 日

ARTIC3D: Learning Robust Articulated 3D Shapes from Noisy Web Image Collections
Chun-Han Yao, Amit Raj, Wei-Chih Hung, Yuanzhen Li, Michael Rubinstein, Ming-Hsuan Yang, Varun Jampani
arXiv 2023. [Paper]
7 Jun 2023

Synthesizing realistic sand assemblies with denoising diffusion in latent space
Nikolaos N. Vlassis, WaiChing Sun, Khalid A. Alshibli, Richard A. Regueiro
arXiv 2023. [Paper]
7 Jun 2023

AvatarStudio: Text-driven Editing of 3D Dynamic Human Head Avatars
Mohit Mendiratta, Xingang Pan, Mohamed Elgharib, Kartik Teotia, Mallikarjun BR, Ayush Tewari, Vladislav Golyanik, Adam Kortylewski, Christian Theobalt
arXiv 2023. [Paper]
2023 年 6 月 1 日

DiffRoom: Diffusion-based High-Quality 3D Room Reconstruction and Generation
Xiaoliang Ju, Zhaoyang Huang, Yijin Li, Guofeng Zhang, Yu Qiao, Hongsheng Li
arXiv 2023. [Paper]
2023 年 6 月 1 日

Controllable Motion Diffusion Model
Yi Shi, Jingbo Wang, Xuekun Jiang, Bo Dai
arXiv 2023. [Paper] Project]
2023 年 6 月 1 日

FDNeRF: Semantics-Driven Face Reconstruction, Prompt Editing and Relighting with Diffusion Models
Hao Zhang, Yanbo Xu, Tianyuan Dai, Yu-Wing, Tai Chi-Keung Tang
arXiv 2023. [Paper]
2023 年 6 月 1 日

Learning Explicit Contact for Implicit Reconstruction of Hand-held Objects from Monocular Images
Junxing Hu, Hongwen Zhang, Zerui Chen, Mengcheng Li, Yunlong Wang, Yebin Liu, Zhenan Sun
arXiv 2023. [Paper] [Project]
2023 年 5 月 31 日

HiFA: High-fidelity Text-to-3D with Advanced Diffusion Guidance
Junzhe Zhu, Peiye Zhuang
arXiv 2023. [Paper]
2023 年 5 月 30 日

Conditional Diffusion Models for Semantic 3D Medical Image Synthesis
Zolnamar Dorjsembe, Hsing-Kuo Pao, Sodtavilan Odonchimed, Furen Xiao
arXiv 2023. [Paper]
2023 年 5 月 29 日

ZeroAvatar: Zero-shot 3D Avatar Generation from a Single Image
Zhenzhen Weng, Zeyu Wang, Serena Yeung
arXiv 2023. [Paper]
2023 年 5 月 25 日

NAP: Neural 3D Articulation Prior
Jiahui Lei, Congyue Deng, Bokui Shen, Leonidas Guibas, Kostas Daniilidis
arXiv 2023. [Paper] [Project]
2023 年 5 月 25 日

CommonScenes: Generating Commonsense 3D Indoor Scenes with Scene Graphs
Guangyao Zhai, Evin Pınar Örnek, Shun-Cheng Wu, Yan Di, Federico Tombari, Nassir Navab, Benjamin Busam
arXiv 2023. [Paper]
2023 年 5 月 25 日

DiffCLIP: Leveraging Stable Diffusion for Language Grounded 3D Classification
Sitian Shen, Zilin Zhu, Linqian Fan, Harry Zhang, Xinxiao Wu
arXiv 2023. [Paper]
2023 年 5 月 25 日

Confronting Ambiguity in 6D Object Pose Estimation via Score-Based Diffusion on SE(3)
Tsu-Ching Hsiao, Hao-Wei Chen, Hsuan-Kung Yang, Chun-Yi Lee
arXiv 2023. [Paper]
2023 年 5 月 25 日

Deceptive-NeRF: Enhancing NeRF Reconstruction using Pseudo-Observations from Diffusion Models
Xinhang Liu, Shiu-hong Kao, Jiaben Chen, Yu-Wing Tai, Chi-Keung Tang
arXiv 2023. [Paper]
2023 年 5 月 24 日

Manifold Diffusion Fields
Ahmed A. Elhag, Joshua M. Susskind, Miguel Angel Bautista
arXiv 2023. [Paper]
2023 年 5 月 24 日

Sin3DM: Learning a Diffusion Model from a Single 3D Textured Shape
Rundi Wu, Ruoshi Liu, Carl Vondrick, Changxi Zheng
arXiv 2023. [Paper] [Project] [Github]
2023 年 5 月 24 日

DiffHand: End-to-End Hand Mesh Reconstruction via Diffusion Models
Lijun Li, Li'an Zhuo, Bang Zhang, Liefeng Bo, Chen Chen
arXiv 2023. [Paper]
2023 年 5 月 23 日

GMD: Controllable Human Motion Synthesis via Guided Diffusion Models
Korrawe Karunratanakul, Konpat Preechakul, Supasorn Suwajanakorn, Siyu Tang
arXiv 2023. [Paper] [Project]
2023 年 5 月 21 日

Towards Globally Consistent Stochastic Human Motion Prediction via Motion Diffusion
Jiarui Sun, Girish Chowdhary
arXiv 2023. [Paper]
2023 年 5 月 21 日

Few-shot 3D Shape Generation
Jingyuan Zhu, Huimin Ma, Jiansheng Chen, Jian Yuan
arXiv 2023. [Paper]
2023 年 5 月 19 日

Chupa: Carving 3D Clothed Humans from Skinned Shape Priors using 2D Diffusion Probabilistic Models
Byungjun Kim, Patrick Kwon, Kwangho Lee, Myunggi Lee, Sookwan Han, Daesik Kim, Hanbyul Joo
arXiv 2023. [Paper] [Project]
2023 年 5 月 19 日

Text2NeRF: Text-Driven 3D Scene Generation with Neural Radiance Fields
Jingbo Zhang, Xiaoyu Li, Ziyu Wan, Can Wang, Jing Liao
arXiv 2023. [Paper]
2023 年 5 月 19 日

RoomDreamer: Text-Driven 3D Indoor Scene Synthesis with Coherent Geometry and Texture
Liangchen Song, Liangliang Cao, Hongyu Xu, Kai Kang, Feng Tang, Junsong Yuan, Yang Zhao
arXiv 2023. [Paper]
2023 年 5 月 18 日

Make-An-Animation: Large-Scale Text-conditional 3D Human Motion Generation
Samaneh Azadi, Akbar Shah, Thomas Hayes, Devi Parikh, Sonal Gupta
arXiv 2023. [Paper] [Project]
2023 年 5 月 16 日

FitMe: Deep Photorealistic 3D Morphable Model Avatars
Alexandros Lattas, Stylianos Moschoglou, Stylianos Ploumpis, Baris Gecer, Jiankang Deng, Stefanos Zafeiriou
CVPR 2023. [Paper] [Project]
2023 年 5 月 16 日

AMD: Autoregressive Motion Diffusion
Bo Han, Hao Peng, Minjing Dong, Chang Xu, Yi Ren, Yixuan Shen, Yuheng Li
arXiv 2023. [Paper]
2023 年 5 月 16 日

Text-guided High-definition Consistency Texture Model
Zhibin Tang, Tiantong He
arXiv 2023. [Paper]
2023 年 5 月 10 日

Relightify: Relightable 3D Faces from a Single Image via Diffusion Models
Foivos Paraperas Papantoniou, Alexandros Lattas, Stylianos Moschoglou, Stefanos Zafeiriou
arXiv 2023. [Paper] [Project]
2023 年 5 月 10 日

CaloClouds: Fast Geometry-Independent Highly-Granular Calorimeter Simulation
Erik Buhmann, Sascha Diefenbacher, Engin Eren, Frank Gaede, Gregor Kasieczka, Anatolii Korol, William Korcari, Katja Krüger, Peter McKeown
arXiv 2023. [Paper]
2023 年 5 月 8 日

Locally Attentional SDF Diffusion for Controllable 3D Shape Generation
Xin-Yang Zheng, Hao Pan, Peng-Shuai Wang, Xin Tong, Yang Liu, Heung-Yeung Shum
SIGGRAPH 2023. [Paper]
2023 年 5 月 8 日

DiffFacto: Controllable Part-Based 3D Point Cloud Generation with Cross Diffusion
Kiyohiro Nakayama, Mikaela Angelina Uy, Jiahui Huang, Shi-Min Hu, Ke Li, Leonidas J Guibas
arXiv 2023. [Paper] [Github]
2023 年 5 月 4 日

Shap-E: Generating Conditional 3D Implicit Functions
Heewoo Jun, Alex Nichol
arXiv 2023. [Paper] [Github] 3 May 2023

ContactArt: Learning 3D Interaction Priors for Category-level Articulated Object and Hand Poses Estimation
Zehao Zhu, Jiashun Wang, Yuzhe Qin, Deqing Sun, Varun Jampani, Xiaolong Wang
arXiv 2023. [Paper] [Project]
2023 年 5 月 2 日

DreamPaint: Few-Shot Inpainting of E-Commerce Items for Virtual Try-On without 3D Modeling
Mehmet Saygin Seyfioglu, Karim Bouyarmane, Suren Kumar, Amir Tavanaei, Ismail B. Tutar
arXiv 2023. [Paper]
2023 年 5 月 2 日

Learning a Diffusion Prior for NeRFs
Guandao Yang, Abhijit Kundu, Leonidas J. Guibas, Jonathan T. Barron, Ben Poole
ICLR Workshop 2023. [Paper]
2023 年 4 月 27 日

Nerfbusters: Removing Ghostly Artifacts from Casually Captured NeRFs
Frederik Warburg, Ethan Weber, Matthew Tancik, Aleksander Holynski, Angjoo Kanazawa
arXiv 2023. [Paper] [Project] [Github]
2023 年 4 月 20 日

Farm3D: Learning Articulated 3D Animals by Distilling 2D Diffusion
Tomas Jakab, Ruining Li, Shangzhe Wu, Christian Rupprecht, Andrea Vedaldi
arXiv 2023. [Paper] [Project]
2023 年 4 月 20 日

Anything-3D: Towards Single-view Anything Reconstruction in the Wild
Qiuhong Shen, Xingyi Yang, Xinchao Wang
arXiv 2023. [Paper]
2023 年 4 月 19 日

Avatars Grow Legs: Generating Smooth Human Motion from Sparse Tracking Inputs with Diffusion Model
Yuming Du, Robin Kips, Albert Pumarola, Sebastian Starke, Ali Thabet, Artsiom Sanakoyeu
CVPR 2023. [Paper] [Project] [Github]
2023 年 4 月 17 日

Towards Controllable Diffusion Models via Reward-Guided Exploration
Hengtong Zhang, Tingyang Xu
arXiv 2023. [Paper]
2023 年 4 月 14 日

Learning Controllable 3D Diffusion Models from Single-view Images
Jiatao Gu, Qingzhe Gao, Shuangfei Zhai, Baoquan Chen, Lingjie Liu, Josh Susskind
arXiv 2023. [Paper] [Project]
2023 年 4 月 13 日

Single-Stage Diffusion NeRF: A Unified Approach to 3D Generation and Reconstruction
Hansheng Chen, Jiatao Gu, Anpei Chen, Wei Tian, Zhuowen Tu, Lingjie Liu, Hao Su
arXiv 2023. [Paper] [Project]
2023 年 4 月 13 日

Probabilistic Human Mesh Recovery in 3D Scenes from Egocentric Views
Siwei Zhang, Qianli Ma, Yan Zhang, Sadegh Aliakbarian, Darren Cosker, Siyu Tang
arXiv 2023. [Paper] [Project]
2023 年 4 月 12 日

InterGen: Diffusion-based Multi-human Motion Generation under Complex Interactions
Han Liang, Wenqian Zhang, Wenxuan Li, Jingyi Yu, Lan Xu
arXiv 2023. [Paper] [Github]
2023 年 4 月 12 日

NeRF applied to satellite imagery for surface reconstruction
Federico Semeraro, Yi Zhang, Wenying Wu, Patrick Carroll
arXiv 2023. [Paper] [Github]
2023 年 4 月 9 日

DITTO-NeRF: Diffusion-based Iterative Text To Omni-directional 3D Model
Hoigi Seo, Hayeon Kim, Gwanghyun Kim, Se Young Chun
arXiv 2023. [Paper] [Project]
2023 年 4 月 6 日

Generative Novel View Synthesis with 3D-Aware Diffusion Models
Eric R. Chan, Koki Nagano, Matthew A. Chan, Alexander W. Bergman, Jeong Joon Park, Axel Levy, Miika Aittala, Shalini De Mello, Tero Karras, Gordon Wetzstein
arXiv 2023. [Paper] [Project]
2023 年 4 月 5 日

Trace and Pace: Controllable Pedestrian Animation via Guided Trajectory Diffusion
Davis Rempe, Zhengyi Luo, Xue Bin Peng, Ye Yuan, Kris Kitani, Karsten Kreis, Sanja Fidler, Or Litany
CVPR 2023. [Paper] [Github]
2023 年 4 月 4 日

Controllable Motion Synthesis and Reconstruction with Autoregressive Diffusion Models
Wenjie Yin, Ruibo Tu, Hang Yin, Danica Kragic, Hedvig Kjellström, Mårten Björkman
arXiv 2023. [Paper]
2023 年 4 月 3 日

DreamAvatar: Text-and-Shape Guided 3D Human Avatar Generation via Diffusion Models
Yukang Cao, Yan-Pei Cao, Kai Han, Ying Shan, Kwan-Yee K. Wong
arXiv 2023. [Paper]
2023 年 4 月 3 日

HOLODIFFUSION: Training a 3D Diffusion Model using 2D Images
Animesh Karnewar, Andrea Vedaldi, David Novotny, Niloy Mitra
CVPR 2023. [Paper] [Project]
2023 年 3 月 29 日

4D Facial Expression Diffusion Model
Kaifeng Zou, Sylvain Faisan, Boyang Yu, Sébastien Valette, Hyewon Seo
arXiv 2023. [Paper] [Github]
2023 年 3 月 29 日

Instruct 3D-to-3D: Text Instruction Guided 3D-to-3D conversion
Hiromichi Kamata, Yuiko Sakuma, Akio Hayakawa, Masato Ishii, Takuya Narihira
arXiv 2023. [Paper] [Project] [Github]
28 Mar 2023

Novel View Synthesis of Humans using Differentiable Rendering
Guillaume Rochette, Chris Russell, Richard Bowden
IEEE T-BIOM 2023. [Paper] [Github]
28 Mar 2023

Debiasing Scores and Prompts of 2D Diffusion for Robust Text-to-3D Generation
Susung Hong, Donghoon Ahn, Seungryong Kim
CVPR Workshop 2023. [Paper]
2023 年 3 月 27 日

Make-It-3D: High-Fidelity 3D Creation from A Single Image with Diffusion Prior
Junshu Tang, Tengfei Wang, Bo Zhang, Ting Zhang, Ran Yi, Lizhuang Ma, Dong Chen
arXiv 2023. [Paper] [Project] [Github]
2023 年 3 月 24 日

ISS++: Image as Stepping Stone for Text-Guided 3D Shape Generation
Zhengzhe Liu, Peng Dai, Ruihui Li, Xiaojuan Qi, Chi-Wing Fu
ICLR 2023. [Paper]
2023 年 3 月 24 日

Fantasia3D: Disentangling Geometry and Appearance for High-quality Text-to-3D Content Creation
Rui Chen, Yongwei Chen, Ningxin Jiao, Kui Jia
arXiv 2023. [Paper] [Project] [Github]
2023 年 3 月 24 日

DDT: A Diffusion-Driven Transformer-based Framework for Human Mesh Recovery from a Video
Ce Zheng, Guo-Jun Qi, Chen Chen
arXiv 2023. [Paper]
2023 年 3 月 23 日

Instruct-NeRF2NeRF: Editing 3D Scenes with Instructions
Ayaan Haque, Matthew Tancik, Alexei A. Efros, Aleksander Holynski, Angjoo Kanazawa
arXiv 2023. [Paper] [Project]
2023 年 3 月 22 日

FeatureNeRF: Learning Generalizable NeRFs by Distilling Foundation Models
Jianglong Ye, Naiyan Wang, Xiaolong Wang
arXiv 2023. [Paper] [Project]
2023 年 3 月 22 日

Vox-E: Text-guided Voxel Editing of 3D Objects
Etai Sella, Gal Fiebelman, Peter Hedman, Hadar Averbuch-Elor
arXiv 2023. [Paper] [Project]
2023 年 3 月 21 日

Compositional 3D Scene Generation using Locally Conditioned Diffusion
Ryan Po, Gordon Wetzstein
arXiv 2023. [Paper] [Github]
2023 年 3 月 21 日

Diffusion-Based 3D Human Pose Estimation with Multi-Hypothesis Aggregation
Wenkang Shan, Zhenhua Liu, Xinfeng Zhang, Zhao Wang, Kai Han, Shanshe Wang, Siwei Ma, Wen Gao
arXiv 2023. [Paper] [Github]
2023 年 3 月 21 日

3D-CLFusion: Fast Text-to-3D Rendering with Contrastive Latent Diffusion
Yu-Jhe Li, Kris Kitani
arXiv 2023. [Paper]
2023 年 3 月 21 日

Affordance Diffusion: Synthesizing Hand-Object Interactions
Yufei Ye, Xueting Li, Abhinav Gupta, Shalini De Mello, Stan Birchfield, Jiaming Song, Shubham Tulsiani, Sifei Liu
CVPR 2023. [Paper] [Project]
2023 年 3 月 21 日

SALAD: Part-Level Latent Diffusion for 3D Shape Generation and Manipulation
Juil Koo, Seungwoo Yoo, Minh Hieu Nguyen, Minhyuk Sung
arXiv 2023. [Paper] [Project]
2023 年 3 月 21 日

Learning a 3D Morphable Face Reflectance Model from Low-cost Data
Yuxuan Han, Zhibo Wang, Feng Xu
CVPR 2023. [Paper] [Project]
2023 年 3 月 21 日

Zero-1-to-3: Zero-shot One Image to 3D Object
Ruoshi Liu, Rundi Wu, Basile Van Hoorick, Pavel Tokmakov, Sergey Zakharov, Carl Vondrick
arXiv 2023. [Paper] [Project] [Github]
2023 年 3 月 20 日

SKED: Sketch-guided Text-based 3D Editing
Aryan Mikaeili, Or Perel, Daniel Cohen-Or, Ali Mahdavi-Amiri
arxiv 2023. [Paper]
2023 年 3 月 19 日

3DQD: Generalized Deep 3D Shape Prior via Part-Discretized Diffusion Process
Yuhan Li, Yishun Dou, Xuanhong Chen, Bingbing Ni, Yilin Sun, Yutian Liu, Fuzhen Wang
CVPR 2023. [Paper] [Github]
2023 年 3 月 18 日

驯服音频驱动的协同语音手势生成的扩散模型
Lingting Zhu, Xian Liu, Xuanyu Liu, Rui Qian, Ziwei Liu, Lequan Yu
CVPR 2023. [Paper] [Github]
2023 年 3 月 16 日

Diffusion-HPC: Generating Synthetic Images with Realistic Humans
Zhenzhen Weng, Laura Bravo-Sánchez, Serena Yeung
arXiv 2023. [Paper] [Github]
2023 年 3 月 16 日

DINAR: Diffusion Inpainting of Neural Textures for One-Shot Human Avatars
David Svitov, Dmitrii Gudkov, Renat Bashirov, Victor Lempitsky
arXiv 2023. [Paper]
2023 年 3 月 16 日

Controllable Mesh Generation Through Sparse Latent Point Diffusion Models
Zhaoyang Lyu, Jinyi Wang, Yuwei An, Ya Zhang, Dahua Lin, Bo Dai
CVPR 2023. [Paper] [Project]
2023 年 3 月 14 日

MeshDiffusion: Score-based Generative 3D Mesh Modeling
Zhen Liu, Yao Feng, Michael J. Black, Derek Nowrouzezahrai, Liam Paull, Weiyang Liu
ICLR 2023. [Paper] [Project] [Github]
2023 年 3 月 14 日

Point Cloud Diffusion Models for Automatic Implant Generation
Paul Friedrich, Julia Wolleb, Florentin Bieder, Florian M. Thieringer, Philippe C. Cattin
arXiv 2023. [Paper]
2023 年 3 月 14 日

GECCO: Geometrically-Conditioned Point Diffusion Models
Michał J. Tyszkiewicz, Pascal Fua, Eduard Trulls
arXiv 2023. [Paper]
2023 年 3 月 10 日

3DGen: Triplane Latent Diffusion for Textured Mesh Generation
Anchit Gupta, Wenhan Xiong, Yixin Nie, Ian Jones, Barlas Oğuz
arXiv 2023. [Paper]
2023 年 3 月 9 日

Human Motion Diffusion as a Generative Prior
Yonatan Shafir, Guy Tevet, Roy Kapon, Amit H. Bermano
arXiv 2023. [Paper]
2023 年 3 月 2 日

Can We Use Diffusion Probabilistic Models for 3D Motion Prediction?
Hyemin Ahn, Esteve Valls Mascaro, Dongheui Lee
ICRA 2023. [Paper] [Project] [Github]
2023 年 2 月 28 日

DiffusioNeRF: Regularizing Neural Radiance Fields with Denoising Diffusion Models
Jamie Wynn, Daniyar Turmukhambetov
CVPR 2023. [Paper] [Github] [Github]
2023 年 2 月 23 日

PC2: Projection-Conditioned Point Cloud Diffusion for Single-Image 3D Reconstruction
Luke Melas-Kyriazi, Christian Rupprecht, Andrea Vedaldi
arXiv 2023. [Paper] Project]
2023 年 2 月 23 日

NerfDiff: Single-image View Synthesis with NeRF-guided Distillation from 3D-aware Diffusion
Jiatao Gu, Alex Trevithick, Kai-En Lin, Josh Susskind, Christian Theobalt, Lingjie Liu, Ravi Ramamoorthi
ICML 2023. [Paper] [Github]
2023 年 2 月 20 日

SinMDM: Single Motion Diffusion
Sigal Raab, Inbal Leibovitch, Guy Tevet, Moab Arar, Amit H. Bermano, Daniel Cohen-Or
arXiv 2023. [Paper] [Project] [Github]
2023 年 2 月 12 日

3D Colored Shape Reconstruction from a Single RGB Image through Diffusion
Bo Li, Xiaolin Wei, Fengwei Chen, Bin Liu
arXiv 2023. [Paper]
2023 年 2 月 11 日

HumanMAC: Masked Motion Completion for Human Motion Prediction
Ling-Hao Chen, Jiawei Zhang, Yewen Li, Yiren Pang, Xiaobo Xia, Tongliang Liu
arXiv 2023. [Paper] [Project] [Github]
2023 年 2 月 7 日

TEXTure: Text-Guided Texturing of 3D Shapes
Elad Richardson, Gal Metzer, Yuval Alaluf, Raja Giryes, Daniel Cohen-Or
arXiv 2023. [Paper] [Project] [Github]
2023 年 2 月 3 日

Zero3D: Semantic-Driven Multi-Category 3D Shape Generation
Bo Han, Yitong Liu, Yixuan Shen
arXiv 2023. [Paper]
2023 年 1 月 31 日

Neural Wavelet-domain Diffusion for 3D Shape Generation, Inversion, and Manipulation
Jingyu Hu, Ka-Hei Hui, Zhengzhe Liu, Ruihui Li, Chi-Wing Fu
SIGGRAPH ASIA 2023. [Paper] [Github]
2023 年 2 月 1 日

3DShape2VecSet: A 3D Shape Representation for Neural Fields and Generative Diffusion Models
Biao Zhang, Jiapeng Tang, Matthias Niessner, Peter Wonka
SIGGRAPH 2023. [Paper] [Github] [Github]
2023 年 1 月 26 日

DiffMotion: Speech-Driven Gesture Synthesis Using Denoising Diffusion Model
Fan Zhang, Naye Ji, Fuxing Gao, Yongping Li
arXiv 2023. [Paper]
2023 年 1 月 24 日

Bipartite Graph Diffusion Model for Human Interaction Generation
Baptiste Chopin, Hao Tang, Mohamed Daoudi
arXiv 2023. [Paper]
2023 年 1 月 24 日

Diffusion-based Generation, Optimization, and Planning in 3D Scenes
Siyuan Huang, Zan Wang, Puhao Li, Baoxiong Jia, Tengyu Liu, Yixin Zhu, Wei Liang, Song-Chun Zhu
arXiv 2023. [Paper] [Project] [Github]
2023 年 1 月 15 日

Modiff: Action-Conditioned 3D Motion Generation with Denoising Diffusion Probabilistic Models
Mengyi Zhao, Mengyuan Liu, Bin Ren, Shuling Dai, Nicu Sebe
arXiv 2023. [Paper]
2023 年 1 月 10 日

Diffusion Probabilistic Models for Scene-Scale 3D Categorical Data
Jumin Lee, Woobin Im, Sebin Lee, Sung-Eui Yoon
arXiv 2023. [Paper] [Github]
2023 年 1 月 2 日

Point-E: A System for Generating 3D Point Clouds from Complex Prompts
Alex Nichol, Heewoo Jun, Prafulla Dhariwal, Pamela Mishkin, Mark Chen
arXiv 2022. [Paper] [Github]
2022 年 12 月 16 日

Real-Time Rendering of Arbitrary Surface Geometries using Learnt Transfer
Sirikonda Dhawal, Aakash KT, PJ Narayanan
ICVGIP 2022. [Paper]
2022 年 12 月 19 日

Unifying Human Motion Synthesis and Style Transfer with Denoising Diffusion Probabilistic Models
Ziyi Chang, Edmund JC Findlay, Haozheng Zhang, Hubert PH Shum
arXiv 2022. [Paper]
2022 年 12 月 16 日

Rodin: A Generative Model for Sculpting 3D Digital Avatars Using Diffusion
Tengfei Wang, Bo Zhang, Ting Zhang, Shuyang Gu, Jianmin Bao, Tadas Baltrusaitis, Jingjing Shen, Dong Chen, Fang Wen, Qifeng Chen, Baining Guo
arXiv 2022. [Paper] [Project]
2022 年 12 月 12 日

Generative Scene Synthesis via Incremental View Inpainting using RGBD Diffusion Models
Jiabao Lei, Jiapeng Tang, Kui Jia
CVPR 2023. [Paper] [Project] [Github]
2022 年 12 月 12 日

Ego-Body Pose Estimation via Ego-Head Pose Estimation
Jiaman Li, C. Karen Liu, Jiajun Wu
CVPR 2023. [Paper]
2022 年 12 月 9 日

MoFusion: A Framework for Denoising-Diffusion-based Motion Synthesis
Rishabh Dabral, Muhammad Hamza Mughal, Vladislav Golyanik, Christian Theobalt
CVPR 2023. [Paper] [Project]
2022 年 12 月 8 日

SDFusion: Multimodal 3D Shape Completion, Reconstruction, and Generation
Yen-Chi Cheng, Hsin-Ying Lee, Sergey Tulyakov, Alexander Schwing, Liangyan Gui
CVPR 2023. [Paper] [Project]
2022 年 12 月 8 日

Executing your Commands via Motion Diffusion in Latent Space
Xin Chen, Biao Jiang, Wen Liu, Zilong Huang, Bin Fu, Tao Chen, Jingyi Yu, Gang Yu
CVPR 2023. [Paper] [Project] [Github]
2022 年 12 月 8 日

Diffusion-SDF: Text-to-Shape via Voxelized Diffusion
Muheng Li, Yueqi Duan, Jie Zhou, Jiwen Lu
CVPR 2023. [Paper] [Github]
2022 年 12 月 6 日

Pretrained Diffusion Models for Unified Human Motion Synthesis
Jianxin Ma, Shuai Bai, Chang Zhou
arXiv 2022. [Paper] [Project]
2022 年 12 月 6 日

DiffuPose: Monocular 3D Human Pose Estimation via Denoising Diffusion Probabilistic Model
Jeongjun Choi, Dongseok Shim, H. Jin Kim
arXiv 2022. [Paper]
2022 年 12 月 6 日

PhysDiff: Physics-Guided Human Motion Diffusion Model
Ye Yuan, Jiaming Song, Umar Iqbal, Arash Vahdat, Jan Kautz
arXiv 2022. [Paper] [Project]
2022 年 12 月 5 日

Fast Point Cloud Generation with Straight Flows
Lemeng Wu, Dilin Wang, Chengyue Gong, Xingchao Liu, Yunyang Xiong, Rakesh Ranjan, Raghuraman Krishnamoorthi, Vikas Chandra, Qiang Liu
arXiv 2022. [Paper]
2022 年 12 月 4 日

DiffRF: Rendering-Guided 3D Radiance Field Diffusion
Norman Müller, Yawar Siddiqui, Lorenzo Porzi, Samuel Rota Bulò, Peter Kontschieder, Matthias Nießner
CVPR 2023. [Paper] [Project]
2022 年 12 月 2 日

3D-LDM: Neural Implicit 3D Shape Generation with Latent Diffusion Models
Gimin Nam, Mariem Khlifi, Andrew Rodriguez, Alberto Tono, Linqi Zhou, Paul Guerrero
arXiv 2022. [Paper]
2022 年 12 月 1 日

雅可比链评分：提升预训练 2D 扩散模型以生成 3D
Haochen Wang, Xiaodan Du, Jiahao Li, Raymond A. Yeh, Greg Shakhnarovich
CVPR 2023. [Paper] [Project]
2022 年 12 月 1 日

SparseFusion: Distilling View-conditioned Diffusion for 3D Reconstruction
Zhizhuo Zhou, Shubham Tulsiani
CVPR 2023. [Paper] [Project] [Github]
2022 年 12 月 1 日

3D Neural Field Generation using Triplane Diffusion
J. Ryan Shue, Eric Ryan Chan, Ryan Po, Zachary Ankner, Jiajun Wu, Gordon Wetzstein
arXiv 2022. [Paper] [Project]
2022 年 11 月 30 日

DiffPose: Toward More Reliable 3D Pose Estimation
Jia Gong, Lin Geng Foo, Zhipeng Fan, Qiuhong Ke, Hossein Rahmani, Jun Liu
CVPR 2023. [Paper] [Github]
2022 年 11 月 30 日

DiffPose: Multi-hypothesis Human Pose Estimation using Diffusion models
Karl Holmquist, Bastian Wandt
arXiv 2022. [Paper] [Github]
2022 年 11 月 29 日

DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model
Gwanghyun Kim, Se Young Chun
CVPR 2023. [Paper] [Github]
2022 年 11 月 29 日

NeuralLift-360: Lifting An In-the-wild 2D Photo to A 3D Object with 360° Views
Dejia Xu, Yifan Jiang, Peihao Wang, Zhiwen Fan, Yi Wang, Zhangyang Wang
arXiv 2022. [Paper] [Project] [Github]
2022 年 11 月 29 日

Ada3Diff: Defending against 3D Adversarial Point Clouds via Adaptive Diffusion
Kui Zhang, Hang Zhou, Jie Zhang, Qidong Huang, Weiming Zhang, Nenghai Yu
arXiv 2022. [Paper]
2022 年 11 月 29 日

UDE: A Unified Driving Engine for Human Motion Generation
Zixiang Zhou, Baoyuan Wang
arXiv 2022. [Paper] [Project] [Github]
2022 年 11 月 29 日

DiffusionSDF: Conditional Generative Modeling of Signed Distance Functions
Gene Chou, Yuval Bahat, Felix Heide
arXiv 2022. [Paper] [Github]
2022 年 11 月 24 日

Tetrahedral Diffusion Models for 3D Shape Generation
Nikolai Kalischek, Torben Peters, Jan D. Wegner, Konrad Schindler
arXiv 2022. [Paper]
2022 年 11 月 23 日

IC3D: Image-Conditioned 3D Diffusion for Shape Generation
Cristian Sbrolli, Paolo Cudrano, Matteo Frosi, Matteo Matteucci
arXiv 2022. [Paper]
2022 年 11 月 20 日

Listen, denoise, action! Audio-driven motion synthesis with diffusion models
Simon Alexanderson, Rajmund Nagy, Jonas Beskow, Gustav Eje Henter
arXiv 2022. [Paper]
2022 年 11 月 17 日

RenderDiffusion: Image Diffusion for 3D Reconstruction, Inpainting and Generation
Titas Anciukevičius, Zexiang Xu, Matthew Fisher, Paul Henderson, Hakan Bilen, Niloy J. Mitra, Paul Guerrero
CVPR 2023. [Paper] [Github]
2022 年 11 月 17 日

Latent-NeRF for Shape-Guided Generation of 3D Shapes and Textures
Gal Metzer, Elad Richardson, Or Patashnik, Raja Giryes, Daniel Cohen-Or
arXiv 2022. [Paper] [Github]
2022 年 11 月 14 日

ReFu: Refine and Fuse the Unobserved View for Detail-Preserving Single-Image 3D Human Reconstruction
Gyumin Shim, Minsoo Lee, Jaegul Choo
ACM 2022. [Paper]
9 Nov 2022

StructDiffusion: Object-Centric Diffusion for Semantic Rearrangement of Novel Objects
Weiyu Liu, Tucker Hermans, Sonia Chernova, Chris Paxton
RSS 2023. [Paper]
2022 年 11 月 8 日

Diffusion Motion: Generate Text-Guided 3D Human Motion by Diffusion Model
Zhiyuan Ren, Zhihong Pan, Xin Zhou, Le Kang
ICASSP 2023. [Paper]
2022 年 10 月 22 日

LION: Latent Point Diffusion Models for 3D Shape Generation
Xiaohui Zeng, Arash Vahdat, Francis Williams, Zan Gojcic, Or Litany, Sanja Fidler, Karsten Kreis
NeurIPS 2022. [Paper] [Project]
2022 年 10 月 12 日

Human Joint Kinematics Diffusion-Refinement for Stochastic Motion Prediction
Dong Wei, Huaijiang Sun, Bin Li, Jianfeng Lu, Weiqing Li, Xiaoning Sun, Shengxiang Hu
AAAI 2023. [Paper]
2022 年 10 月 12 日

A generic diffusion-based approach for 3D human pose prediction in the wild
Saeed Saadatnejad, Ali Rasekh, Mohammadreza Mofayezi, Yasamin Medghalchi, Sara Rajabzadeh, Taylor Mordan, Alexandre Alahi
ICRA 2023. [Paper]
2022 年 10 月 11 日

Novel View Synthesis with Diffusion Models
Daniel Watson, William Chan, Ricardo Martin-Brualla, Jonathan Ho, Andrea Tagliasacchi, Mohammad Norouzi
ICLR 2023. [Paper]
2022 年 10 月 6 日

Neural Volumetric Mesh Generator
Yan Zheng, Lemeng Wu, Xingchao Liu, Zhen Chen, Qiang Liu, Qixing Huang
NeurIPS Workshop 2022. [Paper]
2022 年 10 月 6 日

Denoising Diffusion Probabilistic Models for Styled Walking Synthesis
Edmund JC Findlay, Haozheng Zhang, Ziyi Chang, Hubert PH Shum
ICLR 2023. [Paper]
2022 年 9 月 29 日

人体运动扩散模型
Guy Tevet, Sigal Raab, Brian Gordon, Yonatan Shafir, Amit H. Bermano, Daniel Cohen-Or
arXiv 2022. [Paper] [Project]
2022 年 9 月 29 日

ISS: Image as Stepping Stone for Text-Guided 3D Shape Generation
Zhengzhe Liu, Peng Dai, Ruihui Li, Xiaojuan Qi, Chi-Wing Fu
ICLR 2023. [Paper] [Github]
2022 年 9 月 9 日

SE(3)-DiffusionFields: Learning cost functions for joint grasp and motion optimization through diffusion
Julen Urain, Niklas Funk, Georgia Chalvatzaki, Jan Peters
arXiv 2022. [Paper] [Github]
2022 年 9 月 8 日

First Hitting Diffusion Models for Generating Manifold, Graph and Categorical Data
Mao Ye, Lemeng Wu, Qiang Liu
NeruIPS 2022. [Paper]
2022 年 9 月 2 日

FLAME: Free-form Language-based Motion Synthesis & Editing
Jihoon Kim, Jiseob Kim, Sungjoon Choi
AAAI 2023. [Paper]
2022 年 9 月 1 日

Let us Build Bridges: Understanding and Extending Diffusion Generative Models
Xingchao Liu, Lemeng Wu, Mao Ye, Qiang Liu
NeurIPS Workshop 2022. [Paper]
2022 年 8 月 31 日

MotionDiffuse：使用扩散模型生成文本驱动的人体运动
Mingyuan Zhang, Zhongang Cai, Liang Pan, Fangzhou Hong, Xinying Guo, Lei Yang, Ziwei Liu
arXiv 2022. [Paper] [Project]
2022 年 8 月 31 日

A Diffusion Model Predicts 3D Shapes from 2D Microscopy Images
Dominik JE Waibel, Ernst Röell, Bastian Rieck, Raja Giryes, Carsten Marr
arXiv 2022. [Paper]
2022 年 8 月 30 日

PointDP: Diffusion-driven Purification against Adversarial Attacks on 3D Point Cloud Recognition
Jiachen Sun, Weili Nie, Zhiding Yu, Z. Morley Mao, Chaowei Xiao
arXiv 2022. [Paper]
21 Aug 2022

A Conditional Point Diffusion-Refinement Paradigm for 3D Point Cloud Completion
Zhaoyang Lyu, Zhifeng Kong, Xudong Xu, Liang Pan, Dahua Lin
ICLR 2022. [Paper] [Github]
7 Dec 2021

Score-Based Point Cloud Denoising
Shitong Luo, Wei Hu
ICCV 2021. [Paper] [Github]
2021 年 7 月 23 日

DiffuStereo: High Quality Human Reconstruction via Diffusion-based Stereo Using Sparse Cameras
Ruizhi Shao, Zerong Zheng, Hongwen Zhang, Jingxiang Sun, Yebin Liu
ECCV 2022. [Paper] [Project] [Github]
2022 年 7 月 16 日

3D Shape Generation and Completion through Point-Voxel Diffusion
Linqi Zhou, Yilun Du, Jiajun Wu
ICCV 2021. [Paper] [Project]
2021 年 4 月 8 日

用于 3D 点云生成的扩散概率模型
Shitong Luo, Wei Hu
CVPR 2021. [Paper] [Github]
2021 年 3 月 2 日

对抗性攻击

Generated Distributions Are All You Need for Membership Inference Attacks Against Generative Models
Minxing Zhang, Ning Yu, Rui Wen, Michael Backes, Yang Zhang
arXiv 2023. [Paper]
2023 年 10 月 30 日

Adversarial Examples Are Not Real Features
Ang Li, Yifei Wang, Yiwen Guo, Yisen Wang
NeurIPS 2023. [Paper]
2023 年 10 月 29 日

Purify++: Improving Diffusion-Purification with Advanced Diffusion Models and Control of Randomness
Boya Zhang, Weijian Luo, Zhihua Zhang
arXiv 2023. [Paper]
2023 年 10 月 28 日

Energy-Based Models for Anomaly Detection: A Manifold Diffusion Recovery Approach
Sangwoong Yoon, Young-Uk Jin, Yung-Kyun Noh, Frank C. Park
arXiv 2023. [Paper]
2023 年 10 月 28 日

Model Selection of Anomaly Detectors in the Absence of Labeled Validation Data
Clement Fung, Chen Qiu, Aodong Li, Maja Rudolph
arXiv 2023. [Paper]
2023 年 10 月 16 日

Boosting Black-box Attack to Deep Neural Networks with Conditional Diffusion Models
Renyang Liu, Wei Zhou, Tianwei Zhang, Kangjie Chen, Jun Zhao, Kwok-Yan Lam
arXiv 2023. [Paper]
2023 年 10 月 11 日

Investigating the Adversarial Robustness of Density Estimation Using the Probability Flow ODE
Marius Arvinte, Cory Cornelius, Jason Martin, Nageen Himayat
arXiv 2023. [Paper]
2023 年 10 月 10 日

Understanding and Improving Adversarial Attacks on Latent Diffusion Model
Boyang Zheng, Chumeng Liang, Xiaoyu Wu, Yan Liu
arXiv 2023. [Paper]
7 Oct 2023

通过扩散模型进行语义对抗攻击
Chenan Wang, Jinhao Duan, Chaowei Xiao, Edward Kim, Matthew Stamm, Kaidi Xu
arXiv 2023. [Paper]
2023 年 9 月 14 日

Catch You Everything Everywhere: Guarding Textual Inversion via Concept Watermarking
Weitao Feng, Jiyan He, Jie Zhang, Tianwei Zhang, Wenbo Zhou, Weiming Zhang, Nenghai Yu
arXiv 2023. [Paper]
2023 年 9 月 12 日

Diff-Privacy: Diffusion-based Face Privacy Protection
Xiao He, Mingrui Zhu, Dongxin Chen, Nannan Wang, Xinbo Gao
arXiv 2023. [Paper]
2023 年 9 月 11 日

DiffDefense: Defending against Adversarial Attacks via Diffusion Models
Hondamunige Prasanna Silva, Lorenzo Seidenari, Alberto Del Bimbo
arXiv 2023. [Paper] [Github]
2023 年 9 月 7 日

My Art My Choice: Adversarial Protection Against Unruly AI
Anthony Rhodes, Ram Bhagat, Umur Aybars Ciftci, Ilke Demir
arXiv 2023. [Paper]
2023 年 9 月 6 日

Improving Visual Quality and Transferability of Adversarial Attacks on Face Recognition Simultaneously with Adversarial Restoration
Fengfan Zhou
arXiv 2023. [Paper]
2023 年 9 月 4 日

DiffSmooth: Certifiably Robust Learning via Diffusion Models and Local Smoothing
Jiawei Zhang, Zhongzhu Chen, Huan Zhang, Chaowei Xiao, Bo Li
USENIX Security 2023. [Paper]
2023 年 8 月 28 日

A Probabilistic Fluctuation based Membership Inference Attack for Diffusion Models
Wenjie Fu, Huandong Wang, Chen Gao, Guanghua Liu, Yong Li, Tao Jiang
arXiv 2023. [Paper]
2023 年 8 月 23 日

White-box Membership Inference Attacks against Diffusion Models
Yan Pang, Tianhao Wang, Xuhui Kang, Mengdi Huai, Yang Zhang
arXiv 2023. [Paper]
2023 年 8 月 11 日

BAGM: A Backdoor Attack for Manipulating Text-to-Image Generative Models
Jordan Vice, Naveed Akhtar, Richard Hartley, Ajmal Mian
arXiv 2023. [Paper] [Github] [[Dataset](https://ieee-datapo

展开