此 GitHub 存储库总结了与文本到图像 (T2I) 生成任务相关的论文和资源。
笔记
本文档作为整个 GitHub 存储库的homepage
。论文按照不同的研究方向、发表年份、会议情况进行总结。
topics
部分根据不同的属性总结了与 T2I 生成高度相关的论文,例如 T2I 生成的先决条件、使用其他技术的扩散模型(例如 Diffusion Transformer、LLM、Mamba 等)以及其他任务的扩散模型。
如果您对此存储库有任何建议,请随时发起新问题或拉取请求。
该 GitHub 存储库的最新消息列出如下。
[十一月。 19日]我们发布了最新论文《StableV2V: Stablizing Shape Consistency in Video-to-Video Editing》,并开源了相应的代码、模型权重和测试基准DAVIS-Edit
。请随时从链接中查看它们!
topics
部分了解更多详细信息!topics
部分已更新。本节旨在提供根据扩散模型的其他属性总结的论文列表,例如基于扩散变压器的方法、NLP的扩散模型、与LLM集成的扩散模型等。这些论文的相应参考文献也总结在reference.bib
中reference.bib
<返回顶部>
姓名 | 年 | 网站 | 特产 |
---|---|---|---|
稳定扩散3 | 2024年 | 关联 | 基于扩散变压器的稳定扩散 |
视频稳定 | 2024年 | 关联 | 高品质高分辨率图像 |
达尔-E 3 | 2023年 | 关联 | 与 ChatGPT 合作 |
表意文字 | 2023年 | 关联 | 文字图片 |
操场 | 2023年 | 关联 | 审美形象 |
嗨梦科技 | 2023年 | 关联 | - |
短跑 | 2023年 | 关联 | 文本转漫画生成 |
惠州 | 2023年 | 关联 | WHEE是一款在线AI生成工具,可应用于T2I生成、I2I生成、SR、修复、外绘、图像变化、虚拟试穿等。 |
织女星人工智能 | 2023年 | 关联 | Vega AI是一款在线AI生成工具,可应用于T2I生成、I2I生成、SR、T2V生成、I2V生成等。 |
艾无界 | 2022年 | 关联 | 中文名称为“无界AI”,提供AIGC资源和在线服务 |
中途 | 2022年 | 关联 | 强大的闭源生成工具 |
<返回顶部>
<返回顶部>
<返回顶部>
<返回顶部>
<返回顶部>
<返回顶部>
<返回顶部>
<返回顶部>
<返回顶部>
<返回顶部>
<返回顶部>
<返回顶部>
<返回顶部>
姓名 | 网站 | 描述 |
---|---|---|
稳定的扩散WebUI | 关联 | 基于Gradio构建,本地部署以运行Stable Diffusion检查点、LoRA权重、ControlNet权重等。 |
稳定扩散 WebUI-forge | 关联 | 基于Gradio构建,本地部署以运行Stable Diffusion检查点、LoRA权重、ControlNet权重等。 |
福库斯 | 关联 | 基于Gradio构建,离线、开源、免费。 无需手动调整,用户只需关注提示和图像即可。 |
舒适用户界面 | 关联 | 本地部署以通过稳定扩散实现定制工作流程 |
奇维泰 | 关联 | 社区稳定扩散和 LoRA 检查点的网站 |
<返回顶部>
Others
指的是什么?Stable Casacade
)并未在 arXiv 上发布其技术报告。相反,他们倾向于在自己的官方网站上写博客。 Others
类别指的是此类研究。<返回顶部>
reference.bib
文件总结了最新图像修复论文、广泛使用的数据集和工具包的 bibtex 参考文献。基于原始参考文献,我进行了以下修改,以使它们的结果在LaTeX
手稿中看起来不错:
author-etal-year-nickname
的形式构建。特别是,数据集和工具包的引用直接构建为nickname
,例如imagenet
。Computer Vision and Pattern Recognition -> CVPR
。url
、 doi
、 publisher
、 organization
、 editor
、 series
均被删除。pages
,则会添加它们。{}
以确保标题大小写在某些特定模板中也能正常工作。如果您对参考文献格式有其他要求,可以通过在DBLP或Google Scholar中搜索论文名称来查阅论文的原始参考文献。
笔记
请注意, homepage
和topic
部分中的引用可以在reference.bib
中重复。就我个人而言,我建议使用"Ctrl+F" / "Command+F"
来搜索您想要的BibTeX
参考文献。
<返回顶部>
<返回顶部>