近日,来自纽约大学、麻省理工学院和谷歌的研究团队发表了一项突破性研究,提出了一种创新框架,旨在解决扩散模型在推理时间上的瓶颈问题。该框架巧妙地结合了验证器反馈和噪声候选搜索算法,在保持固定去噪步骤数量的同时,通过引入额外的计算资源来显着提升生成模型的性能。这项研究不仅在多个基准测试中取得了优异的成绩,也为未来开发更专业化的视觉生成任务验证系统提供了宝贵的参考。
该框架主要通过引入验证器提供反馈,以及实施算法来发现更优的噪声候选来实现。研究团队利用了Inception Score和Fréchet Inception Distance作为验证器,并以预训练的SiT-XL模型为基础进行实验。实验结果表明,该方法有效提升了样本质量,尤其是在ImageReward和Verifier Ensemble上取得了显着进步。
实验结果显示,该框架在多个基准测试中表现出色。在DrawBench测试中,LLM Grader评估证实了搜索验证方法能持续提升样本质量。特别是ImageReward和Verifier Ensemble在各项指标上都取得了显着进步,这归功于它们精确的评估能力和与人类偏好的高度一致性。
这项研究不仅证实了基于搜索的计算扩展方法的有效性,也揭示了不同验证器的固有偏差,为未来开发更专业化的视觉生成任务验证系统指明了方向。这一发现对于提升AI生成模型的整体性能具有重要意义。
这项研究为提升扩散模型的推理效率提供了新的思路,其提出的框架和方法值得进一步研究和应用,为未来AI生成模型的发展提供了重要的参考价值,也预示着更高效、更高质量的AI图像生成技术即将到来。