字节联合高校出品！STAR 模型：提升视频清晰度和分辨率

作者：Eve Cole 更新时间：2025-01-20 18:16:01

南京大学研究团队与字节跳动、西南大学合作，推出了一项名为STAR的创新视频超分辨率技术。该技术巧妙地结合了时空增强方法和文本到视频模型，能够显着提升低分辨率视频的清晰度，尤其适用于那些从视频平台下载的低清视频。 STAR模型的预训练版本已在GitHub上开源，方便研究者和开发者使用，这标志着视频处理领域的一项重要突破。该项目提供了I2VGen-XL和CogVideoX-5B两种模型，并支持多种输入格式和提示选项，满足不同需求。

为了方便研究者和开发者使用，研究团队已经在GitHub 上发布了STAR 模型的预训练版本，包括I2VGen-XL 和CogVideoX-5B 两种型号，以及相关的推理代码。这些工具的推出标志着在视频处理领域的一次重要进展。

使用该模型的过程相对简单。首先，用户需要从HuggingFace 下载预训练的STAR 模型，并将其放入指定目录。接着，准备待测试的视频文件，并选择适合的文本提示选项，包括无提示、自动生成或手动输入提示。用户只需调整脚本中的路径设置，便可轻松进行视频超分辨率的处理。

该项目特别设计了两种基于I2VGen-XL 的模型，分别用于不同程度的视频降质处理，确保能够满足多种需求。此外，CogVideoX-5B 模型专门支持720x480的输入格式，为特定场景提供了灵活的选择。

该研究不仅为视频超分辨率技术的发展提供了新的思路，还为相关领域的研究者们开辟了新的研究方向。研究团队对I2VGen-XL、VEnhancer、CogVideoX 和OpenVid-1M 等前沿技术表示感谢，认为这些技术为他们的项目奠定了基础。

项目入口:https://github.com/NJU-PCALab/STAR

划重点:

新技术STAR 结合文本到视频模型，实现视频超分辨率，提升视频质量。

研究团队已发布预训练模型和推理代码，使用过程简单明了。

提供联系方式，鼓励用户与研究团队进行交流与探讨。

STAR项目通过GitHub开源，方便开发者和研究者使用，其简单易用的操作流程和强大的功能，为视频超分辨率领域带来了新的可能性，也为未来研究提供了新的方向。期待STAR技术在实际应用中发挥更大的作用。