北大斯坦福联手Pika推出RPG框架，助力文生图研究取得新突破

作者：Eve Cole 更新时间：2025-02-02 04:16:01

北京大学、斯坦福大学和Pika Labs合作研发了一个名为RPG的全新开源文生图框架，该框架利用多模态大型语言模型（LLM）的强大能力，成功克服了文生图技术的两大难题。其核心策略包括分解文本提示、划分图像空间以及独立生成子区域图像，从而取得了显着的突破性进展，为文生图领域注入了新的活力。这标志着在人工智能图像生成领域取得了重要进展，未来有望进一步推动该技术的应用和发展。

北大、斯坦福和Pika Labs联手推出新的开源文生图框架RPG，利用多模态LLM的能力成功解决文生图两大难题。该框架通过分解文本提示、划分图像空间、独立生成子区域图像等核心策略，取得了显着的研究成果，为文生图领域带来新的突破。

RPG框架的出现，预示着文生图技术将迎来新的发展阶段。其开源特性将加速技术迭代和应用落地，有望在艺术创作、设计辅助等领域发挥重要作用，为更多开发者和用户带来便利。期待未来看到更多基于RPG框架的创新应用。