Downcodes小编获悉,智谱技术团队重磅发布了全新文生图模型CogView3及其升级版CogView3-Plus-3B,并已正式开源,同时在智谱清言App上线。 这标志着AI辅助艺术创作技术取得了重大突破,性能超越现有顶尖开源模型,为AI艺术创作领域带来了新的可能性。CogView3采用级联扩散技术,通过多阶段迭代生成高清图像,其推理速度更是远超同类产品,为用户提供高效便捷的创作体验。 此次开源举措将极大推动AI图像生成领域的发展,为开发者和研究者提供宝贵的资源。
CogView3作为一款基于级联扩散的文本转图像模型,其生成过程堪称精妙。模型首先生成一幅512x512像素的低分辨率图像,随后通过中继扩散过程将其提升至1024x1024,最终再次迭代,呈现出一幅2048x2048的高清大图。这种层层递进的生成方式,犹如数字画家在画布上逐步完善作品,为用户带来了极致的视觉体验。
据官方评估,CogView3的表现令人惊叹,其性能竟比当前顶尖的开源文生图模型SDXL高出77%。更值得一提的是,CogView3的推理速度仅为SDXL的十分之一,充分展现了智谱团队在模型优化方面的卓越成就。
对于渴望探索这一前沿技术的开发者和研究者,智谱技术团队已经开放了CogView3和CogView3-Plus-3B的源代码仓库。这一举措无疑将推动整个AI图像生成领域的快速发展,为更多创新应用提供坚实的技术基础。
随着CogView3系列模型的问世,文生图技术的应用前景更加广阔。从个人创作到商业设计,从教育辅助到娱乐产业,这项技术都有望带来革命性的变革。我们可以预见,在不久的将来,AI辅助创作将成为常态,让更多人能够轻松实现自己的艺术构想。
开源仓库地址:
https://top.aibase.com/tool/cogview3
Plus 开源模型仓库:
https://top.aibase.com/tool/cogview3-plus-3b
CogView3和CogView3-Plus-3B的开源,将加速AI艺术创作的普及和发展,为各行各业带来新的机遇。Downcodes小编期待更多基于该模型的创新应用涌现!