阿里巴巴开源了其图像文本生成与编辑模型AnyText,该模型能够在图像中生成任意精准文本,并支持多种语言,包括中文。用户可以自定义文本位置、图片强度等参数,生成符合需求的图像。 更重要的是,阿里还同步开源了AnyWord-3M数据集,包含300万个图像-文本对,涵盖中、英、日、韩等多种语言,这将极大提升AnyText模型的文本处理能力,推动图像文本生成技术的进一步发展。
阿里开源的图像文本生成与编辑模型AnyText能够在图像中生成任意精准文本,包括中文。该模型支持自定义规划文字出现的位置、图片的强度等参数,生成符合要求的文生图像。同时,阿里还开源了AnyWord-3M数据集,用于提升AnyText的文本能力。该数据集包含了300万个图像-文本对,涵盖中文、英文、日文、韩文等多种语言。
AnyText模型的开源以及AnyWord-3M数据集的发布,标志着阿里巴巴在图像文本生成领域取得了显著进展,为研究者和开发者提供了强大的工具和资源,有望推动该领域的技术创新和应用落地,进一步提升图像文本处理的效率和精度。