阿里开源AnyText：可在图像中生成任意精准文本，支持中文！

作者：Eve Cole 更新时间：2025-01-22 08:32:01

阿里巴巴开源了其图像文本生成与编辑模型AnyText，该模型能够在图像中生成任意精准文本，并支持多种语言，包括中文。用户可以自定义文本位置、图片强度等参数，生成符合需求的图像。更重要的是，阿里还同步开源了AnyWord-3M数据集，包含300万个图像-文本对，涵盖中、英、日、韩等多种语言，这将极大提升AnyText模型的文本处理能力，推动图像文本生成技术的进一步发展。

阿里开源的图像文本生成与编辑模型AnyText能够在图像中生成任意精准文本，包括中文。该模型支持自定义规划文字出现的位置、图片的强度等参数，生成符合要求的文生图像。同时，阿里还开源了AnyWord-3M数据集，用于提升AnyText的文本能力。该数据集包含了300万个图像-文本对，涵盖中文、英文、日文、韩文等多种语言。

AnyText模型的开源以及AnyWord-3M数据集的发布，标志着阿里巴巴在图像文本生成领域取得了显著进展，为研究者和开发者提供了强大的工具和资源，有望推动该领域的技术创新和应用落地，进一步提升图像文本处理的效率和精度。