Alibaba a open source son modèle de génération et d'édition de texte d'image AnyText, qui peut générer du texte arbitraire et précis dans les images et prend en charge plusieurs langues, y compris le chinois. Les utilisateurs peuvent personnaliser la position du texte, l'intensité de l'image et d'autres paramètres pour générer des images qui répondent à leurs besoins. Plus important encore, Alibaba a également ouvert simultanément l'ensemble de données AnyWord-3M, qui contient 3 millions de paires image-texte, couvrant plusieurs langues telles que le chinois, l'anglais, le japonais et le coréen. Cela améliorera considérablement le traitement du texte. capacités du modèle AnyText Promouvoir le développement ultérieur de la technologie de génération de texte image.
Le modèle open source de génération et d'édition de texte d'image d'Alibaba, AnyText, peut générer n'importe quel texte précis dans les images, y compris le chinois. Ce modèle prend en charge la planification personnalisée de paramètres tels que l'emplacement du texte et l'intensité des images, et génère des images Wensheng qui répondent aux exigences. Dans le même temps, Alibaba a également ouvert l'ensemble de données AnyWord-3M pour améliorer les capacités de texte d'AnyText. Cet ensemble de données contient 3 millions de paires image-texte, couvrant le chinois, l'anglais, le japonais, le coréen et d'autres langues.
L'open source du modèle AnyText et la publication de l'ensemble de données AnyWord-3M marquent les progrès significatifs d'Alibaba dans le domaine de la génération de texte image, fournissant aux chercheurs et aux développeurs des outils et des ressources puissants, et devraient promouvoir l'innovation technologique et les applications dans ce domaine. domaine Mis en œuvre pour améliorer encore l’efficacité et la précision du traitement des images et des textes.