O Alibaba abriu o código-fonte de seu modelo de geração e edição de texto de imagem AnyText, que pode gerar texto arbitrário e preciso em imagens e oferece suporte a vários idiomas, incluindo chinês. Os usuários podem personalizar a posição do texto, a intensidade da imagem e outros parâmetros para gerar imagens que atendam às suas necessidades. Mais importante ainda, o Alibaba também abriu simultaneamente o código-fonte do conjunto de dados AnyWord-3M, que contém 3 milhões de pares de imagem-texto, cobrindo vários idiomas, como chinês, inglês, japonês e coreano. capacidades do modelo AnyText. Promover o desenvolvimento da tecnologia de geração de texto de imagem.
O modelo de geração e edição de texto de imagem de código aberto do Alibaba, AnyText, pode gerar qualquer texto preciso em imagens, incluindo chinês. Este modelo oferece suporte ao planejamento personalizado de parâmetros como localização do texto e intensidade das imagens, e gera imagens Wensheng que atendem aos requisitos. Ao mesmo tempo, o Alibaba também abriu o código-fonte do conjunto de dados AnyWord-3M para melhorar os recursos de texto do AnyText. Este conjunto de dados contém 3 milhões de pares imagem-texto, abrangendo chinês, inglês, japonês, coreano e outros idiomas.
O código aberto do modelo AnyText e o lançamento do conjunto de dados AnyWord-3M marcam o progresso significativo do Alibaba no campo de geração de texto de imagem, fornecendo aos pesquisadores e desenvolvedores ferramentas e recursos poderosos, e espera-se que promova a inovação tecnológica e a aplicação neste campo Implementado para melhorar ainda mais a eficiência e precisão do processamento de imagens e texto.