Alibaba memiliki model pembuatan dan pengeditan teks gambar bersumber terbuka, AnyText, yang dapat menghasilkan teks presisi arbitrer dalam gambar dan mendukung berbagai bahasa, termasuk bahasa Mandarin. Pengguna dapat menyesuaikan posisi teks, intensitas gambar, dan parameter lainnya untuk menghasilkan gambar yang memenuhi kebutuhan mereka. Yang lebih penting lagi, Alibaba juga secara bersamaan membuka kumpulan data AnyWord-3M, yang berisi 3 juta pasangan gambar-teks, yang mencakup berbagai bahasa seperti Cina, Inggris, Jepang, dan Korea kemampuan model AnyText. Mempromosikan pengembangan lebih lanjut dari teknologi pembuatan teks gambar.
Model pembuatan dan pengeditan teks gambar sumber terbuka Alibaba, AnyText, dapat menghasilkan teks persis apa pun dalam gambar, termasuk bahasa Mandarin. Model ini mendukung perencanaan khusus parameter seperti lokasi teks dan intensitas gambar, serta menghasilkan gambar Wensheng yang memenuhi persyaratan. Pada saat yang sama, Alibaba juga membuka kumpulan data AnyWord-3M untuk meningkatkan kemampuan teks AnyText. Kumpulan data ini berisi 3 juta pasangan gambar-teks, mencakup bahasa Mandarin, Inggris, Jepang, Korea, dan bahasa lainnya.
Sumber terbuka model AnyText dan peluncuran kumpulan data AnyWord-3M menandai kemajuan signifikan Alibaba di bidang pembuatan teks gambar, menyediakan alat dan sumber daya yang canggih bagi para peneliti dan pengembang, dan diharapkan dapat mendorong inovasi dan penerapan teknologi dalam hal ini. lapangan. Diimplementasikan untuk lebih meningkatkan efisiensi dan akurasi pemrosesan gambar dan teks.