Alibaba のオープンソース AnyText: 画像内のあらゆる正確なテキストを生成でき、中国語もサポートしています。

著者：Eve Cole 更新時間：2025-01-22 08:32:01

アリババは、画像テキスト生成および編集モデル AnyText をオープンソース化しました。AnyText は、画像内に任意の正確なテキストを生成でき、中国語を含む複数の言語をサポートします。ユーザーは、テキストの位置、画像の強度、その他のパラメータをカスタマイズして、ニーズを満たす画像を生成できます。さらに重要なことに、アリババは同時に、中国語、英語、日本語、韓国語などの複数の言語をカバーする 300 万の画像とテキストのペアを含む AnyWord-3M データセットもオープンソース化しました。これにより、テキスト処理が大幅に改善されます。 AnyText モデルの機能を活用し、画像テキスト生成技術のさらなる開発を促進します。

Alibaba のオープンソースの画像テキスト生成および編集モデル AnyText は、中国語を含む画像内のあらゆる正確なテキストを生成できます。このモデルは、テキストの位置や画像の強度などのパラメーターのカスタムプランニングをサポートし、要件を満たす Wensheng 画像を生成します。同時に、Alibaba は AnyText のテキスト機能を向上させるために、AnyWord-3M データセットもオープンソース化しました。このデータセットには、中国語、英語、日本語、韓国語、その他の言語をカバーする 300 万の画像とテキストのペアが含まれています。

AnyText モデルのオープンソースと AnyWord-3M データセットのリリースは、画像テキスト生成分野におけるアリババの大きな進歩を示し、研究者や開発者に強力なツールとリソースを提供し、この分野での技術革新と応用を促進することが期待されています。画像およびテキスト処理の効率と精度をさらに向上させるために実装されました。