Alibaba는 이미지에서 임의의 정확한 텍스트를 생성할 수 있고 중국어를 포함한 여러 언어를 지원하는 이미지 텍스트 생성 및 편집 모델인 AnyText를 오픈소스화했습니다. 사용자는 텍스트 위치, 이미지 강도 및 기타 매개변수를 사용자 정의하여 필요에 맞는 이미지를 생성할 수 있습니다. 더 중요한 것은 Alibaba가 중국어, 영어, 일본어, 한국어 등 여러 언어를 포괄하는 300만 개의 이미지-텍스트 쌍을 포함하는 AnyWord-3M 데이터 세트를 동시에 오픈 소스화했다는 것입니다. 이를 통해 텍스트 처리가 크게 향상될 것입니다. AnyText 모델의 기능을 활용하여 이미지 텍스트 생성 기술의 추가 개발을 촉진합니다.
Alibaba의 오픈 소스 이미지 텍스트 생성 및 편집 모델인 AnyText는 중국어를 포함하여 이미지에서 정확한 텍스트를 생성할 수 있습니다. 이 모델은 텍스트 위치, 그림 강도 등 매개변수의 맞춤형 계획을 지원하고 요구 사항을 충족하는 Wensheng 이미지를 생성합니다. 동시에 Alibaba는 AnyText의 텍스트 기능을 향상시키기 위해 AnyWord-3M 데이터 세트를 오픈 소스로 공개했습니다. 이 데이터 세트에는 중국어, 영어, 일본어, 한국어 및 기타 언어를 포괄하는 3백만 개의 이미지-텍스트 쌍이 포함되어 있습니다.
AnyText 모델의 오픈 소스와 AnyWord-3M 데이터 세트의 출시는 이미지 텍스트 생성 분야에서 Alibaba의 중요한 진전을 의미하며 연구원과 개발자에게 강력한 도구와 리소스를 제공하며 이 분야에서 기술 혁신과 적용을 촉진할 것으로 예상됩니다. 이미지 및 텍스트 처리의 효율성과 정확성을 더욱 향상시키기 위해 구현되었습니다.