Tencent는 최근 기존 SD 모델의 프롬프트 단어 이해 능력을 크게 향상시킬 수 있는 효율적인 대형 언어 모델 어댑터인 ELLA라는 프로젝트를 출시했습니다. 추가 교육 없이 ELLA를 텍스트-이미지 확산 모델에 통합하여 모델의 텍스트 정렬 처리 능력을 향상시킬 수 있습니다. 그 핵심은 확산 모델이 다양한 단계의 텍스트 프롬프트를 더 잘 이해하고 여러 개체와 다양한 속성을 포함하는 복잡한 프롬프트를 더 잘 처리하는 데 도움이 되는 시간 단계 인식 의미론적 커넥터에 있습니다. 이러한 혁신은 텍스트-이미지 모델 개발에 새로운 가능성을 가져오고 AI 이미지 생성의 정확성과 효율성을 더욱 향상시킬 것으로 기대됩니다.
Tencent가 출시한 ELLA 프로젝트는 시간 단계 인식 의미 커넥터를 통해 기존 확산 모델의 복잡한 텍스트 프롬프트에 대한 이해가 부족한 문제를 현명하게 해결합니다. 편리한 통합 방법과 탁월한 실험 결과는 ELLA가 텍스트-이미지 생성 분야에서 중요한 역할을 하고 이 분야의 지속적인 기술 발전을 촉진할 것임을 나타냅니다. ELLA의 등장은 사용자에게 더욱 편리하고 효율적인 AI 이미지 생성 경험을 선사하며, 향후 AI 기술 발전에 새로운 방향을 제시합니다.