Alibaba의 Tongyi Laboratory의 연구는 문학 및 전기 그래픽 모델의 이미지 생성 능력으로 획기적인 발전을 가져 왔습니다. 그들은 기존 확산 변압기 모델이 소량의 지침만으로 특정 관계를 가진 멀티 픽처 세트를 생성 할 수 있음을 발견했습니다. 이는 전통적인 확산 모델이 고품질 이미지를 생성하기 위해 대규모 데이터 교육이 필요하다는 인식을 전복시킵니다. 이 연구의 핵심은 IC-Lora 기술로, 모델의 "컨텍스트 학습"능력을 효과적으로 활성화하여 모델이 이미지 간의 연관성을 이해하고 논리적 일관성을 가진 일련의 이미지를 생성 할 수 있습니다. 이 기술은 이미지 생성의 효율성과 품질을 향상시킬뿐만 아니라 모델 교육 비용을 줄여 AI 이미지 생성 분야에 혁신적인 변화를 가져옵니다.
전통적인 확산 모델은 Rot 학생과 같으며 IC-Lora는 서로를 배울 수있는 능력을 제공합니다. 여러 이미지를 큰 이미지로 영리하게 접합시키고 텍스트를 긴 소품으로 묘사함으로써, 연구원들은 모델이 여러 이미지의 정보를 동시에 처리하고 이미지 간의 관계를 이해할 수 있도록합니다. 동시에, 미세 조정은 소수의 고품질 그림 컬렉션을 통해 수행되며, 모델의 원래 지식 및 상황 학습 능력이 유지됩니다. 이 기사에는 여러 실험 사례가 나와 있으며, 만화 스타일 이미지 생성, 기존 사진을 기반으로 한 다양한 표현식 또는 장면의 사진 생성 등 다양한 시나리오에서 IC-Lora의 응용 효과를 생생하게 보여줍니다. IC-Lora의 출현으로 AI 모델의 훈련 비용이 줄어들고 앞으로 더 많은 사람들이 AI 생성에 참여할 수 있었으며, 모든 사람들이 도달 할 수있는 창의적인 도구가 될 것으로 예상됩니다. 프로젝트 주소 : https://ali-vilab.github.io/in-context-lora-page/
IC-Lora 기술의 획기적인 진보는 AI 이미지 생성 분야에 새로운 가능성을 가져 왔습니다. 앞으로 기술의 지속적인 성숙도와 개선으로 인해 IC-Lora와 예술적 창조 분야에서 AI의 광범위한 응용을 기반으로하는보다 혁신적인 응용 프로그램을 기대할 수 있습니다.