알리바바, 오픈소스 이미지 생성 비디오 모델 I2VGen-XL 출시

저자：Eve Cole 업데이트 시간：2025-01-14 08:00:02

알리바바는 지난 11월 I2VGen-XL 이미지 생성 비디오 모델을 출시했으며, 해당 코드와 모델은 마침내 공식적으로 오픈 소스가 됐다. 모델은 1단계에서는 의미적 일관성을 보장하고, 2단계에서는 짧은 텍스트를 통합하여 영상의 디테일과 해상도를 향상시키는 2단계 처리 방식을 사용합니다. I2VGen-XL은 대규모 데이터 트레이닝을 통해 비디오 생성 분야에서 더 높은 의미적 정확성, 세부 연속성 및 명확성을 입증하여 이미지 분야에서 비디오 생성에 대한 새로운 혁신을 가져왔습니다.

알리바바는 지난 11월 발표한 논문에서 오픈소스 I2VGen-XL 이미지 생성 영상 모델을 발표했고, 이제 드디어 구체적인 코드와 모델을 공개하게 됐다. 모델은 의미적 일관성을 보장하기 위한 기본 단계와 짧은 텍스트를 통합하여 비디오 디테일을 개선하고 해상도를 향상시키는 최적화 단계의 두 단계를 통해 처리됩니다. 연구팀은 최적화를 위해 많은 양의 데이터를 수집하여 I2VGen-XL 모델이 비디오 생성 시 더 높은 의미 정확도, 세부 연속성 및 명확성을 갖도록 했습니다. 자세한 코드는 GitHub에서 확인할 수 있습니다.

I2VGen-XL 모델의 오픈 소스는 연구원과 개발자에게 귀중한 리소스를 제공하고 이미지 생성 비디오 기술의 추가 개발을 촉진하는 데 도움이 됩니다. 효율적인 처리 흐름과 탁월한 생성 효과는 미래 AI 생성 비디오 기술의 엄청난 잠재력을 나타냅니다. I2VGen-XL을 기반으로 한 더욱 혁신적인 애플리케이션을 기대해 보세요.