Downcodes의 편집자는 Zhipu 기술 팀이 최근 8월 이후 CogVideoX 시리즈의 또 다른 주요 업데이트인 최신 비디오 생성 모델 CogVideoX v1.5를 오픈 소스화했다는 사실을 알게 되었습니다. 이번 업데이트는 성능을 크게 향상시키고, 개발자에게 더욱 강력한 비디오 생성 도구를 제공하며, AI 비디오 생성 기술의 새로운 단계를 제시합니다. CogVideoX v1.5는 비디오 길이, 해상도 및 프레임 속도를 크게 향상시켰으며 복잡한 의미를 이해하는 능력을 향상시켜 애플리케이션 시나리오를 더욱 확장했습니다.
이번 업데이트를 통해 5초 및 10초 비디오 길이 지원, 768P 해상도 및 16프레임 생성 기능을 포함하여 비디오 생성 기능이 크게 향상된 것으로 이해됩니다. 동시에 I2V(이미지 투 비디오) 모델은 모든 크기 비율을 지원하므로 복잡한 의미를 이해하는 능력이 더욱 향상됩니다.
CogVideoX v1.5에는 개발자에게 보다 강력한 비디오 생성 도구를 제공하도록 설계된 CogVideoX v1.5-5B 및 CogVideoX v1.5-5B-I2V의 두 가지 주요 모델이 포함되어 있습니다.
더욱 주목할만한 점은 CogVideoX v1.5가 Qingying 플랫폼에서 동시에 출시되고 새로 출시된 CogSound 음향 효과 모델과 결합되어 "New Qingying"이 될 것이라는 점입니다. New Qingying은 비디오 품질, 미적 성능 및 모션 합리성의 대폭 개선을 포함하여 다양한 특별 서비스를 제공하고 10초, 4K, 60프레임 초고화질 비디오 생성을 지원합니다.
공식적인 소개는 다음과 같습니다.
CogVideoX v1.5의 오픈 소스는 AI 비디오 생성 분야에 새로운 활력을 불어넣고 개발자에게 더 많은 가능성을 제공합니다. 앞으로는 CogVideoX v1.5를 기반으로 하는 더욱 혁신적인 애플리케이션을 보게 될 것이라고 믿습니다. Downcodes의 편집자는 이 분야의 최신 개발에 지속적으로 관심을 기울이고 더욱 흥미로운 보고서를 제공할 것입니다.