Alibaba 지능형 컴퓨팅 연구소, 오디오 및 비디오 동기화 프레임워크 EMO 제안
Alibaba 지능형 컴퓨팅 연구소는 이미지와 오디오를 입력하여 표현력이 풍부한 비디오를 생성할 수 있는 새로운 생성 프레임워크 EMO를 출시했습니다. EMO는 다국어, 대화, 노래 등의 시나리오를 지원하지만 사기의 위험도 있습니다. 이 프레임워크는 아바타 비디오 생성 분야에 새로운 가능성을 제공하지만 현재 학술 연구 및 효과 시연에만 사용되며 여전히 추가 개선과 확장이 필요합니다.
2025-02-05