최근 홍콩 대학교와 Bytedance가 개발 한 모바일 비디오 세대 모델 인 Goku는 공식적으로 출시되었습니다. 이 모델은 고급 생성 알고리즘을 사용하여 텍스트 프롬프트를 기반으로 고품질 비디오 컨텐츠를 생성하여 디지털 아트의 표현을 크게 풍부하게합니다.
Goku 모델의 힘을 보여주기 위해 연구팀은 모델의 기술 기능을 보여줄뿐만 아니라 창의적인 성능에서 무한한 잠재력을 보여주는 일련의 훌륭한 비디오 예제를 만들었습니다.
Goku 모델은 효율적인 생성 속도와 이미지 품질을 특징으로합니다. 많은 양의 데이터 교육을 사용하면 Goku는 애니메이션, 자연 경관, 동물 행동 등을 포함한 다양한 장면을 생성 할 수 있습니다. 연구원들은 원래 Moviegenbench 프롬프트를 사용하여 테스트 효과의 일관성과 공정성을 보장했습니다.
예를 들어, 비디오 중 하나는 도쿄의 거리에서 자신있게 걷는 세련된 여성을 보여줍니다. 화려한 네온 조명은 따뜻한 밤을 반영하며 보행자는 생생하고 현실적인 장면으로 번잡합니다.
또 다른 비디오는 눈에 여유롭게 걷는 몇 개의 거대한 매머드가 주변의 눈 덮인 산과 숲으로 인해 사람들이 마치 얼음과 눈의 세계에있는 것처럼 느끼게합니다. 이 생생한 장면은 청중의 관심을 끌뿐만 아니라 예술적 제작자에게 풍부한 영감을 제공합니다.
더 놀라운 것은 Goku가 직접적인 가상 디지털 인간 비디오를 직접 생성한다는 것입니다. Goku+는 텍스트를 초현실적 인 사람 비디오로 변환합니다. 이는 기존 방법보다 훨씬 우수합니다. 특히, 20 초에 걸쳐 비디오를 생성 할 수 있으며, 안정적인 손 움직임과 인간 대상의 표현력이 높은 얼굴 및 신체 움직임이 특징입니다.
또한 제품 이미지에서 대화식 비디오 생성, 제품 스타일 유지 관리, 제품 디스플레이 비디오 생성, 텍스트에서 광고 비디오 생성과 같은 기능을 지원합니다.
아래와 같이 : Goku+는 제품 이미지를 매력적인 비디오 클립으로 변환하여 엔드 투 엔드 최적화를 보장합니다. 이 프로세스는 마케팅 자료의 매력과 효과를 향상시킵니다.
아래와 같이 : 특정 제품을 보여주는 현실적이고 매력적인 비디오를 만듭니다. 이 비디오는 제품의 본질을 효과적으로 포착하고 잠재 고객 참여와 관심을 높입니다.
또한이 모델은 광고 시나리오를 최적화하기 위해 맞춤형 고화질 비디오의 텍스트 생성을 지원하며, 이는 경쟁사의 기본 비디오 모델보다 훨씬 우수합니다.
프로젝트 입구 : https://saiyan-world.github.io/goku/