Alibaba lança modelo de texto + imagem de vídeo AtomoVideo, comparável ao Gen-2 e Pika

Autor：Eve Cole Data da Última Atualização：2025-01-04 19:48:01

A equipe técnica do Alibaba lançou recentemente o modelo AtomoVideo, um modelo de IA que pode gerar vídeos de alta fidelidade baseados em texto e imagens. O avanço técnico deste modelo reside em sua inovadora tecnologia de injeção de imagem multigranularidade e modelagem temporal, que demonstrou desempenho comparável a modelos comerciais em avaliações. Isto marca um progresso significativo no campo da geração de vídeo, traz possibilidades ilimitadas para a criação futura de conteúdos de vídeo e também anuncia o avanço contínuo da IA no campo da geração de conteúdos multimodais.

A equipe técnica do Alibaba lançou o modelo AtomoVideo, que pode gerar vídeos de alta fidelidade a partir de texto e imagens. As inovações técnicas incluem injeção de imagem multigranular e modelagem de tempo. Avaliações mostram que é comparável aos modelos comerciais, trazendo novas possibilidades para a área de geração de vídeo.

O surgimento do modelo AtomoVideo não só melhora a eficiência e a qualidade da geração de vídeo, mas também fornece novas ferramentas e ideias para a criação de conteúdo de vídeo em todas as esferas da vida. No futuro, com o avanço contínuo da tecnologia, acredito que o modelo AtomoVideo desempenhará um papel em mais campos e nos trará conteúdos de vídeo mais interessantes.