O Google lançou recentemente seu mais recente modelo de geração de vídeo, VideoPoet, que pode gerar vídeos de até 10 segundos de duração e gerar automaticamente os efeitos sonoros da trilha sonora correspondentes. Diferente dos modelos de difusão anteriores, o VideoPoet utiliza um grande modelo de linguagem, que permite integrar múltiplas funções como texto em vídeo, reparo de vídeo e estilização de vídeo, melhorando muito a flexibilidade e eficiência de uso. Seu mecanismo exclusivo de extensão de vídeo cria a ilusão de extensão infinita do vídeo, prevendo repetidamente o conteúdo do próximo quadro do último quadro, trazendo aos usuários uma nova experiência de geração de vídeo.
No dia 19 de dezembro, o Google lançou o modelo de geração de vídeo VideoPoet. Este modelo pode gerar vídeos de até 10 segundos de duração e também pode gerar automaticamente efeitos sonoros de trilha sonora com base no conteúdo do vídeo. VideoPoet estende o vídeo prevendo repetidamente o conteúdo do próximo quadro do último quadro do vídeo, fazendo com que o usuário sinta que o vídeo pode ser estendido infinitamente. Ao contrário de outros modelos, o VideoPoet usa um modelo de linguagem grande em vez de um modelo de difusão, por isso integra múltiplas funções, como texto para vídeo, reparo de vídeo e estilização de vídeo no mesmo modelo, tornando-o mais flexível de usar.
O surgimento do VideoPoet marca um avanço significativo na tecnologia de geração de vídeo. Espera-se que suas funções poderosas e métodos de operação convenientes sejam amplamente utilizados em vários campos no futuro, proporcionando aos usuários uma experiência de criação de vídeo mais rica e conveniente. Esperamos que o VideoPoet traga mais recursos e aplicações surpreendentes no futuro.