Na Conferência Mundial de Inteligência Artificial (WAIC) de 2024, o SenseTime fez uma aparição impressionante e lançou seu grande modelo de geração de vídeo de caracteres controláveis - Vimi. Este atraente modelo de IA trouxe mudanças revolucionárias no campo da criação de vídeo com sua poderosa força técnica e cenários de aplicação inovadores. O editor de Downcodes lhe dará uma compreensão aprofundada da singularidade do modelo Vimi e da nova experiência que ele traz aos usuários.
Na Conferência Mundial de Inteligência Artificial (WAIC) de 2024, a SenseTime lançou o Vimi, um modelo de geração de vídeo de caracteres grandes e controláveis. O modelo Vimi usa a avançada tecnologia de modelos grandes do SenseTime para gerar um vídeo de um personagem consistente com os movimentos do alvo através de uma única foto, alcançando expressão precisa e controle corporal. Este modelo suporta vários métodos de condução, incluindo vídeo, animação, som e texto. Possui anos de tecnologia de rastreamento facial acumulada e controle preciso de detalhes, e pode gerar conteúdo de vídeo com alta consistência e luz e sombra harmoniosas.
A estabilidade do Vimi é particularmente notável e pode gerar vídeos humanos de lente única que duram mais de 1 minuto, e o efeito da imagem não se deteriorará com o tempo. Ele também pode ajustar a cena do ambiente de acordo com os movimentos do personagem, simular mudanças de ângulo da câmera e tremores de cabelo e fornecer efeitos visuais realistas. Além disso, o Vimi também suporta simulação de mudança de luz e sombra, proporcionando aos criadores de vídeo uma rica liberdade criativa.
Sendo o primeiro aplicativo C-side baseado no modelo grande do Vimi, o Vimi Camera é voltado principalmente para usuários do sexo feminino para atender às suas necessidades de entretenimento e criação. Depois que os usuários carregam fotos de pessoas em alta definição de diferentes ângulos, a câmera Vimi pode gerar automaticamente avatares digitais e vídeos fotográficos de diferentes estilos, proporcionando estilos de geração diversificados. A câmera Vimi também suporta a geração de emoticons de personagens interessantes a partir de uma única imagem, com diversas formas de brincar e realizar criações personalizadas.
Atualmente, a câmera Vimi está aberta para testes internos. Os usuários interessados podem solicitar a experiência seguindo a conta oficial e preenchendo o link de reserva.
O modelo Vimi e seu aplicativo de câmera Vimi demonstram a forte força do SenseTime no campo da IA e sua compreensão precisa das necessidades do usuário, oferecendo possibilidades ilimitadas para criação futura de vídeos. Acredito que o Vimi liderará a nova tendência da tecnologia de geração de vídeo e trará mais surpresas aos usuários!