A OpenAI lançou recentemente seu tão aguardado modelo de geração de vídeo Sora Turbo, marcando um grande avanço no campo da IA generativa em 2024. Sora Turbo melhorou significativamente a eficiência e a duração da geração de vídeo. Ele pode gerar vídeos de alta definição 1080P de até 20 segundos com base em texto, imagens ou prompts de vídeo e suporta uma variedade de funções, como super pontuação, super-. quadro e linha de jogos HDR. Suporte completo para jogos, etc., melhora muito a experiência do usuário. Suas funções poderosas e uso conveniente fazem dele um dos modelos de vídeo com maior tempo de geração do mundo.
A OpenAI lançou o tão aguardado produto Sora Turbo na transmissão ao vivo de hoje, marcando um grande avanço no campo da IA generativa em 2024. A eficiência de geração do Sora Turbo foi significativamente melhorada e ele pode gerar diretamente vídeos 1080P de até 20 segundos a partir de texto, tornando-o um dos modelos de vídeo com maior tempo de geração do mundo. Este modelo suporta a entrada de texto mais imagens ou vídeos para gerar conteúdo de vídeo específico, tornando o efeito de geração mais controlável.
Os destaques técnicos do Sora Turbo incluem suporte completo para linhas de jogos super-score, super-frame e HDR, bem como duas atualizações de funções desenvolvidas por ele mesmo com base em gráficos independentes. Entre eles, a função de inserção dinâmica de quadros por toque pode melhorar significativamente a precisão da inserção de quadros e reduzir os danos à imagem. O modo noturno escuro do jogo usa algoritmos de IA para melhorar os detalhes escuros e aprimorar os efeitos visuais das áreas escuras, enquanto resolve o problema de brilho do jogo; jogos em ambientes escuros e claros.
Atualmente, o Sora entrou na fase de uso ilimitado. Para membros ChatGPT Plus e Pro, não há custo adicional para usar o Sora. Esta política é considerada muito cuidadosa. A OpenAI também desenvolveu uma nova interface de usuário e fornece serviços de compartilhamento comunitário, permitindo aos usuários compartilhar seus próprios vídeos gerados ou aprender com os efeitos imediatos de outras pessoas para melhorar seus trabalhos.
Os princípios técnicos da Sora incluem a aplicação de patches, que permitem treinamento intensivo em grandes quantidades de dados de imagem e vídeo, e a aplicação de redes de compressão de vídeo, que reduzem a dimensionalidade dos dados visuais e melhoram a qualidade da saída.
Sora também integra o modelo de difusão e a arquitetura Transformer, usando um método inovador de transformador de difusão para substituir a arquitetura U-Net tradicional, melhorando efetivamente a capacidade de capturar a relação de distribuição entre imagens de entrada e rótulos de texto. Além disso, Sora introduziu a tecnologia de re-legendas do DALL・E3 para criar legendas de texto para todos os vídeos no conjunto de treinamento, treinando um modelo de legenda altamente descritivo, melhorando a fidelidade do texto e a qualidade geral do vídeo.
Endereço da experiência: https://sora.com/
O surgimento do Sora Turbo não apenas melhora a eficiência e a qualidade da geração de vídeo por IA, mas também fornece aos usuários ferramentas criativas mais convenientes e poderosas. A política aberta e a função de compartilhamento comunitário da OpenAI promovem ainda mais a popularização e o desenvolvimento da tecnologia de IA. Acredito que Sora Turbo desempenhará um papel maior na área de geração de vídeo de IA no futuro e trará mais surpresas aos usuários.