Recentemente, o Openai lançou uma notícia convincente: em seu projeto de teste interno, Sora, além da função de geração de vídeo que foi lançada, a função de geração de imagens também está sendo desenvolvida em pleno andamento. Esse novo recurso permite que os usuários alternem rapidamente entre geração de vídeo e imagem, melhorando a flexibilidade criativa.
De acordo com as mensagens internas, o SORA adicionará um botão de alternância oculto e os usuários podem alternar entre os dois modos simplesmente selecionando na barra prompt. Ao selecionar a geração de imagens, o sistema solicitará automaticamente o usuário a descrever uma imagem. Esse design foi projetado para simplificar as operações do usuário e melhorar a relevância e a qualidade do conteúdo gerado.
Além das melhorias nos recursos de geração de imagens, a SORA também reclassificou seu impulso em vídeo. As categorias recém -lançadas "Best" e "Top" ajudarão os usuários a filtrar e encontrar conteúdo melhor. A categoria "Melhor" é semelhante aos canais atuais em destaque, enquanto a categoria "Top" pode classificar vídeos com base no número de curtidas de usuários ou períodos de tempo. Essa mudança na categoria faz com que as pessoas esperam ansiosamente pelo mecanismo de recomendação de conteúdo de Sora.
Para os usuários do Dall-E3, as notícias são, sem dúvida, emocionantes, pois o Dall-E3 está um pouco desatualizado desde o seu lançamento, especialmente quando comparado a concorrentes como o Midjourney. Embora a função de geração de imagens de Sora ainda não tenha sido lançada oficialmente, a categoria "imagens internas" na barra de navegação esquerda despertou a curiosidade dos usuários. Embora essa categoria seja atualmente usada principalmente para push de vídeo, ela também pode fornecer conteúdo relacionado para geração de imagens no futuro.
Algumas pessoas especulam que esse modelo de geração de imagens pode ser chamado de Dall-E4, mas o OpenAI ainda não confirmou isso. Especialistas do setor especulam que o gerador de imagens em Sora pode não usar diretamente o Dall-E4, mas dependerá do modelo existente "Sora-Turbo". Além disso, os especialistas do setor também apontaram que o ChatGPT ainda não lançou a função de geração de imagens multimodais com base no GPT-4O, portanto o lançamento do projeto SORA será um novo progresso digno de atenção.
Vale a pena notar que o nome de código do gerador de texto para imagem em Sora é chamado de "mamão", o que torna as pessoas curiosas e expectantes sobre esse projeto. Um ano e meio após o lançamento do Dall-E3, que tipo de inovação o modelo de próxima geração trará é algo que faz as pessoas quererem descobrir.
Em suma, a função de geração de imagens de Sora está prestes a ser lançada, fornecendo aos usuários possibilidades mais criativas, o que vale a pena esperar.