El nuevo proyecto del generador de imágenes beta interna de Sora de Openai, ¿puede lanzar Dall-E 4? - Artículos de IA

Autor：Eve Cole Fecha de actualización：2025-02-15 04:48:02

Recientemente, Openai lanzó una noticia convincente: en su proyecto de prueba interna, Sora, además de la función de generación de videos que se ha lanzado, la función de generación de imágenes también se está desarrollando en pleno apogeo. Esta nueva característica permite a los usuarios cambiar rápidamente entre la generación de videos y imágenes, mejorando la flexibilidad creativa.

Según los mensajes internos, SORA agregará un botón oculto de palanca, y los usuarios pueden cambiar entre los dos modos simplemente seleccionando en la barra de inmediato. Al seleccionar la generación de imágenes, el sistema solicitará automáticamente al usuario que describa una imagen. Este diseño está diseñado para simplificar las operaciones del usuario y mejorar la relevancia y la calidad del contenido generado.

Además de las mejoras en las capacidades de generación de imágenes, SORA también ha reclasificado su impulso de video. Las categorías "mejores" y "superiores" recientemente lanzadas ayudarán a los usuarios a filtrar mejor y encontrar contenido. La categoría "mejor" es similar a los canales destacados actuales, mientras que la categoría "superior" puede clasificar videos en función de la cantidad de me gusta de los usuarios o los períodos de tiempo. Este cambio en la categoría hace que las personas esperen el mecanismo de recomendación de contenido de Sora.

Para los usuarios de Dall-E3, la noticia es indudablemente emocionante, ya que Dall-E3 ha estado algo desactualizado desde su lanzamiento, especialmente en comparación con competidores como MidJourney. Aunque la función de generación de imágenes de Sora aún no se ha lanzado oficialmente, la categoría de "imágenes internos" en la barra de navegación izquierda ha despertado la curiosidad de los usuarios. Aunque esta categoría se usa actualmente principalmente para el impulso de video, también puede proporcionar contenido relacionado para la generación de imágenes en el futuro.

Algunas personas especulan que este modelo de generación de imágenes puede llamarse Dall-E4, pero OpenAI aún no ha confirmado esto. Los expertos de la industria especulan que el generador de imágenes en SORA puede no usar Dall-E4 directamente, pero dependerá del modelo existente "Sora-Turbo". Además, los expertos de la industria también señalaron que ChatGPT aún no ha lanzado la función de generación de imágenes multimodal basada en GPT-4O, por lo que el lanzamiento del proyecto SORA será un nuevo progreso digno de atención.

Vale la pena señalar que el nombre de código del generador de texto a imagen en Sora se llama "papaya", lo que hace que las personas sean curiosas y expectantes sobre este proyecto. Un año y medio después del lanzamiento de Dall-E3, ¿qué tipo de innovación traerá el modelo de próxima generación es algo que hace que la gente quiera descubrir?

En resumen, la función de generación de imágenes de Sora está a punto de ser lanzada, proporcionando a los usuarios posibilidades más creativas, que vale la pena esperar.