Récemment, OpenAI a publié une nouvelle convaincante: dans son projet de test interne, Sora, en plus de la fonction de génération vidéo qui a été lancée, la fonction de génération d'images est également développée en plein essor. Cette nouvelle fonctionnalité permet aux utilisateurs de basculer rapidement entre la génération vidéo et l'image, améliorant la flexibilité créative.
Selon les messages internes, Sora ajoutera un bouton à bascule caché et les utilisateurs peuvent basculer entre les deux modes en sélectionnant simplement dans la barre d'invite. Lors de la sélection de la génération d'images, le système invite automatiquement l'utilisateur à décrire une image. Cette conception est conçue pour simplifier les opérations des utilisateurs et améliorer la pertinence et la qualité du contenu généré.
En plus des améliorations des capacités de génération d'images, Sora a également reclassé sa poussée vidéo. Les catégories «meilleures» et «supérieures» nouvellement lancées aideront les utilisateurs à mieux filtrer et trouver du contenu. La catégorie «meilleure» est similaire aux canaux en vedette actuels, tandis que la catégorie «Top» peut classer les vidéos en fonction du nombre de likes des utilisateurs ou des périodes de temps. Ce changement dans la catégorie fait que les gens attendent avec impatience le mécanisme de recommandation de contenu de Sora.
Pour les utilisateurs de Dall-E3, les nouvelles sont sans aucun doute excitantes, car Dall-E3 a été quelque peu dépassée depuis son lancement, en particulier par rapport à des concurrents comme MidJourney. Bien que la fonction de génération d'images de Sora n'ait pas encore été officiellement lancée, la catégorie "Images internes" dans la barre de navigation gauche a suscité la curiosité des utilisateurs. Bien que cette catégorie soit actuellement principalement utilisée pour la poussée vidéo, elle peut également fournir un contenu connexe pour la génération d'images à l'avenir.
Certaines personnes spéculent que ce modèle de génération d'images peut être appelé Dall-E4, mais OpenAI n'a pas encore confirmé cela. Les experts de l'industrie spéculent que le générateur d'images à Sora peut ne pas utiliser DALL-E4 directement, mais s'appuiera sur le modèle "Sora-turbo" existant. De plus, les initiés de l'industrie ont également souligné que Chatgpt n'a pas encore lancé la fonction de génération d'images multimodales basée sur GPT-4O, de sorte que le lancement du projet SORA sera un nouveau progrès digne d'attention.
Il convient de noter que le nom de code du générateur de texte à l'image à Sora est appelé "Papaya", ce qui rend les gens curieux et attendants à propos de ce projet. Un et demi après la sortie de Dall-E3, quel type d'innovation le modèle de génération apportera-t-il est quelque chose qui donne envie aux gens de découvrir.
En bref, la fonction de génération d'images de Sora est sur le point d'être lancée, offrant aux utilisateurs des possibilités plus créatives, ce qui vaut la peine d'attendre.