Kürzlich hat OpenAI eine überzeugende Nachricht veröffentlicht: In seinem internen Testprojekt Sora wird neben der gestarteten Videogenerierungsfunktion auch die Bildgenerierungsfunktion in vollem Gange entwickelt. Mit dieser neuen Funktion können Benutzer schnell zwischen Video- und Bildgenerierung wechseln und die kreative Flexibilität verbessern.
Laut internen Nachrichten fügt Sora eine versteckte Schaltfläche um, und Benutzer können zwischen den beiden Modi wechseln, indem sie einfach in der Eingabeaufforderung ausgewählt werden. Bei der Auswahl der Bildgenerierung fordert das System den Benutzer automatisch auf, ein Bild zu beschreiben. Dieses Design soll Benutzeroperationen vereinfachen und die Relevanz und Qualität generierter Inhalte verbessern.
Zusätzlich zu Verbesserungen der Bildgenerierungsfunktionen hat Sora auch seinen Video -Push umklassifiziert. Die neu gestarteten Kategorien "Best" und "Top" helfen den Benutzern, bessere Filter zu filtern und Inhalte zu finden. Die Kategorie „Beste“ Bestätigung ähnelt den aktuellen Kanälen, während die Kategorie „Top“ Videos basierend auf der Anzahl der Likes von Benutzern oder Zeiträumen rangieren kann. Diese Änderung in dieser Kategorie lässt die Menschen auf Soras Inhaltsempfehlungsmechanismus freuen.
Für Dall-E3-Benutzer sind die Nachrichten zweifellos aufregend, da Dall-E3 seit seiner Einführung etwas veraltet ist, insbesondere im Vergleich zu Wettbewerbern wie Midjourney. Obwohl Soras Bildgenerierungsfunktion noch nicht offiziell gestartet wurde, hat die Kategorie "Bilder interne" in der linken Navigationsleiste die Neugier der Benutzer geweckt. Obwohl diese Kategorie derzeit hauptsächlich für Video -Push verwendet wird, kann sie auch in Zukunft verwandte Inhalte für die Bildgenerierung bereitstellen.
Einige Leute spekulieren, dass dieses Modell für Bildgenerierung als Dall-E4 bezeichnet werden kann, aber Openai hat dies noch nicht bestätigt. Branchenexperten spekulieren, dass der Bildgenerator in Sora Dall-E4 möglicherweise nicht direkt verwendet, sondern sich auf das vorhandene "Sora-Turbo" -Modell verlassen wird. Darüber hinaus wiesen Branchenkenner darauf hin, dass ChatGPT die multimodale Bildgenerierungsfunktion auf der Basis von GPT-4O noch nicht gestartet hat, sodass der Start des Sora-Projekts ein neuer Fortschritt sein wird, der der Aufmerksamkeit würdig ist.
Es ist erwähnenswert, dass der Codename des Text-zu-Image-Generators in Sora "Papaya" genannt wird, was die Menschen in diesem Projekt neugierig und erwartungsvoll macht. Eineinhalb Jahre nach der Veröffentlichung von Dall-E3, welche Art von Innovation wird das Modell der nächsten Generation bringen, das Menschen herausfinden wollen.
Kurz gesagt, Soras Image -Generierungsfunktion steht vor der Tür und bietet den Benutzern kreativere Möglichkeiten, die es wert ist, sich darauf zu freuen.