Google hat ein neues KI-Bildgenerierungstool namens Whisk auf den Markt gebracht, das die traditionelle Art der Bildgenerierung völlig verändert. Anders als früher waren lange Textbeschreibungen erforderlich, ermöglicht Whisk Benutzern das direkte Hochladen von Bildern als Aufforderungswörter, um das Thema, die Szene und den Stil der generierten Bilder anzugeben. Benutzer können für jeden dieser drei Aspekte mehrere Bilder bereitstellen, und Whisk integriert diese visuellen Informationen geschickt, um unerwartete Bilder zu generieren. Selbst wenn kein passendes Bild vorhanden ist, bietet Whisk auch eine Funktion zur zufälligen Bildgenerierung, damit Benutzer schnell mit der Erstellung beginnen können.
Google hat ein neues KI-Tool namens Whisk veröffentlicht, das das traditionelle Bildgenerierungsmodell untergräbt und es Benutzern ermöglicht, Bilder als Aufforderungsworte anstelle langer Textbeschreibungen zu verwenden.
Mit Whisk können Sie Bilder hochladen, um das Thema, die Szene und den Stil der KI-generierten Bilder festzulegen, und Sie können für jedes der drei Bilder mehrere Bilder verwenden.
Ich habe zum Beispiel ein Bild eines Schweins und ein Bild einer Katze eingegeben, den Stil einer Illustration ausgewählt und dann keine Aufforderungswörter eingegeben (natürlich können Sie auch gleichzeitig Textaufforderungen verwenden). , es gab mir automatisch ein solches Rendering wurde generiert. Beachten Sie, dass SCENE im Allgemeinen Szenenbilder eingibt. Wenn Sie wie ich Charakterbilder eingeben müssen, ist dies möglicherweise nicht sehr relevant, es kann jedoch zu unerwarteten Überraschungen kommen.
Wenn Sie kein passendes Bild zur Hand haben, können Sie auf das Würfelsymbol klicken, damit Google automatisch einige Bilder als Eingabeaufforderungen ausfüllt (diese Bilder scheinen ebenfalls KI-generiert zu sein).
Ich habe beiläufig geklickt und Google hat zufällig Bilder von einem Hund, einem Boot und einer Stickerei angezeigt, um zu sehen, welche Wirkung die Mischung haben würde:
Der Effekt ist ziemlich gut. Die Elemente der drei Bilder fügen sich perfekt zu einem interessanten Stickbild zusammen
Als ich auf das Bild klickte, stellte ich fest, dass Whisk auch Texthinweise für jedes generierte Bild bereitstellt. Wenn Sie mit dem Ergebnis zufrieden sind, können Sie das Bild speichern oder herunterladen. Wenn Sie es weiter optimieren möchten, können Sie mehr Text in das Textfeld einfügen oder direkt auf das Bild klicken, um die Textaufforderung zu bearbeiten.
Google betonte in einem Blogbeitrag, dass Whisk für „schnelle visuelle Erkundung und nicht für pixelgenaue Bearbeitung“ konzipiert sei. Das Unternehmen gibt außerdem an, dass Whisk „aus der Spur geraten“ kann, sodass Benutzer die zugrunde liegenden Eingabeaufforderungswörter bearbeiten können.
Ich habe ein paar Minuten mit dem Whisk-Tool herumgespielt und fand es sehr interessant. Während die Bilderzeugung einige Sekunden dauert und die resultierenden Bilder manchmal etwas seltsam aussehen können, macht der iterative Prozess Spaß.
Laut Google verwendet Whisk die neueste Version des Imagen3-Bilderzeugungsmodells, das heute ebenfalls offiziell veröffentlicht wurde. Google hat außerdem ein Videogenerationsmodell der neuen Generation, Veo2, veröffentlicht, das angeblich die „einzigartige Sprache von Filmen“ verstehen und „weniger“ Artefakte wie zusätzliche Finger haben soll. Veo2 wird zuerst in Googles VideoFX eingeführt, und Nutzer können sich über eine Google Labs-Warteliste zum Ausprobieren bewerben. Im nächsten Jahr ist eine Ausweitung auf YouTube Shorts und andere Produkte geplant.
Alles in allem hat das Aufkommen von Whisk der Bildgenerierung neue Möglichkeiten eröffnet, sodass Benutzer ihre Kreativität mit visuellen Mitteln ausdrücken und Bilder bequemer personalisieren können.
Produkterfahrungsadresse: https://top.aibase.com/tool/whisk
Mit seiner innovativen Bilderzeugungsmethode bietet Whisk Benutzern eine intuitivere und bequemere Bilderstellungserfahrung, die einen Versuch wert ist. Beeilen Sie sich und besuchen Sie den Link, um dieses leistungsstarke KI-Tool kennenzulernen!