Google Labs hat kürzlich Whisk auf den Markt gebracht, ein bildbasiertes KI-Tool zur Kunstgenerierung, das eine neue Erfahrung in die Kunsterstellung bringt. Im Gegensatz zu herkömmlichen Bildgenerierungstools mit Textaufforderungen ermöglicht Whisk Benutzern, Bilder direkt innerhalb des Tools hochzuladen oder zu generieren und Themen, Szenen und Stile anzugeben, um eine intuitivere künstlerische Gestaltung zu erreichen. Benutzer können verschiedene Komponenten kombinieren und mit Textansagen verfeinern, um einzigartige und kreative Kunstwerke zu schaffen. Die Technologie hinter Whisk ist eine Kombination aus dem leistungsstarken Sprachmodell und dem Bildgenerierungsmodell von Google, das die wesentlichen Merkmale des Bildes erfassen kann, anstatt es einfach zu kopieren.
Google Labs hat kürzlich Whisk, sein neuestes Experimentiertool für generative künstliche Intelligenz, in den USA auf den Markt gebracht. Im Gegensatz zu herkömmlichen Bilderzeugungstools, die hauptsächlich auf Texteingaben basieren, konzentriert sich Whisk auf die Verwendung von Bildern als Eingabemethode, sodass Benutzer Kunstwerke intuitiver erstellen können.
Benutzer können Bilder direkt auf Whisk hochladen oder Bilder innerhalb des Tools generieren und dabei Elemente wie Thema, Szene und Stil angeben. Mit dem Whisk-System können Benutzer diese Komponenten kombinieren und nach Bedarf mithilfe zusätzlicher Textaufforderungen verfeinern.
Es ist erwähnenswert, dass das Sprachmodell von Google (wahrscheinlich das kürzlich veröffentlichte Gemini 2.0 Flash) hinter den Kulissen automatisch eine detaillierte Beschreibung des Eingabebilds generiert. Diese Beschreibungen werden in das neueste Bildgenerierungsmodell von Google, Imagen3, eingespeist, das die wesentlichen Merkmale des Motivs erfasst, anstatt eine exakte Nachbildung zu erstellen.
AIbase hat viele Tests durchgeführt und die drei Bilder auf der linken Seite hochgeladen, um das Ergebnis auf der rechten Seite zu erhalten. Der Effekt ist ziemlich gut und die Spielbarkeit ist sehr hoch. wie folgt:
Da Whisk jedoch nur einige Schlüsselelemente aus jedem Quellbild extrahiert, warnt Google Nutzer davor, dass die resultierenden Bildergebnisse von den Erwartungen abweichen können. Das resultierende Bild kann sich beispielsweise in Größe, Gewicht, Frisur oder Hautfarbe vom Originalbild unterscheiden.
Google sagt, dass diese Details oft entscheidend für den Erfolg eines Projekts sind, sodass Nutzer die Textaufforderungen anzeigen und bearbeiten können, die den Bildgenerierungsprozess steuern.
Frühe Tester, darunter einige Künstler und Kreativprofis, sagen, Whisk fühle sich eher wie ein neues Kreativwerkzeug als wie ein herkömmlicher Bildeditor an. Google hofft, dass das Tool den Nutzern dabei helfen wird, schnell ein visuelles Brainstorming durchzuführen, statt es präzise zu bearbeiten, und es den Nutzern ermöglicht, schnell mehrere Optionen zu generieren und zu filtern, bevor sie ihre Lieblingswerke speichern.
Obwohl Whisk nach vorläufigen Tests sehr angenehm zu verwenden ist, erfordert es einige Sekunden Wartezeit, bis jedes neue Bild generiert wird. Diese Verzögerungen sind wahrscheinlich auf den hohen Datenverkehr zurückzuführen, da die Benutzer strömen, um das neue Tool auszuprobieren.
Derzeit ist Whisk nur für Nutzer in den USA verfügbar. Nutzer können es unter labs.google/whisk kostenlos testen und Feedback geben. Benutzer in anderen Ländern haben vorübergehend keinen Zugriff auf dieses Tool.
Whisk ist Teil von Google Labs, dem Testgelände von Google zum Testen seiner KI-Projekte, darunter Gemini, Imagen und das neueste Videomodell Veo2. Während sich die meisten Projekte noch im experimentellen Stadium befinden, werden einige erfolgreiche Projekte, wie beispielsweise der kürzlich offiziell veröffentlichte KI-Assistent NotebookLM, in vollständige Produkte umgewandelt.
Produkterfahrungsadresse: https://top.aibase.com/tool/whisk
Highlight:
Google bringt Whisk auf den Markt, das erste bildgesteuerte generative KI-Tool.
Benutzer können Bilder hochladen oder generieren, um sie schnell visuell zu gestalten, anstatt sie präzise zu bearbeiten.
Die Testversion ist derzeit auf Benutzer in den Vereinigten Staaten beschränkt und für andere Länder vorübergehend nicht zugänglich.
Alles in allem bietet Whisk als neuartiges, von Google Labs eingeführtes Tool zur KI-Bildgenerierung Benutzern eine intuitivere und schnellere Möglichkeit, Kunst zu erstellen. Obwohl es sich noch in der Testphase befindet, ist sein Potenzial enorm und seine zukünftige Entwicklung lohnt sich Ich freue mich darauf. Wir freuen uns darauf, Whisk in Zukunft auf globale Benutzer auszudehnen und seine Funktionalität und Leistung weiter zu optimieren.