Google hat mit Veo2 ein neues Videogenerationsmodell veröffentlicht, das mit Sora von OpenAI konkurrieren soll. Veo2 hat den Videorealismus und die Detailleistung erheblich verbessert und verfügt über ein tieferes Verständnis der physikalischen Gesetze, der menschlichen Bewegung und subtiler Veränderungen im Ausdruck. Dieses Update verbessert nicht nur die Videoqualität, sondern verbessert auch die Fähigkeit des Modells, Benutzeranweisungen zu verstehen und auszuführen, wodurch ein leistungsfähigeres Werkzeug für die Videoerstellung bereitgestellt wird. Über die VideoFX-Plattform von Google Labs können Benutzer die leistungsstarken Funktionen von Veo2 erleben, Videos mit einer Auflösung von bis zu 4K erstellen und Videotypen, Objektive und Filmeffekte auswählen. Allerdings ist zu beachten, dass Veo2 derzeit nur für Nutzer auf der Warteliste verfügbar ist und diese sich über das Google-Formular bewerben müssen.
Google hat offiziell sein Videogenerationsmodell Veo2 der neuen Generation veröffentlicht, das mit Sora von OpenAI konkurrieren soll. Google sagt, dass Veo2 beim Generieren von Videos realistischer und detaillierter ist. Dieses Update verbessert nicht nur die Videoqualität, sondern verbessert auch das Verständnis der realen Physik und der Nuancen menschlicher Bewegung und Ausdruck.
Die Kraft von Veo2
Laut Google verfügt Veo2 über „ein besseres Verständnis der realen Physik und der Nuancen menschlicher Bewegung und Ausdrucksweise“. Es ist auf der VideoFX-Plattform von Google Labs verfügbar, jedoch nur auf Wartelistenbasis. Nutzer müssen sich über ein Google-Formular registrieren und warten, bis Google zu einem von ihnen gewählten Zeitpunkt vorübergehend Zugriff gewährt.
Laut Google können Benutzer die Art des Videos, die Linse und die Filmeffekte entsprechend ihren Anforderungen auswählen und Veo2 wird in der Lage sein, Videos mit einer Auflösung von bis zu 4K zu erstellen.
Im Gegensatz dazu ist das ursprüngliche Veo weiterhin auf Vertex AI verfügbar, und von Veo2 generierte Videos werden mit Googles Metadaten-Wasserzeichen SynthID versehen, um sie als KI-generierten Inhalt zu identifizieren.
Trotz der technischen Fortschritte von Veo2 gibt Google zu, dass das Modell gelegentlich „Halluzinationen“ wie zusätzliche Finger zeigt, aber insgesamt erzeugt die neue Version weniger Halluzinationen.
Google sagte, dass in seinen eigenen internen Tests, die die „Gesamtpräferenz“ (d. h. welche Videos die Zuschauer bevorzugen) und die „zeitnahe Einhaltung“ (wie gut ein Video den Anweisungen menschlicher Ersteller entspricht) gemessen werden, menschliche Bewerter Veo gegenüber dem künstlichen bevorzugten Geheimdienstmodelle von Sora und anderen Konkurrenten.
Zugang zum Veo2-Erlebnis: https://labs.google/fx/tools/video-fx
Einführungseingang: https://deepmind.google/technologies/veo/veo-2/
Die Erstellung von KI-Videos erfordert noch Arbeit
Obwohl sich die Technologie zur KI-Videogenerierung ständig verbessert, bleibt der Wettbewerb zwischen Google und großen Playern wie OpenAI hart. Andere kleinere Unternehmen wie RunwayML und Luma AI führen ebenfalls neue Funktionen ein, um ihre Möglichkeiten zur Videoerstellung zu verbessern.
Kürzlich führte RunwayML erweiterte Steuerungsfunktionen für das Gen-3Alpha Turbo-Modell ein, während Pika Labs Pika 2.0 veröffentlichte, das es Benutzern ermöglicht, Videos ihre eigenen Charaktere hinzuzufügen.
Allerdings ist das Vertrauen der Nutzer in KI-generierte Videos noch unzureichend. Die Veröffentlichung von Sora hat die Zweifel der Menschen nicht vollständig beseitigt, und einige Benutzer berichteten, dass die generierten Ergebnisse physische und anatomische Verstöße aufwiesen. Darüber hinaus äußerten die Zuschauer der jüngsten Gaming-Award-Shows ihre Unzufriedenheit mit dem „KI-Chaos“ der KI-generierten Inhalte.
Laut Google haben viele Nutzer starkes Interesse an Veo2 bekundet, insbesondere einige YouTube-Ersteller, die VideoFX bereits verwenden, um Hintergründe für ihre kurzen Videos zu erstellen, um Zeit zu sparen.
Imagen3-Updates
Neben Veo2 hat Google auch sein Bildgenerierungsmodell Imagen3 aktualisiert, das den Realismus und die Farbbrillanz der generierten Bilder weiter verbessert. Die neue Version von Imagen3 kann eine Vielzahl künstlerischer Stile genauer darstellen, vom fotografischen Realismus über den Impressionismus bis hin zu abstrakten und Anime-Stilen. Gleichzeitig schnitt das Modell auch besser darin ab, Benutzeranweisungen zu befolgen.
Highlight:
– Google veröffentlicht das Veo2-Videogenerierungsmodell und behauptet, dass seine Videoqualität besser sei als die von OpenAIs Sora.
- Benutzer können sich über das Google-Formular für die Verwendung von Veo2 bewerben und beim Erstellen von Videos Stile und Effekte auswählen.
- Das aktualisierte Bildgenerierungsmodell von Imagen3 kann verschiedene künstlerische Stile besser zum Ausdruck bringen und ein besseres Benutzererlebnis bieten.
Alles in allem stellt das Aufkommen von Veo2 einen weiteren Fortschritt in der KI-Videogenerierungstechnologie dar, zeigt aber auch, dass der Bereich noch vor vielen Herausforderungen steht. Kontinuierliche Weiterentwicklung der Technologie und Verbesserung des Benutzererlebnisses werden die zukünftige Entwicklungsrichtung sein.