Open-Sora Plan v1.2 ist da! Dieses Update bringt revolutionäre Verbesserungen mit sich, deren Kern in der neuen 3D-Vollaufmerksamkeitsarchitektur liegt, die die Art und Weise, wie KI die physische Welt versteht, völlig verändert und einen Sprung von der Ebene zur Dreidimensionalität schafft. Neben der deutlichen Verbesserung der Fähigkeit, die physische Welt zu verstehen, wurde auch die Fähigkeit, Videos aus Text zu generieren, erheblich verbessert. Die Klarheit und Konsistenz der generierten Videos wurde ebenfalls verbessert wurde deutlich optimiert und die Inferenzgeschwindigkeit wurde sogar noch deutlich verbessert. Werfen wir einen Blick auf die detaillierten Updates von Open-Sora Plan v1.2.
Open-Sora Plan wurde erneut aktualisiert! Die neueste Version von Open-Sora Plan v1.2 führt eine neue 3D-Vollaufmerksamkeitsarchitektur ein, die das Verständnis der physischen Welt verbessert.
Wichtigste Highlights dieses Updates:
Neue 3D-Architektur mit voller Aufmerksamkeit: Die neue Architektur ermöglicht der KI einen qualitativen Sprung beim Verständnis der physischen Welt. Es ist kein QR-Code mehr, der nur in zwei Dimensionen denken kann, jetzt kann er diese dreidimensionale Welt um 360 Grad ohne tote Winkel verstehen!
Verbesserte Videofunktionen zur Textgenerierung: Sie geben einen Text ein und die KI kann Ihnen ein lebensechtes Videobild präsentieren.
Verbesserte Klarheit und Konsistenz: Durch die neue Architektur und die optimierte VAE-Struktur ist die von Open-Sora generierte Videoqualität klarer und der Inhalt kohärenter. Verabschieden Sie sich von der Mehrdeutigkeit!
Perfekte Integration von Raum und Zeit: Die neue 3D-Vollaufmerksamkeitsarchitektur löst ein großes Problem der Vorgängerversion – die gleichzeitige Verarbeitung von Raum- und Zeitdimensionen. Was bedeutet das? Das generierte Video wird in Bezug auf räumliche Leistung und zeitliche Fließfähigkeit deutlich verbessert!
Die Inferenzgeschwindigkeit wird erheblich verbessert: Die optimierte CausalVideoVAE-Struktur verbessert nicht nur die Leistung des Modells, sondern lässt auch die Inferenzgeschwindigkeit in die Höhe schnellen. Effizienzparteien jubeln!
Wenn wir auf die Entwicklungsgeschichte von Open-Sora zurückblicken, werden wir feststellen, dass die Fortschritte erstaunlich sind. Noch im Mai 2024 nutzte die Version v1.1.0 noch die 2+1D-Modellarchitektur, die hauptsächlich für exploratives Training verwendet wurde. Und jetzt, nur wenige Monate später, hat es sich zu einem Schöpfer entwickelt, der eine 3D-Welt erschaffen kann. In einem solchen Tempo hätte sogar Darwin ausgerufen: Die Evolutionstheorie wird neu geschrieben!
Das Coolste ist, dass das Open-Sora-Team nichts verbirgt! Der Code, die Daten und die Modelle sind alle Open Source und sie kleben Ihnen nur die Anweisungen zur Erschaffung der Welt ins Gesicht. Ihr Ziel ist einfach: Lassen Sie jeden zum Gott der Videoerstellung werden. Diese offene und teilende Haltung wird zweifellos den Fortschritt der KI-Videogenerierungstechnologie beschleunigen.
Die Veröffentlichung von Open-Sora Plan v1.2.0 markiert eine neue Ära für Videogenerierungsmodelle. Es verbessert nicht nur die Komprimierung der visuellen Darstellung und die Argumentationseffizienz erheblich, sondern zeigt auch die Richtung für die zukünftige Entwicklung auf.
Projektadresse: https://top.aibase.com/tool/open-sora-plan-v1-2
Die Veröffentlichung von Open-Sora Plan v1.2 kündigt an, dass die KI-Videogenerierungstechnologie in eine neue Entwicklungsstufe eingetreten ist, und ihre Open-Source-Funktion gibt auch einen starken Impuls für den technologischen Fortschritt. Wir freuen uns auf weitere Überraschungen, die Open-Sora in Zukunft bringen kann!