Nach dem Versionsupdate im September erfuhr Guangcone Intelligence aus dem Freundeskreis von Tang Jiayu, Mitbegründer und CEO von Shengshu Technology, dass das Vidu-Großmodell diese Woche erneut aktualisiert wird und die Vidu-1.5-Version bald auf den Markt kommen wird.
Die Aktualisierungsrichtung dieser Version konzentriert sich weiterhin auf die Erweiterung der Generalisierungsfähigkeit und der Themenkonsistenz großer Modelle. Die vorherige Version konzentrierte sich auf die Konsistenz eines einzelnen Subjekts, während die neueste Version mehrere Konzepte wie Charaktere, Objekte und Umgebungen verstehen und integrieren und Benutzeranweisungen befolgen kann, um innerhalb von 30 Sekunden relevante Videoergebnisse der Fusion mehrerer Subjekte zu generieren Führend in der Videoerstellung.
Neben Vidu haben laut unvollständigen Statistiken seit September dieses Jahres auch gängige KI-Videogenerierungsplattformen, darunter Jimeng AI von Bytedance, Kuaishou Keling AI, Runway, Zhipu Qingying, Aishi Technology PixVerse und Pika, ein Versionsupdate durchgeführt.
Derzeit sind große Modell-Start-ups und große Internetunternehmen in die heiße Phase der KI-Videogenerierung eingestiegen. Nach intensiven Produkteinführungen in der Anfangsphase ist nun die Phase des Produktiterations- und Upgrade-Wettbewerbs eingetreten.
Durch den aktualisierten Inhalt jeder Version ist es nicht schwer zu erkennen, dass die allgemeine Iterationsrichtung der Funktionen der KI-Videogenerierung großer Modelle immer noch die Dauer des generierten Videos, die Stabilität und Kontinuität des Bildes sowie die Konsistenz des Themas ist vorher und nachher.
Gleichzeitig begannen sich verschiedene Akteure in tatsächliche funktionale Anwendungen zu „spalten“, von denen jeder seinen eigenen Schwerpunkt hatte. Einige kleine und mittlere Akteure begannen auch, ihre eigenen Marktsegmente zu finden.
Beispielsweise wurde in der neuesten Version von Runway Act-One aktualisiert, das die Gesichtsausdrücke echter Menschen präzise auf KI-Charaktere reproduzieren kann, um eine 3D-KI-Kamerasteuerung zu ermöglichen. PixVerse hat verschiedene Halloween-Spezialeffekte, Gift-Spezialeffekte usw. auf den Markt gebracht.
In Bezug auf diese Aktualisierungsrunde verschiedener KI-Videogenerierungsplattformen glaubt Chen Kun, Gründer von Xingxian Culture und Produzent der KI-Original-Fantasy-IP „Mountains and Seas Mirror“,: „Das größte Update sollte die Ausdrucksmigration von Act- Erstens, was eine bessere Möglichkeit für die Darstellung der Charaktere bietet.“ Was die Konsistenz und Stabilität der Charaktere angeht, „gibt es Fortschritte, aber keinen Fortschritt zwischen den Generationen.“
Laut Vicky, der Schöpferin von KI-Videos, hat die neueste aktualisierte KI-Videoplattform im Vergleich zum Originalprodukt in der ersten Jahreshälfte nicht nur die zugrunde liegenden Modellfunktionen iteriert, sondern auch ihre Funktionen wie Kopf und Schwanz aktualisiert Stitching, Bildqualität und Bildratenergänzung, Synchronisierung und andere Funktionen, „die Verbesserung dieser Funktionen ist tatsächlich umfassender als im ersten Halbjahr.“
Wenn die erste Hälfte des Jahres 2024 ein Wettrüsten auf der Strecke der KI-Videogenerierung ist, dann wird die zweite Jahreshälfte ein Versionsaktualisierungszyklus in kleinen Schritten sein.
Zu diesem Zeitpunkt ist der Wettbewerb zwischen Byte und Kuaishou immer noch hart. Kleine und mittlere Hersteller beginnen, ihre eigenen einzigartigen Wege zu finden, und einige Unternehmen konzentrieren sich auf Märkte in Übersee und haben auch den Effekt erzielt, „im Inland zu blühen und zu duften“. außerhalb der Mauer“.
Zweifellos mögen die Kämpfe in dieser Phase mild erscheinen, aber sie haben erhebliche Auswirkungen auf die eigene Positionierung der Plattform und die zukünftige Entwicklungsrichtung sowie auf das anschließende nachhaltige Wachstum von Benutzergruppen und -anzahl.
„Jimeng liegt etwas zurück.“ Dies ist eine objektive Bewertung der Nutzer der KI-Videogenerierungsplattform.
Als eine der ersten Plattformen zur KI-Videogenerierung im letzten Jahr und ein Produkt von Byte wurden die Videogenerierungseffekte von Dream AI von Benutzern kritisiert und werden von Spielern wie Runway und Pika geschlagen.
Im Juni dieses Jahres startete Kuaishou, der direkte Konkurrent von Byte im Bereich Kurzvideos, offiziell das große Videogenerierungsmodell „Keling“ auf seiner offiziellen Website und stieg schnell aus der Branche aus. Gleichzeitig entstehen immer mehr Plattformen zur KI-Videogenerierung, und der Bereich der KI-Videogenerierung boomt.
Unter starkem Wettbewerbsdruck hat Bytedance als erste Stufe inländischer KI-Produkte die Mängel der Videoerzeugung wettgemacht, die zur obersten Priorität geworden ist, und seine Aufholgeschwindigkeit ist unvorstellbar.
Am 24. September fand in Shenzhen die Volcano Engine AI Innovation Tour 2024 statt. Chen Xinran, der ehemalige Leiter von Douyin Art, trat als Leiter von Jimeng AI und Cutting Market and Operations auf und gab bekannt, dass Jimeng AI mit Doubaos neuestem Projekt verbunden wurde Videogenerierungsmodell.
Gleichzeitig veröffentlichte ByteDance zwei Videogenerationsmodelle der Doubao-Modellfamilie, Seaweed und Pixeldance, und lud Entwickler und Unternehmenskunden über Jimeng AI bzw. Huoshan Engine zu kleinen Tests ein.
Am 8. November gab Dream AI, eine KI-Content-Plattform im Besitz von ByteDance, bekannt, dass Seaweed, ein von ByteDance entwickeltes Videogenerierungsmodell, offiziell für Plattformbenutzer zugänglich ist.
Laut ByteDance ist das diesmal zur Verwendung freigegebene Sitzsack-Videogenerierungsmodell Seaweed die Standardversion dieses Modells. Es dauert nur 60 Sekunden, um ein hochwertiges KI-Video von 5 Sekunden zu generieren, was 3 bis 5 Minuten voraus ist Alle inländischen Industriestandards. Erfordert Generierungszeit.
Jimeng AI gab außerdem bekannt, dass in naher Zukunft auch die Pro-Versionen der beiden Videogenerationsmodelle Seaweed und Pixeldance verfügbar sein werden. Das Modell der Pro-Version kann natürliche und kohärente Multi-Shot-Aktionen und komplexe Interaktionen mit mehreren Motiven realisieren und überwindet das Konsistenzproblem des Multi-Shot-Wechsels. Es kann die Konsistenz des Motivs, des Stils und der Atmosphäre beim Objektivwechsel aufrechterhalten geeignet für Filme, Fernsehen und Computer, Mobiltelefone und andere Geräte.
ByteDouyin und Kuaishou, als führende inländische Kurzvideoplattformen, haben ihre Konkurrenz von Kurzvideos und E-Commerce auf den Bereich der KI verlagert. Objektiv gesehen ist Douyin Kuaishou in allen Aspekten voraus. Aber nur im Bereich der KI hat Kuaishou einen schönen Gegenangriff hingelegt.
Seit seinem sofortigen Erfolg im Juni gab es von Kuaishou Keling tatsächlich mehrere Iterationen kleinerer Versionen.
In Bezug auf die zugrunde liegenden Funktionen großer Modelle veröffentlichte Kuaishou am 20. September dieses Jahres die Version 1.5 von Keling, die mit einer neuen Generation von Modellen verbunden ist und erhebliche Verbesserungen in der Bildqualität und dynamischen Qualität erzielt hat eine neue Funktion – Bewegung. Der Generierungseffekt ist besser kontrollierbar.
„Keling 1.5 ist sehr stark. Man kann sagen, dass es das realistischste aller Modelle ist. Im Vergleich zu Runway hat es im Grunde das bisherige Problem der Charakterverformung überwunden“, sagte der AIGC-Unternehmer AIgen (Künstlername) gegenüber Lightcone Intelligence.
In den tatsächlich generierten Videoeffekten können wir beim Vergleich von Keling und Runway sehen, dass beide mit demselben Aufforderungswort einen starken Einfluss auf die Stabilität des eigentlichen Charaktermotivs haben, die von Keling generierten Videoeffekte jedoch den Gesichtsausdruck automatisch freischalten können .
„Runway kann tatsächlich selbst Gesichtsausdrücke erzeugen, aber der Effekt ist sehr seltsam“, sagte Yamjiang AIgen. Die Fähigkeiten von Keling AI und Runway sind jedoch zufällig und nicht festgelegt.
Tatsächlich ist ersichtlich, dass Keling AI und Runway hinsichtlich der tatsächlichen Generierungseffekte überlegen sind, und in Bezug auf das Verständnis von Aufforderungswörtern liegt Keling AI zwar an der Spitze, muss aber in Zukunft noch kontinuierlich iterativ verbessert werden fähig dazu Diese Fähigkeit wird gefestigt.
(Runway, promptes Wort: Ein weibliches Model trägt neue chinesische Kleidung und stellt ihren Stil zur Schau, mit buntem Rauch im Hintergrund, bereitgestellt von AIgen)
(Keling AI, promptes Wort: Ein weibliches Model in neuer chinesischer Kleidung zeigt ihren Stil, im Hintergrund schwebt bunter Rauch, bereitgestellt von Yamjiang AIgen)
Nachdem Jimeng jedoch das neueste Video zur Generierung eines großen Modells veröffentlicht hatte, glaubt Vicky, dass sich seine Modellfunktionen und das UI-Design nicht wesentlich von denen von Keling unterscheiden. Gleichzeitig kann das Jimeng Platform Pro-Versionsmodell während der internen Tests den Bewegungsbereich und die Aktionen des Bildschirms problemlos steuern.
Als führende Kurzvideoplattformen in China haben Kuaishou und Bytedance ihre KI-Videogenerierungspfade entwickelt. Das ultimative Ziel besteht darin, die Aufmerksamkeit der Benutzer zu gewinnen und zu halten, was eine kontinuierliche Produktion neuartiger, hochwertiger und kreativer Inhalte erfordert.
Auf dieser Grundlage sind KI-Kurzdramen auch zu einem Schwerpunkt des Wettbewerbs zwischen Bytedance und Kuaishou Keling geworden.
Im Juli dieses Jahres erregte das von „Keling AI“ geschaffene KI-Kurzdrama „Mountains and Seas and Strange Mirrors: Chopping Waves“ große Aufmerksamkeit. Das Kurzdrama wurde zum ersten AIGC-Original-Fantasy-Mikrokurzdrama in China.
Im September starteten Kuaishou Xingmang Short Drama und „Keling AI“ den „Xing You Lingxi-AI Short Drama Creation Competition“. Es wird berichtet, dass der Wettbewerb durch verschiedene Maßnahmen wie Verkehrsprämien, Ehrenpreise und Signieren von Inhalten mehr Menschen dazu ermutigt, sich an der Erstellung von KI-Kurzdramen zu beteiligen.
Byte ist ebenfalls nicht zu übertreffen. Während Dream AI mit Bona Pictures zusammenarbeitet, um das erste von AIGC erstellte Science-Fiction-Kurzdrama „Sanxingdui: Future Apocalypse“ zu veröffentlichen, arbeitet es auch mit vielen „Super-Schöpfern“ auf der Douyin-Plattform zusammen Um Co-Creation zu erreichen, laden Sie ein Es gibt hochkarätige Fans und einflussreiche Experten auf der Plattform, die sich gemeinsam dem „Super Creator Alliance“-Programm angeschlossen haben, in der Hoffnung, die größte virtuelle Creation-Community in China aufzubauen.
Aber zum jetzigen Zeitpunkt, sei es Douyin oder Kuaishou, ist es für die von Film- und Fernsehmachern auf ihren Videoplattformen erstellten Inhalte „schwierig, aus dem Kreis auszubrechen, weil der gesamte Markt noch nicht gebildet ist.“ C-End-Benutzer wissen nicht, wofür es hier ist. Es wird eine gewisse kommerzielle Nachfrage nach dem Kopf geben, aber es gibt keine große Nachfrage und die Gesamtsituation ist nicht stabil.“
Schließlich gibt es derzeit noch relativ wenige professionelle YouTuber auf der Welt, und die Technologie zur KI-Videogenerierung großer Modelle steckt noch in den Kinderschuhen.
Daher wird der Wettbewerb zwischen Byte und Kuaishou als führende Videoplattform immer härter. Neben dem Kampf um die zugrunde liegende KI-Technologie und Produkte ist es wichtiger, wer die Führung bei der Erforschung des Weges technologiegestützter Inhalte übernehmen kann . Denn wenn es der Plattform gelingt, mehr innovative Content-Ersteller zusammenzubringen, kann sie ein Community-Ökosystem schaffen, das bei den Nutzern stärker ankommt und beliebter ist.
Natürlich haben neben Byte und Kuaishou auch andere Akteure im Bereich der KI-Videogenerierung begonnen, sich zu „spalten“. Einige kleine und mittlere Hersteller haben ebenfalls begonnen, ihren eigenen Weg zu einem differenzierten Wettbewerb zu erkunden.
Auf Kurzvideoplattformen wie Douyin und Kuaishou kann es für die von einigen Erstellern erstellten Inhalte schwierig sein, aus dem Kreis auszubrechen, aber einige Videos mit Geister- und Tierspezialeffekten sind äußerst beliebt, wie zum Beispiel das KI-generierte Video von He Jiong und Huang Lei kämpft plötzlich.
Für die Akteure im Bereich KI-Videogenerierung konkurrieren ByteDance und Kuaishou in einer ganzen Reihe von Technologie- und Content-Ökosystemen, während andere kleine und mittlere Akteure sich mehr auf die Segmentierung des Bereichs und die Identifizierung ihrer eigenen Plattformen und Produktpositionierung konzentrieren werden zur Grundlage für Überleben und Entwicklung.
Ende Oktober stellte der CEO von Runway in einem offenen Brief klar, dass Runway kein KI-Unternehmen, sondern ein Medien- und Unterhaltungsunternehmen sei: „Ich denke, die Ära der KI-Unternehmen ist vorbei.“
Während große Unternehmen um die Verbesserung der Länge, Wiedergabetreue und Glätte der KI-Videogenerierung konkurrieren, hat Runway auf dieser Grundlage eindeutig seine eigenen Merkmale im KI-Videobereich entwickelt und KI geschaffen, die speziell Kunst, Medien und Unterhaltung dient.
Gemessen an den tatsächlichen Videogenerierungseffekten von Runway kann man sagen, dass die Auswirkungen auf die Charakterstabilität und -konsistenz im Vordergrund stehen. Zusätzlich zu den grundlegenden technischen Funktionen werden die beiden neuen Funktionen, die Runway im neuesten Versionsupdate eingeführt hat, zwar klein, aber großen Komfort und enorme Kosteneinsparungen für Animatoren, Spieleentwickler und Filmemacher bieten.
Man kann sagen, dass Runway eines der beliebtesten Produkte unter Film- und Fernsehfachleuten ist. Neben seiner technischen Stärke ist seine Kosteneffizienz das Wichtigste.
„Runway ist so duftend. Wir verwenden Keling sparsam, aber Runway ist unbegrenzt. Es spielt keine Rolle, ob man es hunderte Male am Tag raucht.“ AIgen sagte: „Die Zufälligkeit von AI-Videos ist immer noch sehr stark Aus heutiger Sicht kann es für normale Schöpfer schwierig sein, sich diese Kosten zu leisten.“
Wenn Sie hingegen 1.000 Yuan zum Kauf von Punkten verwenden, können Sie 15.000 Keling-Punkte kaufen. Jedes Mal, wenn Sie 35 Keling-Punkte verwenden, können 1.000 Yuan nur 428 Mal generiert werden. Für echte Unternehmer ist das im Grunde nicht genug: „Gemessen an der Häufigkeit, mit der ich täglich mehr als 200 Videos bei Runway erstelle, sind die von Keling für 1.000 Yuan gekauften Punkte im Grunde innerhalb von zwei Tagen aufgebraucht.“
Im vorherigen Artikel von Guangcone Intelligence, „Die explosiven KI-Videos, große Hersteller gehen nach links, Start-ups gehen nach rechts“, wurde auch erwähnt, dass die von jeder Plattform in dieser Phase angewandte Methode zur Erhebung von Mitgliedschaften nicht kommerzialisiert werden kann. Bei Closed-Loop-Unternehmern wird die Folgezahlungsquote und Zahlungsbereitschaft nicht sehr hoch sein. Heutzutage scheint es, dass auch für Unternehmer, die eine geschlossene Kommerzialisierung erreichen können, die Kosteneffizienz ein Schlüsselfaktor für die Nutzung ihrer Produkte ist.
Neben Runway haben auch Pika und Pixverse eigene Tracks gefunden. Aus ihrer neuesten aktualisierten Version geht hervor, dass der Schwerpunkt dieser beiden Unternehmen darauf liegt, einige Spezialeffekte zu trainieren, die Benutzer direkt verwenden können. „Obwohl die Metapher möglicherweise nicht angemessen ist, ähnelt sie den zuvor von Douyin erstellten Aufklebern.“ „Kartoffel Jiang AIgen sagte.
Während der Halloween-Periode Ende Oktober fügte die Pixverse V3-Version beispielsweise viele neue Halloween-Spezialeffekte hinzu, darunter den Zombie-Modus, Zaubererhüte, Monsterinvasion und andere Themeneffekte sowie KI-Spezialeffekte ähnlich denen von Pika Beliebte KI-Pinching- und Videoerweiterungsfunktionen können bestehende Videos um weitere 5–8 Sekunden ergänzen und die Inhaltsrichtung der neu hinzugefügten Clips präzise steuern.
Mit der jüngsten Veröffentlichung des Films „Venom: The Last Dance“ hat PixVerse einen neuen Spezialeffekt-Videoeffekt „We Are Venom“ auf den Markt gebracht, der auf dem neuesten Videomodell PixVerse V3 basiert und mit einem Klick coole Venom-Animationen aus Bildern generieren kann.
Derzeit erfreuen sich solche geisterhaften Spezialeffekte bei Nutzern sozialer Plattformen großer Beliebtheit. Zuvor hatte Pika in Version 1.5 den KI-Spezialeffekt eingeführt, der bei den Benutzern beliebt war und sich auch auf diesen Welleneffekt stützte, um in Kurven zu überholen. Conch AI, das ungefähr zur gleichen Zeit wie Pika zu wachsen begann, verließ sich tatsächlich auf Charakterdarbietungen und Meme-Ausdruckspakete, um die öffentliche Meinung im Ausland direkt anzuregen und andere in der Ecke zu überholen.
Pikas KI-Kneifeffekte
Obwohl Conch AI erst spät eingeführt wurde, haben Branchenexperten tatsächlich eine hohe Meinung von Conch AI. „Die Leistung von Conch AI bei Charakterbewegungen ist sehr gut. Das kürzlich von der KI erstellte Video der Kämpfe zwischen He Jiong und Huang Lei wurde von Conch AI erstellt“, sagte Yangtaojiang AIgen.
Noch wichtiger ist jedoch, dass Conch AI den Effekt erzielt hat, „im Inland zu blühen und außerhalb der Mauer zu duften“. Da es sich um eine KI-Videogenerierungsplattform handelt, die im Ausland vom inländischen KI-Unternehmen MiniMax eingeführt wurde, stieg die Suchpopularität nach ihrer Einführung weiter an.
Laut Statistiken der „AI Product List“ stieg die Zahl der Besuche der Conch AI-Webversion im September um 860 % und belegte damit den ersten Platz beim globalen und inländischen Wachstum im September. Benutzer aus Übersee haben ihre Erfahrungen auf sozialen Plattformen geteilt, und es wird allgemein angenommen, dass Conch AI eines der besten Tools zur KI-Videogenerierung ist, die derzeit auf dem Markt erhältlich sind.
Aufgrund der Beliebtheit seiner Produkte in Überseemärkten war MiniMax hinsichtlich der Vermarktungsmöglichkeiten führend gegenüber dem Großmodell Six Little Tigers.
Im Vergleich dazu entwickeln sich Plattformen wie Vidu und Zhipu Qingying in Bezug auf Themenkonsistenz, Charakterstabilität und Videogenerierungsdauer ständig weiter, haben jedoch noch keinen eigenen Stil und keine Einzigartigkeit entwickelt.
Obwohl sich die KI-Videogenerierungstechnologie ständig weiterentwickelt und einzigartige segmentierte Spuren hervorgebracht hat. Der Forschungsbericht von Cinda Securities zeigt jedoch auch, dass die Technologie zur KI-Videoerzeugung hinsichtlich der Zeichenkonsistenz, der erforderlichen Dauer und der Bildqualität noch weiter verbessert werden muss, um den Kommerzialisierungsstandards zu entsprechen.
Gleichzeitig befinden sich die aktuellen Mainstream-KI-Videotools immer noch im Wettbewerb um die Videogenerierung, und die meisten von ihnen sind Einzelfunktionsprodukte. Um dies zu erreichen, müssen immer noch verschiedene verschiedene Videoerstellungstools in Serie verwendet werden Effekt der direkten Ausgabe kommerziell nutzbarer Videos.
Auch in Zukunft muss die große Modellplattform für die KI-Videogenerierung ihre iterative Weiterentwicklung fortsetzen.