9 月のバージョン更新後、Guangcone Intelligence は、Shengshu Technology の共同創設者兼 CEO である Tang Jiayu の友人サークルから、Vidu 大型モデルが今週再びアップグレードされ、Vidu-1.5 バージョンが間もなく発売されることを知りました。
このバージョンの更新の方向性は、依然として大規模モデルの一般化機能と主題の一貫性を拡張することに重点を置いています。以前のバージョンは単一の主題の一貫性に焦点を当てていましたが、最新バージョンではキャラクター、オブジェクト、環境などの複数の概念を理解して統合し、ユーザーの指示に従って複数の主題を融合した関連するビデオ結果を 30 秒以内に生成できます。マルチエージェントによる一貫したビデオ作成をリードします。
不完全な統計によると、Vidu に加えて、今年 9 月以降、Bytedance の Jimeng AI、Kuaishou Keling AI、Runway、Zhipu Qingying、Aishi Technology PixVerse、pika を含む主流の AI 動画生成プラットフォームのすべてのバージョン アップデートが行われています。
現在、注目の AI ビデオ生成トラックには、初期段階での集中的な製品投入を経て、大手モデルの新興企業や大手インターネット企業が参入し、現在は製品の反復とアップグレードの競争の段階に入っています。
各バージョンの更新内容を通じて、AI ビデオ生成大規模モデル機能の反復の一般的な方向が、依然として生成されたビデオの長さ、画像の安定性と連続性、および主題の一貫性であることを見つけるのは難しくありません。前後。
しかし同時に、さまざまなプレーヤーが実際の機能アプリケーションで「分裂」し始め、それぞれが独自の重点を置いて、いくつかの中小規模のプレーヤーも独自の市場セグメントを見つけ始めました。
例えば、最新版「Runway」では、現実の人物の表情をAIキャラクターに正確に再現できる「Act-One」がアップデートされ、3D AIカメラ制御が可能になった。 PixVerseは、さまざまなハロウィーン特殊効果、毒特殊効果などをリリースしました。
さまざまな AI ビデオ生成プラットフォームの今回のアップデートについて、Xingxian Culture の創設者であり、AI オリジナル ファンタジー IP「山と海の鏡」のプロデューサーである Chen Kun 氏は次のように考えています。「最大のアップデートは、Act の表現の移行であるはずです。 1 つは、キャラクターのパフォーマンスに優れた方法を提供する基本的な可能性です。キャラクターの一貫性と安定性に関しては、「進歩はありますが、世代間の進歩はありません。」
AI ビデオの作成者である Vicky 氏によると、今年上半期のオリジナル製品と比較して、最新の更新された AI ビデオ プラットフォームは、基礎となるモデルの機能を反復しただけでなく、ヘッドやテールなどの機能も更新されました。スティッチング、画質とフレームレートの補完、ダビング、その他の機能については、「これらの機能の改善は、実際には上半期よりも包括的に行われています。」
2024 年前半が AI ビデオ生成トラックの軍備競争であるとすれば、今年後半は小さなステップのバージョン更新サイクルとなるでしょう。
現段階では、ByteとKuaishouの競争は依然として激しく、中小規模の製造業者は独自の軌道を見つけ始めており、一部の企業は海外市場に焦点を当てており、「国内で開花し、香り高い」という効果も達成しています。壁の外」。
確かに、この段階での争いは穏やかに見えるかもしれないが、プラットフォーム自体の位置付けと将来の開発の方向性、そしてその後のユーザーグループと量の持続可能な成長に大きな影響を与える。
「Jimengは少し遅れています。」 これはAIビデオ生成プラットフォームのユーザーによって与えられた客観的な評価です。
昨年の AI ビデオ生成プラットフォームの最初のバッチの 1 つであり、Byte の製品である Dream AI のビデオ生成エフェクトはユーザーから批判されており、Runway や Pika などのプレーヤーに負けています。
今年6月、ショートビデオ分野におけるByteの直接の競合企業であるKuaishouは、大規模ビデオ生成モデル「Keling」を公式ウェブサイトで正式に開始し、すぐに業界から浮上した。同時に、AIビデオ生成プラットフォームがますます登場しており、AIビデオ生成トラックは完全にブームになっています。
強い競争圧力の下、Bytedance は国産 AI 製品の第一陣として、最優先事項となっているビデオ生成の欠点を補い、その追いつきのスピードは想像を超えています。
9月24日、2024年火山エンジンAIイノベーションツアーが深センで開催され、Douyin Artの前責任者であるChen Xinran氏がJimeng AIとCutting Market and Operationsの責任者として登場し、Jimeng AIがDoubaoの最新のAIに接続されたことを発表した。ビデオ生成モデル。
同時に、ByteDance は Doubao モデル ファミリーの 2 つのビデオ生成モデル Seaweed と Pixeldance をリリースし、それぞれ Jimeng AI と Huoshan Engine を通じてクリエイターと企業顧客に小規模なテストを招待しました。
11月8日、ByteDanceが所有するAIコンテンツプラットフォームであるDream AIは、ByteDanceが開発したビデオ生成モデルであるSeaweedがプラットフォームユーザーに正式に公開されたと発表した。
ByteDanceによると、今回公開されたお手玉動画生成モデルSeaweedは、このモデルの標準版で、従来より3~5分早い5秒の高品質AI動画を生成するのにかかる時間はわずか60秒だという。すべての国内業界標準には生成時間が必要です。
Jimeng AI はまた、Seaweed と Pixeldance という 2 つのビデオ生成モデルの Pro バージョンも近い将来利用可能になることを明らかにしました。 Proバージョンモデルは、自然で一貫したマルチショットアクションと複数の被写体との複雑なインタラクションを実現でき、マルチショット切り替えの一貫性の問題を克服し、レンズを切り替えても被写体、スタイル、雰囲気の一貫性を維持できます。映画、テレビ、コンピュータ、携帯電話、その他のデバイスに適しています。
ByteDouyin と Kuaishou は、国内ショートビデオプラットフォームのリーダーとして、競争相手はショートビデオと電子商取引から AI の分野に移りました。客観的に見て、Douyin はあらゆる面で Kuaishou よりも先を行っています。しかし、AIの分野に限って、クアイショウは見事な反撃を見せた。
6 月に即座に成功して以来、Kuaishou Keling は実際に小さなバージョンを数回繰り返してきました。
しかし、基盤となる大型モデルの機能に関しては、Kuaishou は今年 9 月 20 日に Keling のバージョン 1.5 をリリースしました。これは新世代のモデルに接続されており、画質とダイナミック品質の大幅な向上を実現しました。オリジナルのモデルも追加されています。新しい機能 - ブラシ、生成効果がより制御可能になりました。
「Keling 1.5は非常に強力です。すべてのモデルの中で最も現実的であると言えます。Runwayと比較して、キャラクターのデフォルメに関する以前の問題は基本的に克服されています。」とAIGC起業家のAIgen(芸名)はLightcone Intelligenceに語った。
実際に生成されたビデオ エフェクトでは、Keling と Runway を比較すると、同じプロンプト ワードでも、どちらも実際のキャラクターの被写体の安定性に強い影響を与えますが、Keling によって生成されたビデオ エフェクトは自動的に顔の表情をロック解除できることがわかります。 。
「実際、Runway は独自に表情を生成できますが、その効果は非常に奇妙です。しかし、Keling AI と Runway の能力はランダムであり、固定されていません」と Yamjiang AIgen 氏は述べています。
実際、実際の生成効果では Keling AI と Runway の方が優れていることがわかり、プロンプト単語の理解という点では Keling AI が確かに最前線にありますが、将来的には継続的に反復的にアップグレードする必要があります。この能力は定着しています。
(ランウェイ、プロンプトワード: カラフルな煙を背景に、新しい中国服を着てスタイルを披露する女性モデル、AIgen 提供)
(Keling AI、プロンプトワード: 新しい中国服を着た女性モデルが背景にカラフルな煙を浮かべ、自分のスタイルを誇示している、Yamjiang AIgen 提供)
しかし、Jimeng が大規模なモデルを生成する最新のビデオを公開した後、Vicky はそのモデルの機能と UI デザインが Keling とそれほど変わらないと考えています。同時に、Jimeng Platform Pro バージョン モデルの内部テスト中に、画面の移動範囲とアクションを簡単に制御できます。
中国の主要なショートビデオプラットフォームとして、Kuaishou と Bytedance は AI ビデオ生成の軌道を打ち出しており、最終的な目標はユーザーの注目を集め、維持することであり、そのためには斬新で高品質で創造的なコンテンツを継続的に制作する必要があります。
これに基づいて、AI 短編ドラマも Bytedance と Kuaishou Keling の間の競争の焦点の 1 つとなっています。
今年7月には、「Keling AI」が制作したAI短編ドラマ「山と海と奇妙な鏡:刻む波」が広く注目を集めたこの短編ドラマは、中国初のAIGCオリジナルファンタジーマイクロ短編ドラマとなった。
9月、Kuaishou Xingmang短編ドラマと「Keling AI」は「Xing You Lingxi-AI短編ドラマ作成コンテスト」を開始した。このコンペティションは、トラフィック報酬、名誉賞、コンテンツ署名などのさまざまな手段を通じて、より多くの人々が AI 短編ドラマの作成に参加することを奨励していると報告されています。
Byte も負けてはいません。Dream AI は、Bona Pictures と提携して AIGC 制作の初の SF 短編ドラマ「Sanxingdui: Future Apocalypse」をリリースしていますが、Douyin プラットフォームでは多くの「スーパー クリエイター」とも提携しています。プラットフォームには質の高いファンと影響力の高い専門家がおり、中国最大の仮想創作コミュニティの構築を目指して「スーパー クリエイター アライアンス」プログラムに共同参加しています。
しかし現段階では、それがDouyinであろうとKuaishouであろうと、映画やテレビのクリエイターが動画プラットフォーム上で作成したコンテンツは「そのサークルから抜け出すのは難しい」とヴィッキー氏は言う。「市場全体がまだ形成されていないからです。 Cエンドのユーザーはそれをどのように使用するのかわかりません。ヘッドには商業的な需要もあるでしょうが、需要はそれほど多くなく、全体的な状況は安定していません。」
結局のところ、現段階では世界にはプロのクリエイターがまだ比較的少数であり、AIビデオ生成ラージモデル技術はまだ初期段階にあります。
したがって、主要なビデオプラットフォームとして、Byte と Kuaishou の間の競争はますます激化しています。基盤となる AI テクノロジーと製品をめぐる争いに加えて、より重要なのは、テクノロジーを活用したコンテンツの道をどちらが主導できるかということです。 。結局のところ、プラットフォームがより多くの革新的なコンテンツクリエイターを集めることができれば、ユーザーにもっと関心があり、愛されるコミュニティエコシステムを作り出すことができます。
もちろん、Byte と Kuaishou に加えて、AI ビデオ生成トラックの他のプレーヤーも「分裂」し始めており、一部の中小規模のメーカーも差別化された競争への独自の道を模索し始めています。
Douyin や Kuaishou などのショートビデオ プラットフォームでは、一部のクリエイターが作成したコンテンツはサークルから抜け出すのが難しい場合がありますが、AI で生成された He Jiong のビデオや、幽霊や動物の特殊効果を含む一部のビデオは非常に人気があります。突然戦うファン・レイ。
AI ビデオ生成トラックのプレーヤーにとって、ByteDance と Kuaishou はあらゆるテクノロジーとコンテンツのエコシステムで競争していますが、他の中小規模のプレーヤーはトラックをセグメント化し、独自のプラットフォームと製品のポジショニングを特定することに重点を置いています。生存と発展の基盤となります。
10月末、ランウェイのCEOは公開書簡の中で、ランウェイはAI企業ではなく、メディアおよびエンターテインメント企業であると明言し、「AI企業の時代は終わったと思う」と述べた。
これに基づいて、大手企業が AI ビデオ生成の長さ、忠実度、スムーズさを向上させるために競争している一方で、Runway は AI ビデオトラックにおいて明確に独自の特性を開発し、特にアート、メディア、エンターテイメントに役立つ AI を開発しています。
Runway の実際のビデオ生成効果から判断すると、キャラクターの安定性と一貫性に対する効果は最前線であると言えます。基本的な技術力に加え、今回のバージョンアップでは、Runway が開始した 2 つの新機能は、小規模ではありますが、アニメーター、ゲーム開発者、映画制作者に大きな利便性と大幅なコスト削減を提供します。
ランウェイは技術力もさることながら、最も重要なのはそのコストパフォーマンスであり、映画・テレビ関係者の間で最も人気のある製品の一つと言えます。
「ランウェイはとても香りが良いです。私たちはケリングを控えめに使用していますが、ランウェイは無制限です。1日に何百回吸っても問題ありません。」AIgenは、「AIビデオのランダム性は依然として非常に強いです。料金ごとに課金すれば」と述べました。一般のクリエイターがこの費用を負担するのは難しいかもしれません。」
一方、1,000元を使ってポイントを購入すると、15,000ケリングポイントを購入できます。1回あたり35ケリングポイントを使用すると、1,000元は428回しか生成されません。本物の起業家にとっては、基本的に十分ではありません。「私が毎日 Runway で作成する 200 以上のビデオの頻度から判断すると、Keling が 1,000 元で購入したポイントは基本的に 2 日で使い果たされます。」
前回のGuangcone Intelligenceの記事「爆発的なAI動画、大手メーカーは左へ、新興企業は右へ」でも、現段階で各プラットフォームが採用している会員制課金方式では商用化できないことにも触れた。クローズドループの起業家の場合、その後の支払い率や支払い意欲はそれほど高くありません。最近では、クローズドループの商業化を達成できる起業家にとっても、費用対効果も製品の使用に影響を与える重要な要素となっているようです。
Runway に加えて、Pika と Pixverse も独自のトラックを見つけました。最新の更新バージョンから、これら 2 社がユーザーが直接使用できる特殊効果をトレーニングすることに重点を置いていることがわかります。「たとえが適切ではないかもしれませんが、これは以前に Douyin が作成したステッカーに少し似ています。 」とジャガイモ・ジャン・アイゲンさんは言いました。
たとえば、10 月末のハロウィーン期間中、Pixverse V3 バージョンでは、ゾンビ モード、魔法使いの帽子、モンスターの侵略などのテーマ効果や、ピカのような AI ピンチ特殊効果など、ハロウィーンをテーマにした多くの新しい特殊効果が追加されました。人気の AI ピンチ機能とビデオ拡張機能により、ユーザーは既存のビデオに 5 ~ 8 秒のコンテンツを追加でき、新しく追加されたクリップのコンテンツの方向を正確に制御できます。
映画「ヴェノム:ザ・ラストダンス」の最近のリリースに伴い、PixVerse は最新のビデオモデル PixVerse V3 をベースにした新しい特殊効果「We Are Venom」ビデオエフェクトを開始しました。このビデオエフェクトは、ワンクリックで写真からクールなヴェノムアニメーションを生成できます。
現在、この種の幽霊のような特殊効果はソーシャル プラットフォーム上のユーザーの間で非常に人気があります。以前、Pika はバージョン 1.5 で AI 挟み込み特殊効果をリリースしましたが、コーナーでの追い越しもこの波効果に依存していました。 Pika とほぼ同時期に成長を始めた Conch AI は、実際にはキャラクターのパフォーマンスとミーム表現パックに依存して直接海外世論に火をつけ、他の人を追い詰めていました。
PikaのAI挟み込みエフェクト
実際、Conch AI はリリースが遅かったにも関わらず、業界関係者からは Conch AI に対する評価が高く評価されています。 「キャラクターの動きにおけるConch AIのパフォーマンスは非常に優れています。最近AIが生成したHe JiongとHuang Leiの戦いのビデオはConch AIによって生成されました」とYangtaojiang AIgen氏は述べています。
しかし、それよりも重要なのは、コンク AI が「国内で花を咲かせ、壁の外で香りを放つ」という効果を実現したことです。国内AI企業MiniMaxが海外で立ち上げたAI動画生成プラットフォームとして、サービス開始後は検索人気が上昇し続けた。
「AI製品リスト」の統計によると、Web版Conch AIのアクセス数は9月に860%急増し、9月の世界・国内成長率で1位となった。海外のユーザーはソーシャル プラットフォームでその経験を共有しており、一般的に Conch AI は現在市場に出ている最高の AI 動画生成ツールの 1 つであると考えられています。
MiniMax は、海外市場での人気も高く、大型モデルの Six Little Tigers の商品化力において先頭に立ってきました。
比較すると、Vidu や Zhipu Qingying などのプラットフォームは、主題の一貫性、キャラクターの安定性、ビデオ生成時間の点で常に進化していますが、独自のスタイルと独自性をまだ形成していません。
AI ビデオ生成テクノロジーは常に進化しており、独自のセグメント化されたトラックが派生しています。しかし、Cinda Securitiesの調査レポートは、商業化基準を満たすためには、AIビデオ生成技術が文字の一貫性、所要時間、画質の点でさらに改善される必要があることも示している。
一方で、現在主流のAI動画ツールはまだ動画生成競争の段階にあり、その多くは単機能の製品であり、実現するには様々な動画作成ツールをシリーズ化する必要があります。商品化可能な映像を直接出力する効果。
AI動画生成大型モデルプラットフォームは今後も進化を繰り返していく必要がある。