Downcodes の編集者は、Zhipu 技術チームが最近、最新のビデオ生成モデル CogVideoX v1.5 をオープンソース化したことを知りました。これは、8 月以来の CogVideoX シリーズのもう 1 つのメジャー アップデートです。このアップデートにより、パフォーマンスが大幅に向上し、開発者により強力なビデオ生成ツールが提供され、AI ビデオ生成テクノロジーの新たな段階が始まりました。 CogVideoX v1.5 では、ビデオの長さ、解像度、フレーム レートが大幅に向上し、複雑なセマンティクスを理解する能力が強化され、アプリケーション シナリオがさらに拡張されました。
このアップデートにより、5 秒と 10 秒のビデオ長、768P 解像度、16 フレーム生成機能のサポートなど、ビデオ生成機能が大幅に向上したことがわかります。同時に、I2V (画像対ビデオ) モデルはあらゆるサイズ比もサポートし、複雑なセマンティクスを理解する能力をさらに強化します。
CogVideoX v1.5 には、CogVideoX v1.5-5B と CogVideoX v1.5-5B-I2V という 2 つの主要モデルが含まれており、開発者により強力なビデオ生成ツールを提供するように設計されています。
さらに注目すべきことは、CogVideoX v1.5 が Qingying プラットフォーム上で同時に起動され、新たに起動された CogSound 音響効果モデルと結合されて「New Qingying」となることです。 New Qingying は、ビデオ品質、美的パフォーマンス、モーションの合理性の大幅な向上を含む多くの特別なサービスを提供し、10 秒、4K、60 フレームの超高解像度ビデオの生成をサポートします。
公式の紹介文は以下の通り。
CogVideoX v1.5 のオープンソースは、AI ビデオ生成の分野に新たな活力をもたらし、開発者にさらなる可能性を提供します。 将来的には、CogVideoX v1.5 をベースにした革新的なアプリケーションがさらに登場すると信じています。 Downcodes の編集者は、この分野の最新の開発に今後も注目し、よりエキサイティングなレポートをお届けしていきます。