Downcodes の編集者は、Zhipu 技術チームが新しい Vincentian グラフ モデル CogView3 とそのアップグレード バージョン CogView3-Plus-3B をリリースしたことを知りました。これらは正式にオープンソースとなり、Zhipu Qingyan アプリで起動されました。 これは、AI 支援アート作成テクノロジーにおける大きな進歩を示し、パフォーマンスにおいて既存のトップ オープンソース モデルを上回り、AI アート作成の分野に新たな可能性をもたらします。 CogView3 は、カスケード拡散技術を使用して、多段階の反復を通じて高解像度の画像を生成し、その推論速度が同様の製品よりもはるかに速く、ユーザーに効率的で便利なクリエイティブ エクスペリエンスを提供します。 このオープンソースの取り組みは、AI 画像生成分野の発展を大きく促進し、開発者や研究者に貴重なリソースを提供します。
カスケード拡散に基づくテキストから画像へのモデルとして、CogView3 の生成プロセスは絶妙です。このモデルは、最初に 512x512 ピクセルの低解像度画像を生成し、次にリレー拡散プロセスを通じてそれを 1024x1024 に増加し、最後に再度反復して 2048x2048 の大きな高解像度画像を表示します。この進歩的な生成方法は、デジタル画家がキャンバス上の作品を徐々に改善していくようなもので、ユーザーに究極の視覚体験をもたらします。
公式評価によれば、CogView3の性能は驚異的で、現在のオープンソースのトップモデルであるVincentグラフモデルSDXLよりも77%高い性能だという。さらに注目すべき点は、CogView3 の推論速度が SDXL のわずか 10 分の 1 であることです。これは、モデル最適化における Zhipu チームの優れた成果を十分に示しています。
この最先端のテクノロジーを探索したい開発者や研究者のために、Zhipu 技術チームは CogView3 および CogView3-Plus-3B のソース コード リポジトリをオープンしました。この動きは間違いなく、AI画像生成の分野全体の急速な発展を促進し、より革新的なアプリケーションのための強固な技術基盤を提供するでしょう。
CogView3 シリーズ モデルの登場により、Vincent ダイアグラム テクノロジーのアプリケーションの可能性はさらに広がりました。個人の創作から商業デザイン、教育支援からエンターテインメント産業まで、このテクノロジーは革命的な変化をもたらすことが期待されています。近い将来、AI 支援による創作が標準となり、より多くの人が自分の芸術的アイデアを簡単に実現できるようになることが予想されます。
オープンソース ウェアハウスのアドレス:
https://top.aibase.com/tool/cogview3
さらに、オープンソース モデル ウェアハウス:
https://top.aibase.com/tool/cogview3-plus-3b
CogView3 と CogView3-Plus-3B のオープンソースは、AI 芸術作品の普及と発展を加速し、あらゆる階層に新たな機会をもたらします。 Downcodes の編集者は、このモデルに基づいた、より革新的なアプリケーションの出現を楽しみにしています。