Open-Sora プラン v1.2 が登場しました!このアップデートは革命的なアップグレードをもたらします。その核心は新しい 3D フル アテンション アーキテクチャにあり、AI が物理世界を理解する方法を完全に変え、平面から 3 次元への飛躍を実現します。 物理世界を理解する能力が大幅に向上したことに加え、テキストからビデオを生成する能力も大幅に強化され、生成されるビデオの明瞭さと一貫性も向上しました。また、空間と時間の次元の処理能力も向上しました。大幅に最適化され、推論速度がさらに向上しました。 Open-Sora Plan v1.2のアップデート内容を詳しく見ていきましょう。
Open-Sora Plan が再びアップグレードされました! Open-Sora Plan v1.2 の最新バージョンでは、新しい 3D フル アテンション アーキテクチャが導入され、物理世界の理解が向上しました。
このアップデートの主なハイライト:
新しい 3D フル アテンション アーキテクチャ:新しいアーキテクチャにより、AI は物理世界の理解において質的な飛躍を遂げることができます。もはや二次元でしか考えられないQRコードではなく、死角なく360度三次元の世界を理解できるようになりました!
アップグレードされたテキスト生成ビデオ機能:テキストを入力すると、AI が本物のようなビデオ画像を表示します。
明瞭さと一貫性の向上:新しいアーキテクチャと最適化された VAE 構造により、Open-Sora によって生成されるビデオ品質はより明瞭になり、コンテンツの一貫性が高まります。曖昧さには別れを告げましょう!
空間と時間の完璧な統合:新しい 3D フル アテンション アーキテクチャは、空間次元と時間次元を同時に処理するという、以前のバージョンの大きな問題を解決します。これは何を意味するのでしょうか? それは、生成されるビデオの空間パフォーマンスと時間的流暢性が大幅に向上することを意味します。
推論速度が大幅に向上:最適化された CausalVideoVAE 構造により、モデルのパフォーマンスが向上するだけでなく、推論速度も大幅に向上します。効率化パーティーは応援します!
Open-Soraの開発の歴史を振り返ると、その進歩は驚くべきものであることがわかります。 2024 年 5 月の時点では、v1.1.0 バージョンではまだ 2+1D モデル アーキテクチャが使用されており、主に探索的トレーニングに使用されていました。そしてわずか数か月後の今、それは 3D 世界を創造できる創造者へと進化しました。そのようなスピードで、ダーウィンですら「進化論が書き換えられようとしている!」と叫んだでしょう。
最も素晴らしいのは、Open-Sora チームが何も隠さないことです。コード、データ、モデルはすべてオープンソースであり、世界の作成方法についての説明がただ貼り付けられているだけです。彼らの目標はシンプルです。「誰もがビデオ作成の神になろう!」このオープンで共有する姿勢は間違いなく AI ビデオ生成テクノロジーの進歩を加速します。
Open-Sora Plan v1.2.0 のリリースは、ビデオ生成モデルの新時代を告げるものです。これにより、視覚表現の圧縮と推論の効率が大幅に向上するだけでなく、将来の開発の方向性も示されます。
プロジェクトアドレス:https://top.aibase.com/tool/open-sora-plan-v1-2
Open-Sora Plan v1.2 のリリースは、AI ビデオ生成テクノロジーが開発の新たな段階に入ったことを告げるものであり、そのオープンソース機能もテクノロジーの進歩に強力な推進力をもたらします。 Open-Sora が将来もたらすさらなる驚きを楽しみにしています。