OpenAI は最近、待望のビデオ生成モデル Sora Turbo をリリースし、2024 年に生成 AI の分野で大きな進歩を遂げることを示しています。 Sora Turbo はビデオ生成の効率と持続時間を大幅に改善し、テキスト、画像、またはビデオ プロンプトに基づいて最大 20 秒の 1080P 高解像度ビデオを生成でき、スーパースコア、スーパースコアなどのさまざまな機能をサポートします。フレームやHDRゲームのラインナップも充実し、ユーザーエクスペリエンスが大幅に向上。その強力な機能と便利な使用により、このビデオ モデルは世界で最も生成時間が長いビデオ モデルの 1 つとなります。
OpenAI は、今日のライブブロードキャストで待望の製品である Sora Turbo をリリースし、2024 年の生成 AI 分野における大きな進歩を示しました。 Sora Turbo は生成効率が大幅に向上し、テキストから最大 20 秒の 1080P 動画を直接生成することができ、世界で最も生成時間が長い動画モデルの 1 つとなります。このモデルは、特定のビデオ コンテンツを生成するためのテキストと画像またはビデオの入力をサポートしており、生成効果をより制御しやすくしています。
Sora Turbo の技術的なハイライトには、スーパー スコア、スーパー フレーム、HDR ゲーム ラインナップの完全なゲーム サポートと、独立したグラフィックスに基づく 2 つの自社開発機能アップグレードが含まれます。その中で、タッチダイナミックフレーム挿入機能は、フレーム挿入の精度を大幅に向上させ、画像の損傷を軽減します。ゲームのダークナイトモードは、AIアルゴリズムを使用して暗い細部を改善し、暗い領域の視覚効果を強化すると同時に、プレイの明るさの問題を解決します。暗い環境でのゲーム。
現在、Sora は無制限の使用段階に入っており、ChatGPT Plus および Pro メンバーの場合、Sora の使用に追加料金はかかりません。このポリシーは非常に良心的だと考えられます。 OpenAI は新しい UI も開発し、コミュニティ共有サービスを提供します。これにより、ユーザーは自分で生成したビデオを共有したり、他の人の即時効果から学んで作品を改善したりすることができます。
Sora の技術原則には、大量の画像およびビデオ データに対する集中的なトレーニングを可能にするパッチの適用と、ビジュアル データの次元を削減して出力品質を向上させるビデオ圧縮ネットワークのアプリケーションが含まれます。
また、Sora は拡散モデルとトランスフォーマー アーキテクチャを統合し、従来の U-Net アーキテクチャに代わる革新的な拡散トランスフォーマー手法を使用して、入力画像とテキスト ラベル間の分布関係をキャプチャする能力を効果的に向上させます。さらに、Sora は DALL・E3 の再字幕技術を導入し、高度に説明的な字幕モデルをトレーニングすることでトレーニング セット内のすべてのビデオにテキスト字幕を作成し、テキストの忠実性とビデオ全体の品質を向上させました。
体験アドレス:https://sora.com/
Sora Turbo の登場により、AI ビデオ生成の効率と品質が向上するだけでなく、より便利で強力なクリエイティブ ツールがユーザーに提供されます。 OpenAI のオープン ポリシーとコミュニティ共有機能は、AI テクノロジーの普及と発展をさらに促進します。 Sora Turbo は今後、AI 動画生成の分野でさらに大きな役割を果たし、ユーザーにさらなる驚きをもたらすと信じています。