最近、Openaiは説得力のあるニュースをリリースしました。内部テストプロジェクトでは、SORAが起動されたビデオ生成機能に加えて、画像生成関数も本格的に開発されています。この新機能により、ユーザーはビデオと画像の生成をすばやく切り替えて、創造的な柔軟性を向上させることができます。
内部メッセージによると、SORAは非表示のトグルボタンを追加し、ユーザーはプロンプトバーで選択するだけで2つのモードを切り替えることができます。画像生成を選択すると、システムはユーザーに画像の説明を自動的に促します。この設計は、ユーザーの操作を簡素化し、生成されたコンテンツの関連性と品質を向上させるように設計されています。
画像生成機能の改善に加えて、SORAはビデオプッシュも再分類しています。新しく発売された「ベスト」および「トップ」カテゴリは、ユーザーがコンテンツをよりよくフィルタリングして見つけるのに役立ちます。 「最高の」カテゴリは現在の特徴的なチャネルに似ていますが、「トップ」カテゴリは、ユーザーまたは期間からのいいね!に基づいてビデオをランク付けできます。このカテゴリのこの変更により、人々はソラのコンテンツ推奨メカニズムを楽しみにしています。
Dall-E3ユーザーにとって、特にMidjourneyのような競合他社と比較した場合、Dall-E3は発売以来やや時代遅れであるため、ニュースは間違いなくエキサイティングです。 SORAの画像生成関数はまだ正式に発売されていませんが、左ナビゲーションバーの「Images Internal」カテゴリは、ユーザーの好奇心を呼び起こしました。このカテゴリは現在、主にビデオプッシュに使用されていますが、将来の画像生成に関連するコンテンツを提供する可能性もあります。
一部の人々は、この画像生成モデルがDall-E4と呼ばれる可能性があると推測していますが、Openaiはまだこれを確認していません。業界の専門家は、SORAの画像ジェネレーターはDall-E4を直接使用しない可能性があるが、既存の「Sora-Turbo」モデルに依存する可能性があると推測しています。さらに、Industry Insidersは、ChATGPTがGPT-4Oに基づいたマルチモーダル画像生成機能をまだ開始していないため、SORAプロジェクトの発売は注目に値する新しい進歩になると指摘しました。
SORAのテキストから画像のジェネレーターのコード名は「パパイヤ」と呼ばれていることは注目に値します。 Dall-E3のリリースから1年半後、次世代モデルがどのようなイノベーションをもたらすかは、人々が知りたいと思うものです。
要するに、SORAの画像生成関数は起動しようとしており、ユーザーにより創造的な可能性を提供します。これは楽しみにしています。