近日,OpenAI 發布了一則引人注目的消息:在其內部測試的項目Sora 中,除了已經推出的視頻生成功能外,圖像生成功能也在緊鑼密鼓地研發中。這個新功能讓用戶能夠在視頻和圖像生成之間快速切換,提升創作的靈活性。
根據內部消息,Sora 將會增加一個隱藏的切換按鈕,用戶只需在提示欄中選擇即可在兩種模式之間切換。當選擇圖像生成時,系統會自動提示用戶描述一幅圖像。這一設計旨在簡化用戶操作,提高生成內容的相關性和質量。
除了圖像生成功能的改進,Sora 還對其視頻推送進行了重新分類。新推出的“Best” 和“Top” 類別將幫助用戶更好地篩选和查找內容。 “Best” 類別與目前的特色頻道類似,而“Top” 類別則可能根據用戶點贊數或時間段對視頻進行排名。這一分類的變化讓人們對Sora 的內容推薦機制充滿期待。
對於DALL-E3的用戶來說,這一消息無疑讓人興奮,因為DALL-E3自發布以來已經顯得有些過時,特別是在與Midjourney 等競爭對手相比時。儘管目前Sora 的圖像生成功能尚未正式推出,但左側導航欄中的“Images Internal” 類別已經引發了用戶的好奇心。雖然目前這個類別主要用於視頻推送,但未來也可能會提供圖片生成的相關內容。
有人猜測,這次的圖像生成模型或許會被稱為DALL-E4,然而OpenAI 尚未對此進行確認。業內專家推測,Sora 中的圖像生成器可能不會直接使用DALL-E4,而是會依賴於現有的“sora-turbo” 模型。此外,業內人士也指出,ChatGPT 尚未推出基於GPT-4o 的多模態圖像生成功能,因此此次Sora 項目的推出將是一個值得關注的新進展。
值得注意的是,Sora 中的文本到圖像生成器的代號被稱為“papaya”,讓人對這個項目充滿好奇與期待。在DALL-E3發布一年半之後,下一代模型究竟會帶來怎樣的創新,令人不禁想要一探究竟。
總之,Sora 的圖像生成功能即將推出,為用戶提供更多創作可能性,值得期待。