OpenAI最新發布的文生視訊模型Sora,以其生成60秒高清影片的能力震驚業界。該模型基於Transformer架構的擴散模型,能夠將不同類型的視覺資訊轉化為統一的視覺補丁,展現出強大的現實世界理解和模擬能力。雖然目前對物理世界的預測能力仍有限,但其巨大的潛力不容忽視,未來發展值得期待。
OpenAI發布的文生視頻模型Sora,能夠生成60秒的精緻視頻,在業界引起轟動。 Sora採用了基於Transformer的擴散模型,並將不同類型的視覺數據轉化成統一的視覺補丁,這使其具備強大的理解和模擬現實世界的能力。與先前的物理模擬模擬相比,Sora對物理世界的預測價值仍然有限,但隨著模型能力的提升,其未來發展潛力巨大。其他文生影片新創企業在Sora的刺激下,也紛紛加大了研發力道。 OpenAI專注於提升模式的能力,而其他公司則更專注於產品化,兩種不同的發展想法各有優勢。
Sora的出現不僅推動了文生視訊技術的進步,也為AI領域帶來了新的可能性。未來,隨著技術的不斷發展和完善,我們可以期待Sora以及類似的AI模型為我們帶來更多令人驚嘆的應用和體驗。 其對物理世界的預測能力的提升,也值得持續關注。