OpenAI首席執行官Sam Altman近期在Reddit問答中坦誠,計算能力不足是阻礙公司頻繁推出新產品的主要瓶頸。 AI模型日益複雜,資源分配成為OpenAI面臨的巨大挑戰,導致諸多計劃中的功能和產品更新延後。這不僅影響了ChatGPT高級語音模式的視覺功能上線,也使得DALL-E的重大更新和視頻生成工具Sora的發布遙遙無期。公司內部也面臨著人員變動和技術難題,進一步加劇了產品開發的難度。本文將深入分析OpenAI面臨的挑戰以及未來的發展規劃。
在近期的一次Reddit 問答中,OpenAI 的首席執行官山姆・阿爾特曼(Sam Altman)坦承,計算能力的不足是公司無法頻繁推出新產品的主要原因之一。他表示,當前的AI 模型越來越複雜,OpenAI 在如何分配計算資源以實現眾多優秀想法方面面臨許多限制和艱難的決定。
據多方報導,OpenAI 在獲得足夠的計算基礎設施方面遇到了困難。本週,路透社援引消息人士的消息稱,OpenAI 正在與博通(Broadcom)合作,開髮用於運行其模型的AI 芯片,預計這一芯片將在2026年之前問世。
由於計算能力的緊張,阿爾特曼透露,ChatGPT 的高級語音模式(Advanced Voice Mode)中原本計劃的視覺能力將不會在短期內推出。早在四月的發布會上,OpenAI 展示了其ChatGPT 應用在智能手機上運行,並能夠識別攝像頭視野中人們穿著的衣物等視覺信息。然而,有報導指出,這一演示是為了搶奪谷歌I/O 開發者大會的關注,許多OpenAI 內部員工認為GPT-4o 並沒有準備好被公開。
在問答中,阿爾特曼提到,OpenAI 的圖像生成器DALL-E 的下一次重大更新尚無發布日期。同時,OpenAI 的視頻生成工具Sora 由於需要完善模型、確保安全性以及擴大計算能力而受到延遲。 Sora 在技術上也遭遇了一些挫折,使其在與Luma、Runway 等競爭對手的較量中處於劣勢。
另外,在10月時,Sora 的聯合負責人Tim Brooks 已離職前往谷歌。阿爾特曼在問答中提到,OpenAI 仍在考慮是否在ChatGPT 中允許“成人內容” 出現,並表示公司目前的首要任務是提升o1系列“推理” 模型及其後續版本的性能。在本週的DevDay 大會上,OpenAI 展示了一些即將推出的新功能,包括圖像理解。
阿爾特曼總結道:“我們將在今年晚些時候推出一些非常不錯的新版本,但我們不會稱之為GPT-5。”
劃重點:
OpenAI CEO 表示,計算能力不足是產品發布延遲的主要原因。
公司正在與博通合作開發AI 芯片,預計在2026年問世。
DALL-E 和Sora 等產品的更新沒有明確的發佈時間。
總而言之,OpenAI 目前面臨著計算能力、人才流失以及技術瓶頸等多重挑戰,雖然未來計劃推出新版本,但具體的發佈時間仍存在不確定性。 公司正在積極尋求解決計算能力問題的方案,例如與博通合作開發AI芯片,這將對OpenAI未來的發展產生深遠的影響。 我們可以期待OpenAI在克服這些挑戰後,帶來更多令人驚喜的產品和技術突破。