在近期的一次Reddit 問答中,OpenAI 的執行長山姆・阿爾特曼(Sam Altman)坦承,運算能力的不足是公司無法頻繁推出新產品的主要原因之一。他表示,目前的AI 模型越來越複雜,OpenAI 在如何分配運算資源以實現眾多優秀想法方面面臨許多限制和艱難的決定。
根據多方報道,OpenAI 在獲得足夠的運算基礎設施方面遇到了困難。本週,路透社引述消息人士的消息稱,OpenAI 正在與博通(Broadcom)合作,開發用於運行其模型的AI 晶片,預計這顆晶片將在2026年之前問世。
由於運算能力的緊張,阿爾特曼透露,ChatGPT 的高級語音模式(Advanced Voice Mode)中原本計劃的視覺能力將不會在短期內推出。早在四月的發布會上,OpenAI 展示了其ChatGPT 應用在智慧型手機上運行,並能夠識別相機視野中人們穿著的衣物等視覺資訊。然而,有報導指出,這項演示是為了搶奪谷歌I/O 開發者大會的關注,許多OpenAI 內部員工認為GPT-4o 並沒有準備好被公開。
在問答中,阿爾特曼提到,OpenAI 的圖像生成器DALL-E 的下一個重大更新尚無發布日期。同時,OpenAI 的視訊生成工具Sora 由於需要完善模型、確保安全性以及擴大運算能力而受到延遲。 Sora 在技術上也遭遇了一些挫折,使其在與Luma、Runway 等競爭對手的較量中處於劣勢。
另外,在10月時,Sora 的聯合負責人Tim Brooks 已離職前往谷歌。阿爾特曼在問答中提到,OpenAI 仍在考慮是否在ChatGPT 中允許“成人內容” 出現,並表示公司目前的首要任務是提升o1系列“推理” 模型及其後續版本的性能。在本週的DevDay 大會上,OpenAI 展示了一些即將推出的新功能,包括圖像理解。
阿爾特曼總結道:“我們將在今年晚些時候推出一些非常好的新版本,但我們不會稱之為GPT-5。”