OpenAI首席执行官Sam Altman近期在Reddit问答中坦诚,计算能力不足是阻碍公司频繁推出新产品的主要瓶颈。AI模型日益复杂,资源分配成为OpenAI面临的巨大挑战,导致诸多计划中的功能和产品更新延后。这不仅影响了ChatGPT高级语音模式的视觉功能上线,也使得DALL-E的重大更新和视频生成工具Sora的发布遥遥无期。公司内部也面临着人员变动和技术难题,进一步加剧了产品开发的难度。本文将深入分析OpenAI面临的挑战以及未来的发展规划。
在近期的一次 Reddit 问答中,OpenAI 的首席执行官山姆・阿尔特曼(Sam Altman)坦承,计算能力的不足是公司无法频繁推出新产品的主要原因之一。他表示,当前的 AI 模型越来越复杂,OpenAI 在如何分配计算资源以实现众多优秀想法方面面临许多限制和艰难的决定。
据多方报道,OpenAI 在获得足够的计算基础设施方面遇到了困难。本周,路透社援引消息人士的消息称,OpenAI 正在与博通(Broadcom)合作,开发用于运行其模型的 AI 芯片,预计这一芯片将在2026年之前问世。
由于计算能力的紧张,阿尔特曼透露,ChatGPT 的高级语音模式(Advanced Voice Mode)中原本计划的视觉能力将不会在短期内推出。早在四月的发布会上,OpenAI 展示了其 ChatGPT 应用在智能手机上运行,并能够识别摄像头视野中人们穿着的衣物等视觉信息。然而,有报道指出,这一演示是为了抢夺谷歌 I/O 开发者大会的关注,许多 OpenAI 内部员工认为 GPT-4o 并没有准备好被公开。
在问答中,阿尔特曼提到,OpenAI 的图像生成器 DALL-E 的下一次重大更新尚无发布日期。同时,OpenAI 的视频生成工具 Sora 由于需要完善模型、确保安全性以及扩大计算能力而受到延迟。Sora 在技术上也遭遇了一些挫折,使其在与 Luma、Runway 等竞争对手的较量中处于劣势。
另外,在10月时,Sora 的联合负责人 Tim Brooks 已离职前往谷歌。阿尔特曼在问答中提到,OpenAI 仍在考虑是否在 ChatGPT 中允许 “成人内容” 出现,并表示公司目前的首要任务是提升 o1系列 “推理” 模型及其后续版本的性能。在本周的 DevDay 大会上,OpenAI 展示了一些即将推出的新功能,包括图像理解。
阿尔特曼总结道:“我们将在今年晚些时候推出一些非常不错的新版本,但我们不会称之为 GPT-5。”
划重点:
OpenAI CEO 表示,计算能力不足是产品发布延迟的主要原因。
公司正在与博通合作开发 AI 芯片,预计在2026年问世。
DALL-E 和 Sora 等产品的更新没有明确的发布时间。
总而言之,OpenAI 目前面临着计算能力、人才流失以及技术瓶颈等多重挑战,虽然未来计划推出新版本,但具体的发布时间仍存在不确定性。 公司正在积极寻求解决计算能力问题的方案,例如与博通合作开发AI芯片,这将对OpenAI未来的发展产生深远的影响。 我们可以期待OpenAI在克服这些挑战后,带来更多令人惊喜的产品和技术突破。