OpenAI最新发布的o3AI模型,以其强大的性能和高昂的运行成本引发业界关注。该模型在ARC-AGI基准测试中取得了令人瞩目的成绩,但每次任务的费用却超过1000美元,远超其前代产品。这凸显了人工智能模型在性能提升与成本控制之间的矛盾,也引发了对“扩展”方式收益递减的讨论。本文将深入分析o3AI模型的性能、成本以及未来发展。
OpenAI 最近推出的 o3AI 模型被认为是其最强大的人工智能产品,但其运行成本却令人咋舌,单次任务费用超过1000美元。
根据 TechCrunch 的报道,这款新模型在处理复杂问题时采用了一种称为 “测试时计算” 的技术,意味着它在得出答案前会花费更多时间进行思考和探索多种可能性。因此,OpenAI 工程师希望 o3能够在复杂提示下产生更优质的回应。
根据 ARC-AGI 基准测试的创始人 François Chollet 的说法,o3在其强大的 “高计算模式” 下,得分达到了87.5%,几乎是前一代 o1模型得分32% 的三倍。这表明 o3在性能上的提升是显著的。然而,这种精细的计算过程伴随着巨大的开销。为了达到这一高分,o3的计算成本超过了每个任务1000美元,使用的计算能力比低功耗版 o3多出了170倍,远远高于其前身,每个任务的成本不足4美元。
这一情况使得业界对 o3模型的表现和其运行成本之间的矛盾产生了关注。一方面,o3的得分大幅提升似乎证明了人工智能模型通过 “扩展” 方式,即增加处理能力和训练数据,仍然可以获得进步。但另一方面,关于扩展所带来的收益递减的批评声音也在增加。虽然 o3的提升主要得益于改进其 “推理” 方式而非单纯的扩展,但其高昂的运行成本无疑让人心生忧虑。
即使是低计算版本的 o3,其在基准测试中得分达到了76%,但每个任务的成本也达到了约20美元,虽然相对而言仍算是个相对便宜的选择,但与其前代产品相比仍然贵了好几倍。而且,考虑到 ChatGPT Plus 每月收费仅25美元,这使得 OpenAI 在提升用户使用的智能化水平时面临着巨大的成本压力。
在一篇关于基准测试结果的博客中,Chollet 指出,虽然 o3在接近人类的表现水平,但 “成本仍然很高,尚不具备经济性”。他表示,解决 ARC-AGI 任务的人力成本大约为每个任务5美元,而能耗则只是几美分。然而,他乐观地认为,“成本效益在未来几个月和几年内有可能会显著改善。” 目前,o3尚未向公众发布,预计其 “迷你版” 将于明年1月推出。
划重点:
o3AI 模型的单次查询成本超过1000美元,显示出其运行的高昂费用。
在 ARC-AGI 基准测试中,o3得分达到87.5%,几乎是前一代 o1模型的三倍。
目前 o3尚未向公众发布,预计 “迷你版” 将于明年1月推出。
总而言之,o3AI模型展现了人工智能技术强大的发展潜力,但也暴露出高昂成本带来的挑战。未来,如何平衡性能提升与成本控制将成为人工智能领域的关键问题,而o3AI模型的“迷你版”也备受期待,其能否在降低成本的同时保持出色性能,值得我们持续关注。