专注于推理的OpenAI“草莓”模型两周内发布？是人工智能下一重大突破

作者：Eve Cole 更新时间：2024-11-22 11:12:01

9月10日周二，据知名科技商业类媒体The Information援引多位测试过该模型的人士透露，站在时代风口浪尖的“AI宠儿”OpenAI计划在未来两周内发布名为“草莓”的最新人工智能产品，作为ChatGPT所提供服务的一部分。这比两周前传闻的“秋季发布”（9月至11月）要更早。

上述报道称，专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题，但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力，希望通过近几个月被市场期待已久的草莓项目，来恢复ChatGPT首发以来两年里大部分时间的势头。

何为“草莓”模型？专注于推理能力，是人工智能下一个重大突破

两周前曾有消息称，OpenAI加速推出“草莓”推理人工智能模型，以推动聊天机器人业务。四周前的消息称，著名AI搜索公司perplexity CEO暗示已经提前用上了OpenAI的最新模型“草莓”。

华尔街见闻曾提到，早在5月时就有传闻称OpenAI正在神秘开发代号为“草莓”的项目。两个月前的7月13日，又有消息确认“草莓”是OpenAI正在开发新的人工智能模型，希望提供更高级推理能力以形成迈向通用人工智能（agi）的重大突破。

具体来说，“草莓”模型凭借增强的推理能力，能够更好地处理令以往AI模型“挠头”的复杂科学和数学问题，不仅能让大语言模型（LLM）根据用户的复杂查询生成答案，甚至还能提前规划，以便自主、可靠地浏览互联网，进行OpenAI 定义的“深度研究”（deep research）。

评论普遍认为，OpenAI的“草莓计划”有望成为人工智能下一个重大突破。更先进的推理能力意味着该技术可以“自主”执行更复杂任务，而不仅仅是依靠用户的逐步提示行事。推理一直是AI在类人智能追求中最棘手的问题之一，而具有推理能力的人工智能模型不仅能改善数学和编程能力，还可以彻底改变科学研究，增强医疗保健和金融等复杂领域的决策力，并加速技术创新。

会显著更贵吗？“草莓”模型具体的提供形式和定价模式尚不确定

据悉，“草莓”发布后虽然整体作为ChatGPT的一部分，但也是一项独立产品，可能会纳入客户选择以支持ChatGPT运行的AI模型下拉菜单中，但具体的提供形式和定价模式都尚不确定。

与常规的对话式人工智能不同，“草莓”在回应用户的提示语之前会“思考”10到20秒，而不是立即给出答案。对于复杂或包含多个执行步骤要求的查询语，“草莓”将比现有的GPT-4o版本更易于使用，不需要用户明确告知ChatGPT“完成中间推理步骤以得出最终答案”等额外举动。

有分析称，这意味着“草莓”将成为更加智能的助手，不仅在解决数学问题和编码方面表现更佳，在更“主观”的商业任务方面也更优秀，比如集思广益制定产品营销策略等。而且在这类偏创意的任务中，该模型将提供更针对用户公司需求、更详细的建议，比如生成每周执行计划。

不过，假设发布一切顺利，在初始版本“草莓”只能接收和生成文本信息，而不能接收和生成图像，这代表不像其他OpenAI模型那样具备“多模态”功能，算是“缺点”之一。

同时，尽管“思考”阶段有助于避免AI犯错、且能预测如何全面回答用户问题，但有测试过该模型的人士称，一些简单问题也会令草莓“思考”而无法迅速给出答案；答案质量仅略佳，不值得额外等待；而且有时无法在回答新问题之前记住并整合与用户的先前聊天记录。

在定价方面，上周曾有消息称，ChatGPT Plus当前付费价格是每月20美元，但OpenAI考虑将“草莓”和被外界誉为“ChatGPT 5”的“猎户座”（Orion）等全新大模型拟定在月付2000美元，等于定价提升100倍。分析认为，OpenAI能考虑如此高的价格跨度，主要是因为缺钱、新产品足够强以及手握数亿用户。

“草莓”模型为何重要？或重新定义AI能力边界，为GPT 5提供高质量合成训练数据

OpenAI首席执行官奥特曼（Sam Altman）曾在今年早些时候表示，人工智能领域“最重要的进步方向将是推理能力”。

而“草莓”项目被认为就是去年披露出的OpenAI“Q*”计划，该项目在公司内部已被视为一项突破。观看过演示的人称能够回答当前商用AI模型无法解决的棘手科学和数学问题。

OpenAI曾在8月11日给出了未来AI发展的五个阶段路线图，第一阶段便是现在具有对话语言的AI聊天机器人，第二阶段是具有人类水平问题解决能力的“推理者”，第三阶段是可以采取自主行动的“代理人”（ai agent），随后是可协助发明的“创新者”和可完成组织工作的“组织者”。

而“草莓”极可能是帮助OpenAI实现第二级AI的关键，一旦成功将重新定义AI的能力边界，自主执行复杂任务、独立解决复杂问题并验证输出内容，代表人类离通用人工智能AGI又进一步。专注于推理的“草莓”可能也是为下一代AI模型“猎户座”或者说ChatGPT 5奠基的必经之路。

软件开发机构Technology Rivers创始人兼CEO Ghazenfer Mansoor指出，借助“草莓”项目，OpenAI对人类推理水平的追求不仅是技术奇迹，更能突破界限、激发每个领域新的可能性。比如在商业领域，人工智能将能极大地改变供应链的管理方式，非常准确地预测市场趋势，并在很大程度上使客户体验非常个性化。

而在普通用户的层面，其使用体验也会有所改进，例如具有推理能力的AI模型不仅能提供更优化的旅行计划和健康建议，甚至可以分析用户的消费习惯并创建完全定制化的预算方案，做更智能的助手。

总而言之，在理想化的情况下，“草莓”将能够解决超出当前人工智能模型能力范围的问题和任务，并进行“深入研究”，“比任何现有的聊天机器人都更胜一筹”。

还有分析指出，“草莓”计划旨在筹集更多资金，OpenAI需要这笔钱来支持代号为“猎户座”的下一代前沿模型开发。而且，为“猎户座”模型生成高质量的合成训练数据被认为是“草莓”的关键应用之一，“这一点意义重大，因为互联网上的大部分训练数据都已被使用殆尽”：

人工智能模型所依赖的大型数据集可能容易出现偏差和错误，或者包含不完整或不准确的信息。草莓计划生成的高质量合成数据可以填补现实世界数据集的空白，并提供更全面、更包容、更平衡的训练集。
许多人认为，使用合成数据可以帮助未来的人工智能模型更加中立和公平，并减少噪音、幻觉和不相关的信息，从而提高训练的效率和模型的准确性。
根据已知的信息，草莓计划改进了推理、逻辑以及规划和开展研究的能力，可以让模型自主进行实验、分析数据并提出新的假设。这可能会带来科学突破，包括发现新药。这些模型还可以提供个性化教育，创建教育内容和互动课程。

据知情人士透露，“草莓”项目包括一种专门的“后训练”方法，即生成式AI模型已经过大量数据集上进行预训练后，进一步调整模型以提高其在特定任务上的表现。这类似于斯坦福大学在2022年开发的“自学推理者”（Self-Taught Reasoner，简称STaR）方法。

STaR创造者之一、斯坦福大学教授Noah Goodman曾表示，STaR可以让AI模型通过迭代创建自有训练数据，“引导 ”自己进入更高的智能水平，理论上可用来让语言模型实现超越人类的智能。但他也承认，“这既令人兴奋又令人恐惧，人类（应就自身处境）需要认真思考一些问题了。”