亚马逊在 Re:Invent 大会上宣布与 Anthropic 合作,共同建造全球最大的人工智能超级计算机 “Rainer”。该项目将配备数十万颗最新的 AI 训练芯片 Trainium2,规模是 Anthropic 目前最强大模型所用集群的五倍,预计将成为全球最强大的 AI 训练机器。 这标志着亚马逊在生成式 AI 领域的一次重大投入,旨在与微软和谷歌等竞争对手抗衡,并进一步巩固其在云计算市场的领导地位。 亚马逊还展示了下一代训练芯片 Trainium3,并推出了多项工具,帮助客户更有效地使用生成式 AI 模型,降低成本并提高可靠性。
在最近举行的 Re:Invent 大会上,亚马逊宣布与 AI 公司 Anthropic 合作,正在建设全球最大的人工智能超级计算机。
这台超级计算机的规模将是 Anthropic 目前最强大模型所使用集群的五倍,预计完成后将成为全球最大的人工智能训练机器。亚马逊表示,这一项目被称为 “Rainer”,将配备数十万颗最新的 AI 训练芯片 Trainium2。
图源备注:图片由AI生成,图片授权服务商Midjourney
亚马逊云服务(AWS)的首席执行官马特・加曼(Matt Garman)在会议上还透露,Trainium2将普遍可用,并将在 Trn2UltraServer 集群中专门用于训练前沿 AI。与使用 Nvidia 显卡的集群相比,新的 AWS 集群的成本将降低30% 至40%。虽然亚马逊是全球最大的云计算服务提供商,但在生成性 AI 领域,其竞争对手如微软和谷歌曾一度领先。不过,亚马逊今年已向 Anthropic 投资了80亿美元,并通过其 AWS 平台 Bedrock 推出了一系列帮助公司使用生成性 AI 的工具。
此外,亚马逊还展示了其下一代训练芯片 Trainium3,预计在2025年底向客户提供,性能将是当前芯片的四倍。业内专家指出,Trainium3在芯片间的数据传输方面进行了显著优化,这对大型 AI 模型的开发至关重要。尽管 Nvidia 在 AI 训练领域依然占据主导地位,但亚马逊的创新显示出市场正在出现竞争。
亚马逊还计划推出一系列工具,帮助客户处理生成性 AI 模型,这些模型往往成本高、可靠性差。新推出的 AWS 服务 Model Distillation 可以生成更小、更便宜的模型,而 Bedrock Agents 则可以创建和管理自动化任务的 AI 代理。加曼表示,企业对亚马逊新推出的工具将特别感兴趣,例如确保聊天机器人输出准确性的工具。
亚马逊的新验证工具名为 “自动推理”,与 OpenAI 此前推出的类似产品有所不同。它依赖于逻辑推理对模型的输出进行分析。
为了实现这一点,企业需要将数据和政策转换为逻辑分析格式。这种形式化推理方法在芯片设计和密码学等领域已有数十年的应用经验。通过组合多种具有自动推理功能的系统,企业可以构建更复杂的应用和服务。
总而言之,亚马逊的举动表明其在人工智能领域的野心勃勃,通过巨额投资、硬件创新和软件工具的开发,力求在竞争激烈的生成式 AI 市场占据一席之地,并为客户提供更强大的AI解决方案。