Anthropic 宣布了一项雄心勃勃的计划,旨在资助开发新的 AI 模型基准测试。该计划旨在改进对 AI 模型性能和影响的评估,特别关注 AI 安全和社会影响等重要方面。此举旨在解决现有基准测试的不足,例如无法有效捕捉真实世界应用场景以及未能准确测量其声称测量的内容等问题。Anthropic 呼吁开发更具挑战性的基准测试,以评估 AI 模型在网络攻击、武器增强、信息操纵等方面的能力,并探索 AI 在科学研究、多语言交流等领域的潜力。这将有助于更全面地了解 AI 的能力和风险,推动 AI 安全领域的发展。
Anthropic 将向第三方组织提供资金支持,鼓励他们开发更有效的评估方法。该计划体现了 Anthropic 对提升整个 AI 安全领域的承诺,并致力于推动全面 AI 评估成为行业标准。然而,鉴于 Anthropic 自身的商业利益,其计划的客观性和公正性仍需进一步考量。未来,该计划的成功与否将取决于资金和人力的投入以及与其他相关组织的合作程度。