Anthropic 宣布了一項雄心勃勃的計劃,旨在資助開發新的AI 模型基準測試。該計劃旨在改進對AI 模型性能和影響的評估,特別關注AI 安全和社會影響等重要方面。此舉旨在解決現有基準測試的不足,例如無法有效捕捉真實世界應用場景以及未能準確測量其聲稱測量的內容等問題。 Anthropic 呼籲開發更具挑戰性的基準測試,以評估AI 模型在網路攻擊、武器增強、資訊操縱等方面的能力,並探索AI 在科學研究、多語言交流等領域的潛力。這將有助於更全面地了解AI 的能力和風險,推動AI 安全領域的發展。
Anthropic 將向第三方組織提供資金支持,鼓勵他們開發更有效的評估方法。該計劃體現了Anthropic 對提升整個AI 安全領域的承諾,並致力於推動全面AI 評估成為業界標準。然而,鑑於Anthropic 自身的商業利益,其計劃的客觀性和公正性仍需進一步考慮。未來,該計劃的成功與否將取決於資金和人力的投入以及與其他相關組織的合作程度。