Anthropic は、新しい AI モデル ベンチマークの開発に資金を提供する野心的な計画を発表しました。このプログラムは、AI の安全性や社会的影響などの重要な側面に特に注意を払い、AI モデルのパフォーマンスと影響の評価を改善することを目的としています。この動きは、現実世界のアプリケーション シナリオを効果的にキャプチャできないことや、測定対象を正確に測定できないことなど、既存のベンチマークの欠点に対処することを目的としています。 Anthropic は、サイバー攻撃、兵器の強化、情報操作などにおける AI モデルの能力を評価し、科学研究、多言語コミュニケーション、その他の分野における AI の可能性を探るため、より挑戦的なベンチマーク テストの開発を求めています。これは、AI の機能とリスクをより包括的に理解し、AI セキュリティ分野の発展を促進するのに役立ちます。
Anthropic は、より効果的な評価方法の開発を奨励するために、第三者機関に財政的支援を提供します。このプログラムは、AI 安全分野全体を改善し、業界標準として包括的な AI 評価を促進するという Anthropic の取り組みを反映しています。ただし、Anthropic 自身のビジネス上の利益を考慮すると、その計画の客観性と公平性についてはさらに検討する必要があります。今後、このプログラムが成功するかどうかは、資金と人材の投入、そして他の関係機関との協力の度合いにかかっています。