Geekbench は、AI 集約型のワークロード下でデバイスのパフォーマンスを評価するために設計された新しいクロスプラットフォーム AI パフォーマンス テスト ツールである Geekbench AI を発表します。このツールは、CPU、GPU、NPU のパフォーマンスをテストして、機械学習アプリケーションを処理するデバイスの能力を判断します。以前は Geekbench ML という名前で開発されていましたが、現在の AI テクノロジーの開発トレンドにより沿った Geekbench AI に名前が変更されました。速度と精度の観点からパフォーマンスを評価し、ONNX、CoreML、TensorFlow Lite、OpenVINO などの複数のフレームワークをサポートし、完全精度、半精度、定量化精度の 3 つのスコアを提供し、精度測定も含まれます。
Geekbench AI は、Windows、macOS、Linux、Android、iOS プラットフォームでリリースされています。テスト結果は、消費者がさまざまなデバイスの AI パフォーマンスをより適切に比較するのに役立ち、また、ハードウェア メーカーに AI パフォーマンスを最適化するための参考情報を提供します。ただし、AI のパフォーマンス テストはまだ初期段階にあり、テスト結果と実際のユーザー エクスペリエンスの相関関係についてはさらなる検証が必要です。将来的には、同様の AI パフォーマンス テスト ツールがさらに登場し、AI パフォーマンスは、従来の CPU や GPU のパフォーマンスと同様に、デバイスのパフォーマンスを測定するための重要な要素になるでしょう。
Geekbench AI のテスト結果には、完全精度、半精度、量子化精度の 3 つのスコアが含まれます。 Primate Labs によれば、このスコアには、ワークロードの出力が現実世界の結果にどれだけ近いかを評価する精度の尺度、つまりモデルが意図したタスクをどれだけ正確に実行するかを評価する精度の尺度も含まれているという。
現在、Geekbench AI は Windows、macOS、Linux、Android、iOS プラットフォームでリリースされており、ユーザーはダウンロードして試すことができます。ただし、これらのテスト スコアが実際のタスクのパフォーマンスにどのように関連しているかを完全に理解するには、Copilot Plus PC やさまざまな新しいスマートフォンなど、ネイティブ AI 機能を搭載したデバイスをテストする時間がさらに必要になります。
従来のフレーム レートやロード時間のテストとは異なり、Geekbench AI の出現は、予測テキストの精度や生成 AI 画像エディターのパフォーマンスなどの新しい指標に注意を払い始める必要がある可能性があることを意味します。これは、AI テクノロジーがデバイスのパフォーマンスを評価する方法を大きく変えているという事実を反映しています。
Geekbench AI の開始は、間違いなくデバイス AI 機能の評価に新しい基準を提供します。 AI機能を統合するデバイスが増えるにつれて、このようなテストツールの重要性はますます顕著になるでしょう。これは、消費者がさまざまなデバイスの AI パフォーマンスをよりよく理解して比較するのに役立つだけでなく、ハードウェア メーカーに AI パフォーマンスを最適化するための参考指標を提供します。
ただし、AI パフォーマンス テストはまだ初期段階にあることも認識する必要があります。 Geekbench AI のテスト結果が実際のユーザー エクスペリエンスとどのように関連しているか、さまざまな AI アプリケーション シナリオでデバイスのパフォーマンスを正確に反映する方法については、さらなる観察と検証が必要です。
将来的には、さまざまな観点からデバイスの AI 機能を評価する、同様の AI パフォーマンス テスト ツールがさらに登場する可能性があります。この傾向は、AI テクノロジーがデバイスのパフォーマンスを判断する際の重要な要素になりつつあることも反映しており、これは従来の CPU や GPU のパフォーマンスと同じくらい重要です。
全体として、Geekbench AI の登場により、AI のパフォーマンス評価がますます重視されるようになりました。これは消費者や製造業者にとって重要な基準となりますが、実際のアプリケーション シナリオをより適切に反映するためには継続的な改善も必要になります。