Geekbench推出全新跨平台AI效能測試工具Geekbench AI,旨在評估設備在AI密集型工作負載下的表現。此工具測試CPU、GPU和NPU性能,以判斷設備處理機器學習應用的能力。先前以Geekbench ML名義開發,現更名為Geekbench AI,更貼合當前AI技術發展趨勢。它從速度和準確性兩方面評估效能,支援ONNX、CoreML、TensorFlow Lite和OpenVINO等多種框架,提供全精度、半精度和量化精度三個分數,並包含準確性測量。
Geekbench AI已經在Windows、macOS、Linux、Android和iOS平台上發布。其測試結果將幫助消費者更好地比較不同設備的AI性能,也為硬體廠商提供優化AI性能的參考。然而,目前AI效能測試仍處於早期階段,其測試結果與實際使用者體驗的關聯性仍需要進一步驗證。未來,更多類似的AI效能測試工具將會出現,AI效能將成為衡量設備效能的重要維度,與傳統的CPU、GPU效能同等重要。
Geekbench AI的測試結果包含三個分數:全精度、半精度和量化精度。 Primate Labs表示,這些分數還包含了準確性測量,用於評估工作負載輸出與真實結果的接近程度,即模型執行預期任務的準確性。
目前,Geekbench AI已經在Windows、macOS、Linux、Android和iOS平台上發布,用戶可以下載試用。然而,要全面了解這些測驗分數與實際任務表現的關聯,我們還需要更多時間來測試搭載本地AI功能的設備,例如Copilot Plus PC和各種新型智慧型手機。
與傳統的幀率或載入時間測試不同,Geekbench AI的出現意味著我們可能需要開始關注預測文字的準確性,或生成式AI影像編輯器的表現等新指標。這反映了AI技術正在深刻改變我們評估設備性能的方式。
Geekbench AI的推出無疑為設備AI能力的評估提供了一個新的標準。隨著越來越多的設備整合AI功能,這類測試工具的重要性將日益凸顯。它不僅能幫助消費者更了解和比較不同設備的AI性能,也為硬體廠商提供了優化AI性能的參考指標。
然而,我們也應該認識到,AI性能測試仍處於早期階段。 Geekbench AI的測試結果如何與實際使用者體驗相關聯,以及如何準確反映不同AI應用情境下的裝置表現,都還需要進一步觀察與驗證。
未來,我們可能會看到更多類似的AI性能測試工具出現,它們將從不同角度評估設備的AI能力。這種趨勢也反映了AI技術正在成為評判設備效能的重要維度,與傳統的CPU、GPU效能同等重要。
總而言之,Geekbench AI的出現標誌著對AI性能評估的重視程度日益提升,它為消費者和製造商提供了重要的參考依據,但同時也需要持續的完善和改進,以更好地反映實際應用場景下的AI性能表現。