Geekbench推出全新跨平台AI性能测试工具Geekbench AI,旨在评估设备在AI密集型工作负载下的表现。该工具测试CPU、GPU和NPU性能,以判断设备处理机器学习应用的能力。此前以Geekbench ML名义开发,现更名为Geekbench AI,更贴合当前AI技术发展趋势。它从速度和准确性两方面评估性能,支持ONNX、CoreML、TensorFlow Lite和OpenVINO等多种框架,提供全精度、半精度和量化精度三个分数,并包含准确性测量。
Geekbench AI已经在Windows、macOS、Linux、Android和iOS平台上发布。其测试结果将帮助消费者更好地比较不同设备的AI性能,也为硬件厂商提供优化AI性能的参考。然而,目前AI性能测试仍处于早期阶段,其测试结果与实际用户体验的关联性还需要进一步验证。未来,更多类似的AI性能测试工具将会出现,AI性能将成为衡量设备性能的重要维度,与传统的CPU、GPU性能同等重要。
Geekbench AI的测试结果包含三个分数:全精度、半精度和量化精度。Primate Labs表示,这些分数还包含了准确性测量,用于评估工作负载输出与真实结果的接近程度,即模型执行预期任务的准确性。
目前,Geekbench AI已经在Windows、macOS、Linux、Android和iOS平台上发布,用户可以下载试用。然而,要全面了解这些测试分数与实际任务性能的关联,我们还需要更多时间来测试搭载本地AI功能的设备,如Copilot Plus PC和各种新型智能手机。
与传统的帧率或加载时间测试不同,Geekbench AI的出现意味着我们可能需要开始关注预测文本的准确性,或者生成式AI图像编辑器的表现等新指标。这反映了AI技术正在深刻改变我们评估设备性能的方式。
Geekbench AI的推出无疑为设备AI能力的评估提供了一个新的标准。随着越来越多的设备集成AI功能,这类测试工具的重要性将日益凸显。它不仅能帮助消费者更好地了解和比较不同设备的AI性能,也为硬件厂商提供了优化AI性能的参考指标。
然而,我们也应该认识到,AI性能测试仍处于早期阶段。Geekbench AI的测试结果如何与实际用户体验相关联,以及如何准确反映不同AI应用场景下的设备表现,都还需要进一步观察和验证。
未来,我们可能会看到更多类似的AI性能测试工具出现,它们将从不同角度评估设备的AI能力。这种趋势也反映了AI技术正在成为评判设备性能的一个重要维度,与传统的CPU、GPU性能同等重要。
总而言之,Geekbench AI的出现标志着对AI性能评估的重视程度日益提升,它为消费者和厂商提供了重要的参考依据,但同时也需要持续的完善和改进,以更好地反映实际应用场景下的AI性能表现。