Geekbench lanza Geekbench AI, una nueva herramienta de prueba de rendimiento de IA multiplataforma diseñada para evaluar el rendimiento de dispositivos bajo cargas de trabajo intensivas en IA. Esta herramienta prueba el rendimiento de la CPU, GPU y NPU para determinar la capacidad de un dispositivo para manejar aplicaciones de aprendizaje automático. Anteriormente desarrollado con el nombre de Geekbench ML, ahora pasó a llamarse Geekbench AI, que está más en línea con la tendencia de desarrollo actual de la tecnología de IA. Evalúa el rendimiento en términos de velocidad y precisión, admite múltiples marcos como ONNX, CoreML, TensorFlow Lite y OpenVINO, proporciona tres puntuaciones de precisión total, precisión media y precisión cuantificada e incluye mediciones de precisión.
Geekbench AI se lanzó en plataformas Windows, macOS, Linux, Android e iOS. Los resultados de las pruebas ayudarán a los consumidores a comparar mejor el rendimiento de la IA de diferentes dispositivos y también proporcionarán a los fabricantes de hardware una referencia para optimizar el rendimiento de la IA. Sin embargo, las pruebas de rendimiento de la IA aún se encuentran en sus primeras etapas y la correlación entre los resultados de las pruebas y la experiencia real del usuario necesita una mayor verificación. En el futuro, aparecerán más herramientas de prueba de rendimiento de IA similares, y el rendimiento de la IA se convertirá en una dimensión importante para medir el rendimiento del dispositivo, tan importante como el rendimiento de la CPU y la GPU tradicionales.
Los resultados de las pruebas de Geekbench AI incluyen tres puntuaciones: precisión total, precisión media y precisión cuantificada. Primate Labs afirma que las puntuaciones también incluyen una medida de precisión que evalúa qué tan cerca está el resultado de una carga de trabajo de los resultados del mundo real, es decir, con qué precisión el modelo realiza la tarea prevista.
Actualmente, Geekbench AI se lanzó en plataformas Windows, macOS, Linux, Android e iOS, y los usuarios pueden descargarlo y probarlo. Sin embargo, para comprender completamente cómo se relacionan los puntajes de estas pruebas con el desempeño real de las tareas, necesitaremos más tiempo para probar dispositivos equipados con capacidades nativas de IA, como las PC Copilot Plus y varios teléfonos inteligentes nuevos.
A diferencia de las pruebas tradicionales de velocidad de cuadros o tiempo de carga, la aparición de Geekbench AI significa que es posible que debamos comenzar a prestar atención a nuevas métricas como la precisión del texto predictivo o el rendimiento de los editores de imágenes de IA generativa. Esto refleja el hecho de que la tecnología de IA está cambiando profundamente la forma en que evaluamos el rendimiento de los dispositivos.
El lanzamiento de Geekbench AI sin duda proporciona un nuevo estándar para la evaluación de las capacidades de IA de los dispositivos. A medida que más y más dispositivos integren funciones de IA, la importancia de dichas herramientas de prueba será cada vez más destacada. No solo ayuda a los consumidores a comprender y comparar mejor el rendimiento de la IA de diferentes dispositivos, sino que también proporciona a los fabricantes de hardware indicadores de referencia para optimizar el rendimiento de la IA.
Sin embargo, también debemos reconocer que las pruebas de rendimiento de la IA aún se encuentran en sus primeras etapas. La forma en que los resultados de las pruebas de Geekbench AI se relacionan con la experiencia real del usuario y cómo reflejar con precisión el rendimiento del dispositivo en diferentes escenarios de aplicaciones de AI requieren mayor observación y verificación.
En el futuro, es posible que veamos surgir más herramientas de prueba de rendimiento de IA similares, que evaluarán las capacidades de IA de los dispositivos desde diferentes perspectivas. Esta tendencia también refleja que la tecnología de IA se está convirtiendo en una dimensión importante a la hora de juzgar el rendimiento de los dispositivos, que es tan importante como el rendimiento de la CPU y la GPU tradicionales.
Con todo, la aparición de Geekbench AI marca un énfasis cada vez mayor en la evaluación del rendimiento de la IA. Proporciona una base de referencia importante para consumidores y fabricantes, pero también requiere mejoras y mejoras continuas para reflejar mejor el rendimiento de las aplicaciones reales.