Geekbench lança Geekbench AI, uma nova ferramenta de teste de desempenho de IA multiplataforma projetada para avaliar o desempenho de dispositivos sob cargas de trabalho com uso intensivo de IA. Esta ferramenta testa o desempenho de CPU, GPU e NPU para determinar a capacidade de um dispositivo de lidar com aplicativos de aprendizado de máquina. Anteriormente desenvolvido sob o nome Geekbench ML, agora foi renomeado Geekbench AI, o que está mais alinhado com a tendência atual de desenvolvimento da tecnologia de IA. Ele avalia o desempenho em termos de velocidade e precisão, oferece suporte a várias estruturas, como ONNX, CoreML, TensorFlow Lite e OpenVINO, fornece três pontuações de precisão total, meia precisão e precisão quantificada e inclui medições de precisão.
Geekbench AI foi lançado nas plataformas Windows, macOS, Linux, Android e iOS. Os resultados dos testes ajudarão os consumidores a comparar melhor o desempenho da IA de diferentes dispositivos e também fornecerão aos fabricantes de hardware uma referência para otimizar o desempenho da IA. No entanto, os testes de desempenho da IA ainda estão numa fase inicial e a correlação entre os resultados dos testes e a experiência real do utilizador necessita de uma verificação mais aprofundada. No futuro, mais ferramentas semelhantes de teste de desempenho de IA aparecerão, e o desempenho da IA se tornará uma dimensão importante para medir o desempenho do dispositivo, tão importante quanto o desempenho tradicional de CPU e GPU.
Os resultados dos testes do Geekbench AI incluem três pontuações: precisão total, precisão parcial e precisão quantizada. Primate Labs afirma que as pontuações também incluem uma medida de precisão que avalia o quão próxima a saída da carga de trabalho está dos resultados do mundo real – ou seja, a precisão com que o modelo executa a tarefa pretendida.
Atualmente, o Geekbench AI foi lançado nas plataformas Windows, macOS, Linux, Android e iOS, e os usuários podem baixá-lo e testá-lo. No entanto, para compreender completamente como essas pontuações de teste se relacionam com o desempenho real das tarefas, precisaremos de mais tempo testando dispositivos equipados com recursos nativos de IA, como PCs Copilot Plus e vários novos smartphones.
Ao contrário dos testes tradicionais de taxa de quadros ou tempo de carregamento, o surgimento do Geekbench AI significa que talvez precisemos começar a prestar atenção a novas métricas, como a precisão do texto preditivo ou o desempenho dos editores de imagens generativos de IA. Isto reflete o facto de que a tecnologia de IA está a mudar profundamente a forma como avaliamos o desempenho dos dispositivos.
O lançamento do Geekbench AI fornece, sem dúvida, um novo padrão para a avaliação das capacidades de IA dos dispositivos. À medida que mais e mais dispositivos integram funções de IA, a importância de tais ferramentas de teste tornar-se-á cada vez mais proeminente. Ele não apenas ajuda os consumidores a entender e comparar melhor o desempenho da IA de diferentes dispositivos, mas também fornece aos fabricantes de hardware indicadores de referência para otimizar o desempenho da IA.
No entanto, devemos também reconhecer que os testes de desempenho da IA ainda estão numa fase inicial. Como os resultados dos testes do Geekbench AI estão relacionados à experiência real do usuário e como refletir com precisão o desempenho do dispositivo em diferentes cenários de aplicação de IA exigem observação e verificação adicionais.
No futuro, poderemos ver o surgimento de ferramentas de teste de desempenho de IA mais semelhantes, que avaliarão as capacidades de IA dos dispositivos de diferentes perspectivas. Esta tendência também reflete que a tecnologia de IA está se tornando uma dimensão importante no julgamento do desempenho do dispositivo, que é tão importante quanto o desempenho tradicional da CPU e da GPU.
Em suma, o surgimento da IA Geekbench marca uma ênfase crescente na avaliação do desempenho da IA. Ela fornece uma base de referência importante para consumidores e fabricantes, mas também requer melhorias e melhorias contínuas para melhor refletir os cenários reais de aplicação.