Geekbench meluncurkan Geekbench AI, alat pengujian kinerja AI lintas platform baru yang dirancang untuk mengevaluasi kinerja perangkat di bawah beban kerja intensif AI. Alat ini menguji kinerja CPU, GPU, dan NPU untuk menentukan kemampuan perangkat dalam menangani aplikasi pembelajaran mesin. Sebelumnya dikembangkan dengan nama Geekbench ML, kini berganti nama menjadi Geekbench AI yang lebih sesuai dengan tren perkembangan teknologi AI saat ini. Ini mengevaluasi kinerja dalam hal kecepatan dan akurasi, mendukung beberapa kerangka kerja seperti ONNX, CoreML, TensorFlow Lite, dan OpenVINO, memberikan tiga skor presisi penuh, presisi setengah, dan presisi terukur, dan mencakup pengukuran akurasi.
Geekbench AI telah dirilis pada platform Windows, macOS, Linux, Android dan iOS. Hasil pengujian akan membantu konsumen membandingkan kinerja AI dari berbagai perangkat dengan lebih baik, dan juga memberikan referensi kepada produsen perangkat keras untuk mengoptimalkan kinerja AI. Namun, pengujian performa AI masih dalam tahap awal, dan korelasi antara hasil pengujian dan pengalaman pengguna sebenarnya memerlukan verifikasi lebih lanjut. Di masa depan, akan ada lebih banyak alat pengujian kinerja AI yang serupa, dan kinerja AI akan menjadi dimensi penting untuk mengukur kinerja perangkat, sama pentingnya dengan kinerja CPU dan GPU tradisional.
Hasil pengujian Geekbench AI mencakup tiga skor: presisi penuh, presisi setengah, dan presisi terkuantisasi. Primate Labs mengatakan bahwa skor tersebut juga mencakup ukuran akurasi yang mengevaluasi seberapa dekat keluaran beban kerja dengan hasil di dunia nyata—yaitu, seberapa akurat model melakukan tugas yang dimaksudkan.
Saat ini Geekbench AI telah dirilis pada platform Windows, macOS, Linux, Android dan iOS, dan pengguna dapat mengunduh dan mencobanya. Namun, untuk memahami sepenuhnya bagaimana skor tes ini berhubungan dengan kinerja tugas sebenarnya, kita memerlukan lebih banyak waktu untuk menguji perangkat yang dilengkapi dengan kemampuan AI asli, seperti PC Copilot Plus dan berbagai ponsel pintar baru.
Tidak seperti pengujian frame rate atau waktu muat tradisional, kemunculan Geekbench AI berarti kita mungkin perlu mulai memperhatikan metrik baru seperti keakuratan teks prediktif atau kinerja editor gambar AI generatif. Hal ini mencerminkan fakta bahwa teknologi AI sangat mengubah cara kita mengevaluasi kinerja perangkat.
Peluncuran Geekbench AI tidak diragukan lagi memberikan standar baru untuk evaluasi kemampuan AI perangkat. Karena semakin banyak perangkat yang mengintegrasikan fungsi AI, pentingnya alat pengujian tersebut akan semakin menonjol. Ini tidak hanya membantu konsumen lebih memahami dan membandingkan kinerja AI dari berbagai perangkat, tetapi juga memberikan indikator referensi kepada produsen perangkat keras untuk mengoptimalkan kinerja AI.
Namun, kita juga harus menyadari bahwa pengujian kinerja AI masih dalam tahap awal. Bagaimana hasil pengujian AI Geekbench dikaitkan dengan pengalaman pengguna sebenarnya, dan bagaimana mencerminkan kinerja perangkat secara akurat dalam berbagai skenario aplikasi AI, memerlukan observasi dan verifikasi lebih lanjut.
Di masa depan, kita mungkin melihat lebih banyak alat pengujian kinerja AI serupa muncul, yang akan mengevaluasi kemampuan AI perangkat dari perspektif berbeda. Tren ini juga mencerminkan bahwa teknologi AI menjadi dimensi penting dalam menilai kinerja perangkat, sama pentingnya dengan kinerja CPU dan GPU tradisional.
Secara keseluruhan, kemunculan Geekbench AI menandai semakin pentingnya evaluasi kinerja AI. Hal ini memberikan dasar referensi penting bagi konsumen dan produsen, namun juga memerlukan perbaikan dan penyempurnaan berkelanjutan agar lebih mencerminkan skenario penerapan AI sebenarnya.