Institut Penelitian Industri Cerdas (AIR) Universitas Tsinghua merilis model AI terbaru AutoDroid-V2 pada 24 Desember 2024, yang bertujuan untuk meningkatkan efisiensi kontrol otomatisasi perangkat seluler secara signifikan. Model ini secara terobosan mengadopsi metode skrip berdasarkan model bahasa kecil daripada mengandalkan model bahasa besar di cloud. Model ini secara efektif memecahkan masalah konsumsi lalu lintas yang tinggi serta risiko privasi dan keamanan yang tinggi dalam metode tradisional, sehingga meningkatkan pengalaman pengguna sekaligus mengurangi biaya operasional sisi server.
Baru-baru ini, Institut Penelitian Industri Cerdas (AIR) Universitas Tsinghua merilis model AI yang disebut AutoDroid-V2 pada 24 Desember 2024, yang bertujuan untuk mengoptimalkan kemampuan kontrol otomatisasi perangkat seluler. Model ini secara signifikan meningkatkan efisiensi operasi pengguna melalui bahasa alami melalui penerapan model bahasa kecil.
AutoDroid-V2 mengadopsi pendekatan berbasis skrip, yang berbeda dengan pendekatan tradisional yang mengandalkan model bahasa besar (LLM) di cloud. Inovasi ini memungkinkan perangkat menjalankan instruksi pengguna secara efisien dan mengurangi ketergantungan pada layanan cloud, sehingga meningkatkan privasi dan keamanan secara signifikan. Pada saat yang sama, hal ini juga mengurangi konsumsi lalu lintas sisi pengguna dan biaya pengoperasian sisi server, serta mendorong meluasnya penerapan perangkat seluler.
Dengan latar belakang proyek ini, dalam beberapa tahun terakhir, munculnya model bahasa besar dan model bahasa visual telah memungkinkan pengendalian perangkat seluler melalui perintah bahasa alami. Teknologi ini memberikan cara-cara baru untuk menyelesaikan tugas-tugas pengguna yang kompleks. Namun, pendekatan tradisional "agen GUI langkah demi langkah" memiliki masalah dengan konsumsi lalu lintas yang tinggi dan risiko keamanan privasi, sehingga penerapan skala besar menghadapi kendala.
Inovasi AutoDroid-V2 adalah dapat menghasilkan skrip multi-langkah berdasarkan instruksi pengguna untuk melakukan beberapa operasi GUI sekaligus. Metode ini sangat mengurangi frekuensi kueri, mengurangi konsumsi sumber daya, dan dapat secara langsung menghasilkan dan menjalankan skrip tugas pada perangkat pengguna. Model ini membangun dokumentasi aplikasi secara offline, meletakkan dasar untuk pembuatan skrip berikutnya.
Pada uji performa, AutoDroid-V2 melakukan uji benchmark terhadap 226 tugas pada 23 aplikasi seluler. Dibandingkan dengan model sebelumnya, seperti AutoDroid dan SeeClick, tingkat penyelesaian tugas meningkat sebesar 10,5% menjadi 51,7%. Selain itu, konsumsi token masukan dan keluarannya masing-masing dikurangi menjadi 1/43,5 dan 1/5,8, dan latensi inferensi model dikurangi menjadi 5,7 hingga 13,4 kali lipat dari aslinya. Hasil ini menunjukkan efisiensi dan keandalan AutoDroid-V2 dalam aplikasi praktis.
Highlight:
AutoDroid-V2 adalah model AI baru yang diluncurkan oleh Universitas Tsinghua yang meningkatkan efisiensi kontrol bahasa alami pada perangkat seluler.
Model ini mengurangi ketergantungan pada layanan cloud melalui model bahasa kecil dan meningkatkan privasi dan keamanan pengguna.
Tes benchmark menunjukkan bahwa AutoDroid-V2 memiliki peningkatan yang signifikan dalam tingkat penyelesaian tugas dan konsumsi sumber daya, menunjukkan potensi aplikasi yang kuat.
Secara keseluruhan, AutoDroid-V2 memberikan solusi baru untuk kontrol otomatis perangkat seluler dengan efisiensi tinggi, keamanan dan biaya rendah, menunjukkan prospek aplikasi yang besar. Perlu dinantikan pengembangannya di masa depan dan aplikasi yang lebih luas.