สถาบันวิจัยอุตสาหกรรมอัจฉริยะ (AIR) แห่งมหาวิทยาลัยชิงหัวเปิดตัว AutoDroid-V2 โมเดล AI ล่าสุดเมื่อวันที่ 24 ธันวาคม 2567 โดยมีเป้าหมายเพื่อปรับปรุงประสิทธิภาพการควบคุมอัตโนมัติของอุปกรณ์เคลื่อนที่อย่างมีนัยสำคัญ โมเดลนี้ใช้วิธีการเขียนสคริปต์โดยใช้โมเดลภาษาขนาดเล็กอย่างล้ำหน้า แทนที่จะอาศัยโมเดลภาษาขนาดใหญ่ในระบบคลาวด์ โดยสามารถแก้ปัญหาปริมาณการรับส่งข้อมูลที่สูงและความเสี่ยงด้านความเป็นส่วนตัวและความปลอดภัยสูงในวิธีการแบบเดิมได้อย่างมีประสิทธิภาพ ซึ่งจะช่วยปรับปรุงประสบการณ์ผู้ใช้ไปพร้อมๆ กับการลดลง ต้นทุนการทำงานฝั่งเซิร์ฟเวอร์
เมื่อเร็วๆ นี้ สถาบันวิจัยอุตสาหกรรมอัจฉริยะ (AIR) แห่งมหาวิทยาลัยซิงหัวได้เปิดตัวโมเดล AI ชื่อ AutoDroid-V2 เมื่อวันที่ 24 ธันวาคม 2567 โดยมีเป้าหมายเพื่อเพิ่มขีดความสามารถในการควบคุมอัตโนมัติของอุปกรณ์เคลื่อนที่ โมเดลนี้ปรับปรุงประสิทธิภาพการดำเนินงานของผู้ใช้อย่างมีนัยสำคัญผ่านภาษาธรรมชาติผ่านการประยุกต์ใช้โมเดลภาษาขนาดเล็ก
AutoDroid-V2 ใช้วิธีการแบบอิงสคริปต์ ซึ่งแตกต่างจากวิธีการแบบเดิมที่ใช้โมเดลภาษาขนาดใหญ่ (LLM) ในระบบคลาวด์ นวัตกรรมนี้ช่วยให้อุปกรณ์ดำเนินการตามคำสั่งของผู้ใช้ได้อย่างมีประสิทธิภาพ และลดการพึ่งพาบริการคลาวด์ จึงช่วยปรับปรุงความเป็นส่วนตัวและความปลอดภัยได้อย่างมาก ในขณะเดียวกัน ยังช่วยลดปริมาณการรับส่งข้อมูลฝั่งผู้ใช้และต้นทุนการดำเนินงานฝั่งเซิร์ฟเวอร์ และส่งเสริมการใช้งานอุปกรณ์มือถือในวงกว้าง
เบื้องหลังของโครงการในช่วงไม่กี่ปีที่ผ่านมา การเพิ่มขึ้นของโมเดลภาษาขนาดใหญ่และโมเดลภาษาภาพทำให้สามารถควบคุมอุปกรณ์เคลื่อนที่ผ่านคำสั่งภาษาธรรมชาติได้ เทคโนโลยีเหล่านี้มอบวิธีใหม่ในการแก้ปัญหางานที่ซับซ้อนของผู้ใช้ อย่างไรก็ตาม วิธีการ "เอเจนต์ GUI ทีละขั้นตอน" แบบดั้งเดิมมีปัญหากับปริมาณการรับส่งข้อมูลที่สูงและความเสี่ยงด้านความปลอดภัยของความเป็นส่วนตัว ทำให้การใช้งานในวงกว้างต้องเผชิญกับอุปสรรค
นวัตกรรมของ AutoDroid-V2 คือสามารถสร้างสคริปต์หลายขั้นตอนตามคำแนะนำของผู้ใช้เพื่อดำเนินการ GUI หลายรายการพร้อมกัน วิธีการนี้จะช่วยลดความถี่ในการสืบค้นอย่างมาก ลดการใช้ทรัพยากร และสามารถสร้างและรันสคริปต์งานบนอุปกรณ์ของผู้ใช้ได้โดยตรง โมเดลนี้สร้างเอกสารแอปพลิเคชันแบบออฟไลน์ ซึ่งเป็นการวางรากฐานสำหรับการสร้างสคริปต์ในภายหลัง
ในการทดสอบประสิทธิภาพ AutoDroid-V2 ได้ทำการทดสอบเกณฑ์มาตรฐานของงาน 226 งานบนแอปพลิเคชันมือถือ 23 รายการ เมื่อเทียบกับรุ่นก่อนหน้า เช่น AutoDroid และ SeeClick อัตราความสำเร็จของงานเพิ่มขึ้น 10.5% เป็น 51.7% นอกจากนี้ การใช้โทเค็นอินพุตและเอาต์พุตจะลดลงเหลือ 1/43.5 และ 1/5.8 ตามลำดับ และเวลาแฝงในการอนุมานโมเดลลดลงเหลือ 5.7 ถึง 13.4 เท่าของรุ่นดั้งเดิม ผลลัพธ์เหล่านี้แสดงให้เห็นถึงประสิทธิภาพและความน่าเชื่อถือของ AutoDroid-V2 ในการใช้งานจริง
ไฮไลท์:
AutoDroid-V2 เป็นโมเดล AI ใหม่ที่เปิดตัวโดยมหาวิทยาลัย Tsinghua ซึ่งช่วยปรับปรุงประสิทธิภาพของการควบคุมภาษาธรรมชาติของอุปกรณ์มือถือ
โมเดลนี้ลดการพึ่งพาบริการคลาวด์ผ่านโมเดลภาษาขนาดเล็ก และปรับปรุงความเป็นส่วนตัวและความปลอดภัยของผู้ใช้
การทดสอบเกณฑ์มาตรฐานแสดงให้เห็นว่า AutoDroid-V2 มีการปรับปรุงอัตราความสำเร็จของงานและการใช้ทรัพยากรอย่างมีนัยสำคัญ ซึ่งแสดงให้เห็นถึงศักยภาพการใช้งานที่แข็งแกร่ง
โดยรวมแล้ว AutoDroid-V2 มอบโซลูชันใหม่สำหรับการควบคุมอุปกรณ์มือถือแบบอัตโนมัติที่มีประสิทธิภาพสูง ปลอดภัย และต้นทุนต่ำ ซึ่งแสดงให้เห็นถึงโอกาสในการใช้งานจำนวนมาก คุ้มค่าที่จะรอคอยการพัฒนาในอนาคตและการใช้งานที่กว้างขึ้น