أصدر معهد أبحاث الصناعة الذكية بجامعة تسينغهوا (AIR) أحدث نموذج للذكاء الاصطناعي AutoDroid-V2 في 24 ديسمبر 2024، بهدف تحسين كفاءة التحكم الآلي للأجهزة المحمولة بشكل كبير. يعتمد هذا النموذج بشكل كبير على طريقة نصية تعتمد على نموذج لغة صغير بدلاً من الاعتماد على نموذج لغة كبير في السحابة، وهو يحل بشكل فعال مشاكل الاستهلاك العالي لحركة المرور ومخاطر الخصوصية والأمن العالية في الطرق التقليدية، وبالتالي تحسين تجربة المستخدم مع تقليلها تكاليف التشغيل من جانب الخادم.
في الآونة الأخيرة، أصدر معهد أبحاث الصناعة الذكية بجامعة تسينغهوا (AIR) نموذجًا للذكاء الاصطناعي يسمى AutoDroid-V2 في 24 ديسمبر 2024، بهدف تحسين قدرات التحكم الآلي للأجهزة المحمولة. يعمل هذا النموذج على تحسين كفاءة عمليات المستخدمين بشكل كبير من خلال اللغة الطبيعية من خلال تطبيق نماذج اللغة الصغيرة.
يعتمد AutoDroid-V2 نهجًا قائمًا على البرنامج النصي، وهو يختلف عن النهج التقليدي الذي يعتمد على نماذج اللغات الكبيرة (LLM) في السحابة. يتيح هذا الابتكار للجهاز تنفيذ تعليمات المستخدم بكفاءة وتقليل الاعتماد على الخدمات السحابية، وبالتالي تحسين الخصوصية والأمان بشكل كبير. وفي الوقت نفسه، فإنه يقلل أيضًا من استهلاك حركة المرور من جانب المستخدم وتكاليف التشغيل من جانب الخادم، ويعزز تطبيق الأجهزة المحمولة على نطاق واسع.
على خلفية المشروع، في السنوات الأخيرة، أدى ظهور نماذج اللغة الكبيرة ونماذج اللغة المرئية إلى تمكين التحكم في الأجهزة المحمولة من خلال أوامر اللغة الطبيعية. توفر هذه التقنيات طرقًا جديدة لحل مهام المستخدم المعقدة. ومع ذلك، فإن النهج التقليدي "وكيل واجهة المستخدم الرسومية خطوة بخطوة" يواجه مشكلات تتعلق باستهلاك حركة المرور المرتفع ومخاطر أمن الخصوصية، مما يجعل النشر على نطاق واسع يواجه عقبات.
يتمثل ابتكار AutoDroid-V2 في أنه يمكنه إنشاء نصوص برمجية متعددة الخطوات بناءً على تعليمات المستخدم لتنفيذ عمليات واجهة المستخدم الرسومية المتعددة في وقت واحد. تعمل هذه الطريقة على تقليل تكرار الاستعلام بشكل كبير، وتقليل استهلاك الموارد، ويمكنها إنشاء وتنفيذ البرامج النصية للمهام مباشرة على جهاز المستخدم. يقوم هذا النموذج بإنشاء وثائق التطبيق دون الاتصال بالإنترنت، مما يضع الأساس لإنشاء البرنامج النصي اللاحق.
في اختبار الأداء، أجرى AutoDroid-V2 اختبارًا قياسيًا لـ 226 مهمة على 23 تطبيقًا للهاتف المحمول. وبالمقارنة مع النماذج السابقة، مثل AutoDroid وSeeClick، زاد معدل إكمال المهام بنسبة 10.5% إلى 51.7%. بالإضافة إلى ذلك، تم تقليل استهلاك رمز الإدخال والإخراج إلى 1/43.5 و1/5.8 على التوالي، وتم تقليل زمن الوصول للاستدلال النموذجي إلى 5.7 إلى 13.4 مرة من الأصل. تظهر هذه النتائج كفاءة وموثوقية AutoDroid-V2 في التطبيقات العملية.
أبرز النقاط:
AutoDroid-V2 هو نموذج جديد للذكاء الاصطناعي أطلقته جامعة تسينغهوا ويعمل على تحسين كفاءة التحكم في اللغة الطبيعية للأجهزة المحمولة.
يقلل هذا النموذج من الاعتماد على الخدمات السحابية من خلال نماذج اللغات الصغيرة ويعزز خصوصية المستخدم وأمانه.
تظهر الاختبارات المعيارية أن AutoDroid-V2 يتمتع بتحسينات كبيرة في معدل إكمال المهام واستهلاك الموارد، مما يدل على إمكانات التطبيق القوية.
بشكل عام، يوفر AutoDroid-V2 حلاً جديدًا للتحكم الآلي في الأجهزة المحمولة بكفاءته العالية وسلامته وتكلفته المنخفضة، مما يُظهر آفاق تطبيقه الضخمة، وهو أمر يستحق التطلع إلى تطوره المستقبلي وتطبيقاته الأوسع.