أصدرت Zhipu AI مؤخرًا منتجًا جديدًا يعتمد على تقنية GLM ، AutogLM ، وهي هيئة ذكية يمكنها محاكاة التشغيل البشري للهواتف المحمولة وأداء مهام يومية مختلفة. يمثل ظهور AutogLM اختراقًا كبيرًا في مجال تطبيقات الهاتف المحمول. حياة. . يشبه منطق التشغيل الخاص به لمنطق البشر ، دون عمليات معقدة ، وعتبة الاستخدام منخفضة للغاية.
يمكن لـ AutogLM أداء مجموعة متنوعة من المهام ، مثل مثل لحظات WeChat والتعليق عليها ، وشراء منتجات الطلبات التاريخية على Taobao ، وحجز الفنادق على CTRIP ، وشراء تذاكر القطار في 12306 ، وطلب الوجبات السريعة على Meituan ، إلخ. لا تقتصر سيناريوهات التطبيق على هذا الأمر.
يمكن للمستخدمين حاليًا تجربة AutogLM-Web عن طريق تثبيت المكون الإضافي "Zhipu Qingyan" ، وهو مساعد متصفح يمكنه محاكاة المستخدمين الذين يزورون صفحات الويب ، والنقر فوق صفحات الويب ، وإكمال البحث المتقدم والملخص وتوليد المحتوى تلقائيًا على الموقع الإلكتروني. بالإضافة إلى ذلك ، فتحت AutOGLM أيضًا طلبًا للاختبار الداخلي على أنظمة Android وقامت بالتعاون المتعمق مع الشركات المصنعة للهواتف المحمولة مثل Honor.
تعتمد تقنية AutOGLM على "الوكيل الأساسي للواجهة الوسيطة" و "الإطار التعليمي عبر الإنترنت" ، الذي يحل القدرة على التعلم ، ومهام التدريب ، وندرة البيانات في تخطيط المهام النموذجية وتنفيذ العمل. مشاكل مثل إشارات التغذية المرتدة المتفرقة وانجراف توزيع الإستراتيجية. يمكن لـ AutogLM تحسين نفسها بشكل مستمر وتحسين أدائها بشكل مستمر بشكل مطرد ، على غرار الأشخاص الذين يحصلون باستمرار على مهارات جديدة أثناء نموهم.
فيما يتعلق بالتحديات التقنية ، يحل AutOGLM مشكلة "تنفيذ الإجراء" غير الكافي وغير كاف "تخطيط المهام". من خلال تصميم "الواجهة الوسيطة الوسيطة الأساسية" ، فإنه يتفوق على مرحلتين من "تخطيط المهام" و "تنفيذ الإجراء" من خلال الواجهة الوسيطة اللغوية الطبيعية ، مما يحقق تحسنا كبيرا في إمكانات الوكيل. في الوقت نفسه ، تتبنى AutOGLM "إطار تعلم تعزيز الدورة التدريبية على الإنترنت" لتعلم وتحسين إمكانيات وكلاء الطراز الكبير في بيئات الويب والهاتف في بيئات حقيقية عبر الإنترنت.
حقق AutOGLM تحسينات كبيرة في الأداء على كل من استخدام الهاتف واستخدام متصفح الويب ، وتجاوز أداء GPT-4O و Claude-3.5-Sonnet في معايير تقييم Androidlab. في معيار تقييم Webarena-Lite ، حقق AutogLM حوالي 200 ٪ من تحسين الأداء مقارنة بـ GPT-4O ، مما أدى إلى تضييق الفجوة في معدل النجاح بين البشر وعوامل النماذج الكبيرة في معالجة واجهة المستخدم الرسومية.
عنوان المشروع: https://xiao9905.github.io/autoglm
من خلال وظائفها القوية والابتكار التكنولوجي ، أظهرت AutogLM الإمكانات الهائلة للذكاء الاصطناعي في مجال تشغيل الهاتف المحمول ، مما يجلب المزيد من الراحة لحياة الناس اليومية. يثبت أدائها الممتاز في اختبار الأداء قوتها التقنية. في المستقبل ، مع التقدم المستمر للتكنولوجيا ، من المتوقع أن يحقق AutOGLM تطبيقات أوسع ويخلق قيمة أكبر للمستخدمين.