في مجال الذكاء الاصطناعي ، يعيد اختراق ثوري كيفية تعزيز الطريقة التي نتفاعل بها مع أجهزة الكمبيوتر. انضم Kunlun Wanwei إلى أفضل المؤسسات مثل معهد أبحاث الذكاء الاصطناعي في بكين تشايوان ، وجامعة سنغافورة نانيانغ التكنولوجية وجامعة بكين لإطلاق إطار عمل للكمبيوتر بشكل عام يسمى Cradle. يخترق إطار الذكاء الاصطناعي المبتكر هذا القيود المفروضة على الوكلاء التقليديين ، مما يسمح لهم بالتلاعب مباشرة بوحدات المفاتيح والماوس مثل البشر ، بسلاسة مع مختلف برامج المصدر المفتوح أو المغلق دون الاعتماد على أي واجهات برمجة التطبيقات الداخلية. يعد Cradle فريدًا من حيث أنه أول إطار من الذكاء الاصطناعي يمكنه التحكم في ألعاب تجارية متعددة في وقت واحد وتشغيل العديد من تطبيقات البرمجيات. حيوية جديدة.
Cradle مدهشة في التطبيقات العملية ، مما يدل على قدراتها الفائقة في العديد من أنواع الألعاب المختلفة. من إكمال المهمة الرئيسية لمدة 40 دقيقة في Red Dead 2 إلى المزارع التي تميل بدقة وتسوق في وادي Stardew ؛ . ليس ذلك فحسب ، بل يمكن أن يكون أيضًا ماهرًا في برامج Office اليومية مثل Chrome و Outlook و Feishu ، وما إلى ذلك ، ويمكنه حتى إجراء تحرير الصور المهني وتحرير الفيديو ، وتصبح حقًا مساعد AI شامل.
ينجح نجاح Cradle بفضل بنية النظام الرائعة ، التي تتكون من ستة مكونات أساسية: جمع المعلومات ، والتأمل الذاتي ، واستنتاج المهام ، وإدارة المهارات ، وتخطيط الإجراءات ، ووحدات الذاكرة. من خلال التغليف الذكي وتجريد الإدخال والإخراج الأصليين ، يتيح Cradle التفاعل الطبيعي مع الكمبيوتر. يستخدم صورة الفيديو المعروضة على الشاشة كمصدر إدخال رئيسي ، يستخرج النص والمعلومات المرئية منه لاتخاذ القرارات ، ويخرج إشارات تتحكم في لوحة المفاتيح والماوس. تجدر الإشارة بشكل خاص إلى أن وحدة اتخاذ القرارات والتفكير في Cradle يمكنها التفاعل تلقائيًا مع البرنامج وإكمال المهام ، وتعمل من خلال التفكير في الماضي ، وتلخيص الحاضر والتخطيط للمستقبل ، مما يدل على نموذج تفكير يشبه الإنسان.
في الاختبار الفعلي ، يثبت أداء Cradle تمامًا براعة. يمكنه إكمال المهام المعقدة في الألعاب ذات الأساليب المختلفة تمامًا وطرق التشغيل ، ويمكنها أيضًا أداء مهام مختلفة بسهولة في البرامج الشائعة ، مثل تنزيل الأوراق الأكاديمية ، وإرسال رسائل البريد الإلكتروني ، ومعالجة الصور ، وتحرير الفيديو ، إلخ. الأمر الأكثر وضوحًا هو أن Cradle يتفوق على طريقة خط الأساس باستخدام علامات الحقيقة في اختبار OSWorld المعياري الصعبة ، مما يدل على قدرته القوية على التعلم وقدرته على التكيف.
يمثل إطلاق Cradle خطوة مهمة في تطوير وكلاء GCC. إنه لا يعزز فقط تطوير واجهات المدخلات والإخراج الموحدة ، بل يضع أساسًا متينًا للتفاعل المستقبلي والتحسين الذاتي للعوامل في بيئات مختلفة ، ولكنه يتخذ أيضًا خطوة حاسمة لتحقيق هدف الذكاء الاصطناعي العام (AGI). من المحتمل أن تحدث ولادة هذا الإطار المبتكر ثورة في الطريقة التي نتفاعل بها مع أجهزة الكمبيوتر ونفتح عصرًا جديدًا من تعاون الإنسان والحاسوب.
Project Homepage: https://baai-agents.github.io/cradle
رابط الرمز: https://github.com/baai-agents/cradle