أفاد محرر Downcodes: تعاونت Baichuan Intelligence مع جامعة Tianjin لتطوير إطار عمل وكيل يسمى Sibyl System، والذي فاز بالمركز الأول في تقييم GAIA Leader Board الذي تم إطلاقه بشكل مشترك بواسطة Meta وHuggingface وAutoGPT. يركز تقييم GAIA على تقييم قدرات التنفيذ للوكيل وتصميم الحلول في المهام المعقدة، وهو يختبر الأسئلة الأقرب إلى سيناريوهات التطبيق في العالم الحقيقي ويطرح تحديات كبيرة للغاية لنماذج الذكاء الاصطناعي. ويمثل هذا الإنجاز طفرة كبيرة في تكنولوجيا الذكاء الاصطناعي الصينية في مجال معالجة المهام المعقدة.
تعاونت شركة Baichuan Intelligence مع جامعة Tianjin لإطلاق إطار عمل الوكيل الذكي لنظام Sibyl وحصلت على المركز الأول في مجلس قادة GAIA. GAIA هو مخطط تقييم جديد اقترحته Meta وHuggingface وAutoGPT في نوفمبر 2023. وهو يقيم بشكل أساسي قدرات الوكيل وحلوله في تنفيذ المهام المعقدة. تكشف خطة التقييم هذه عن أوجه القصور في قدرة النماذج الحالية وتوفر توجيهات التحسين لتطوير النموذج والوكيل.
تعد أسئلة اختبار GAIA أقرب إلى العالم الحقيقي وتتطلب أن يتمتع الذكاء الاصطناعي بالاستدلال والفهم متعدد الوسائط (النص والصور والصوت/الفيديو)، وتصفح الويب وقدرات استخدام الأدوات. ليس من الصعب على البشر فهم هذه الأسئلة، ولكنها تمثل تحديًا كبيرًا للنماذج. على سبيل المثال، كان معدل نجاح GPT-4 في الاختبار 15% فقط، في حين تمكن القائمون على التجارب البشرية من تحقيق 92%. غالبًا ما يتطلب إكمال هذه المسائل روابط منطقية طويلة ووقتًا، بما في ذلك خطوات وأدوات متعددة.
تتضمن ميزات التصميم لإطار نظام العرافة ما يلي:
إنشاء تحسين البحث عن واجهة المتصفح البديلة الشبيهة بالإنسان.
يحل سؤال وجواب محل الحوار، وذلك باستخدام وظائف الأسئلة والأجوبة عديمة الحالة لتبسيط بنية النظام.
استخدم أداتين شائعتين فقط، متصفح الويب وبيئة Python، لتقليل الاعتماد على الأدوات المتخصصة.
من System1 إلى System2، تم تقديم آلية "هيئة المحلفين" لإجراء النقد الذاتي والتصحيح من خلال مناقشة متعددة الوكلاء، واستخدام المعلومات في مساحة العمل العالمية لتحسين دقة الاستجابات.
نظام العرافة هو إطار عمل وكيل بسيط ولكنه قوي يعتمد على نماذج لغوية كبيرة يمكنها حل مشكلات التفكير المعقدة باستخدام عدد صغير من الأدوات. إنه يقلل من تعقيد النظام من خلال تقديم آليات مساحة العمل العالمية والوكلاء المتعددين، بالإضافة إلى قنوات الحصول على المعلومات العالمية القائمة على المتصفح، مع توسيع تعقيد حل المشكلات وتحقيق تحول النموذج من تغيير "التفكير السريع" إلى "التفكير البطيء". . يتمتع نظام Sibyl أيضًا بقابلية تطوير جيدة وتصحيح أخطاء سهل، ويمكنه بسهولة استبدال وحدات الوكيل للنماذج الأخرى وتحسين قدرات النموذج.
التقرير الفني: https://arxiv.org/pdf/2407.10718
لا يوضح نجاح إطار عمل نظام العرافة القوة القوية لشركة Baichuan Intelligence وجامعة تيانجين في مجال الذكاء الاصطناعي فحسب، بل يوفر أيضًا خبرة ومرجعًا قيمًا لتصميم وتطوير أطر عمل الوكيل الذكي المستقبلية. أعتقد أننا سنرى في المستقبل القريب المزيد من التطبيقات المبتكرة المستندة إلى إطار عمل نظام العرافة، مما يعزز تطوير تكنولوجيا الذكاء الاصطناعي إلى مستوى أعمق.