أصدر معهد الإمارات للإبتكار التكنولوجي (TII) جيلاً جديداً من سلسلة نماذج Falcon3 مفتوحة المصدر صغيرة الحجم، والتي تتضمن أربعة نماذج بأحجام مختلفة وتوفر نسختين مختلفتين: الإصدار الأساسي وإصدار الأوامر. تحقق هذه السلسلة من النماذج أداءً جيدًا في تصنيفات Hugging Face، حيث تتفوق في الأداء على النماذج مفتوحة المصدر من نفس الحجم، بل وتتفوق أيضًا على المنافسين مثل Google وMeta وAlibaba في اختبارات قياس الأداء المتعددة. تتميز سلسلة Falcon3 بالكفاءة ومنخفضة التكلفة، وهي مناسبة بشكل خاص للأجهزة وسيناريوهات التطبيقات ذات موارد الحوسبة المحدودة، مثل خدمة العملاء والرعاية الصحية وإنترنت الأشياء. بيانات التدريب الخاصة بها كبيرة الحجم وتستخدم بنية وآليات متقدمة لتقليل استخدام الذاكرة وتحسين كفاءة الاستدلال. كما يوفر معهد دراسات الترجمة بيئة اختبار Falcon Playground لتسهيل تجربة المطورين والباحثين لها.
ملاحظة لمصدر الصورة: يتم إنشاء الصورة بواسطة الذكاء الاصطناعي وموفر خدمة ترخيص الصورة Midjourney
تصدّر أداء Falcon 3 تصنيفات Hugging Face، متفوقًا على النماذج مفتوحة المصدر من نفس الحجم، مثل Meta's Llama وQwen-2.5. على وجه الخصوص، أظهرت الإصدارات 7B و10B مزايا تقنية رائدة في سرعة التفكير، وفهم اللغة، وتنفيذ التعليمات، ومهام التعليمات البرمجية والرياضيات، بل وتجاوزت المنافسين مثل Google، وMeta، وAlibaba في اختبارات قياس الأداء المتعددة.
بالمقارنة مع نماذج اللغات الكبيرة التقليدية (LLM)، تتمتع نماذج SLM بمزايا الكفاءة العالية والتكلفة المنخفضة نظرًا لمعلماتها الأقل وتصميمها الأبسط، وهي مناسبة بشكل خاص للتطبيقات في خدمة العملاء والرعاية الصحية وإنترنت الأشياء وغيرها من المجالات. وفقًا لشركة أبحاث السوق Values Reports، من المتوقع أن ينمو سوق الإدارة المستدامة للأراضي (SLM) بمعدل سنوي متوسط قدره 18٪ خلال السنوات الخمس المقبلة.
يصل حجم بيانات التدريب لسلسلة Falcon3 إلى 14 تريليون رمز، وهو أكثر من ضعف نظيره في سلسلة Falcon2. تعتمد هذه السلسلة بنية وحدة فك التشفير فقط وآلية انتباه الاستعلام المجمعة لتقليل استخدام الذاكرة مع تحسين كفاءة الاستدلال. يدعم Falcon3 أربع لغات، بما في ذلك الإنجليزية والفرنسية والإسبانية والبرتغالية، وهو مزود بنافذة سياق بحجم 32 كيلو بايت يمكنها التعامل مع نص الإدخال الطويل وتلبية احتياجات الصناعات المختلفة.
قال TII إن النموذج الأساسي لـ Falcon3 مناسب للمهام ذات الأغراض العامة، في حين تم تحسين إصدار الأوامر لمهام المحادثة مثل خدمة العملاء والمساعدين الافتراضيين. سيؤدي إطلاق هذه السلسلة إلى تعزيز تطوير الحوسبة المتطورة والتطبيقات الحساسة للخصوصية، ودعم السيناريوهات مثل التوصيات الشخصية، وتحليل البيانات، والتشخيص الطبي، وتحسين سلسلة التوريد.
يتم إصدار جميع طرز Falcon3 بموجب ترخيص TII Falcon 2.0، وهو ترخيص متساهل يعتمد على Apache 2.0 الذي يدعم تطوير ونشر الذكاء الاصطناعي المسؤول. ولمساعدة المطورين والباحثين على البدء، أطلق معهد دراسات الترجمة أيضًا بيئة اختبار Falcon Playground، حيث يمكن للمستخدمين تجربة هذه النماذج قبل دمجها.
يعمل الإصدار مفتوح المصدر لسلسلة Falcon3 على خفض عتبة تطبيق تكنولوجيا الذكاء الاصطناعي، ويوفر للمطورين والباحثين أدوات قوية، ويسرع تطبيق وابتكار تكنولوجيا الذكاء الاصطناعي في مختلف المجالات، ويبشر بالاتجاه نحو مزيد من تعميم تكنولوجيا الذكاء الاصطناعي وإضفاء الطابع الديمقراطي عليها.