أصدر معهد الإمارات للإبداع التكنولوجي (TII) جيلاً جديدًا من سلسلة نماذج Falcon3 مفتوحة المصدر الصغيرة، بما في ذلك أربعة نماذج بأحجام مختلفة (1B، 3B، 7B و10B)، وتوفير نسختين مختلفتين: الإصدار الأساسي وإصدار التعليمات. يهدف هذا الإصدار إلى خفض عتبة استخدام تقنية الذكاء الاصطناعي وتزويد المطورين والباحثين والمؤسسات بحلول الذكاء الاصطناعي الفعالة والاقتصادية. كان أداء Falcon3 جيدًا في تصنيفات Hugging Face، حيث تجاوز النماذج مفتوحة المصدر من نفس الحجم، وتفوق على منتجات من عمالقة مثل Google وMeta وAlibaba في اختبارات قياس الأداء المتعددة، مما يعكس سرعة الاستدلال وفهم اللغة وتنفيذ التعليمات في مجالات أخرى وجوه.
ملاحظة لمصدر الصورة: يتم إنشاء الصورة بواسطة الذكاء الاصطناعي وموفر خدمة ترخيص الصورة Midjourney
تصدّر أداء Falcon 3 تصنيفات Hugging Face، متفوقًا على النماذج مفتوحة المصدر من نفس الحجم، مثل Meta's Llama وQwen-2.5. على وجه الخصوص، أظهرت الإصدارات 7B و10B مزايا تقنية رائدة في سرعة التفكير، وفهم اللغة، وتنفيذ التعليمات، ومهام التعليمات البرمجية والرياضيات، بل وتجاوزت المنافسين مثل Google، وMeta، وAlibaba في اختبارات قياس الأداء المتعددة.
بالمقارنة مع نماذج اللغات الكبيرة التقليدية (LLM)، تتمتع نماذج SLM بمزايا الكفاءة العالية والتكلفة المنخفضة نظرًا لمعلماتها الأقل وتصميمها الأبسط، وهي مناسبة بشكل خاص للتطبيقات في خدمة العملاء والرعاية الصحية وإنترنت الأشياء وغيرها من المجالات. ومن المتوقع أن ينمو سوق الإدارة المستدامة للأراضي (SLM) بمعدل سنوي متوسط قدره 18% خلال السنوات الخمس المقبلة، وفقًا لشركة أبحاث السوق Values Reports.
يصل حجم بيانات التدريب لسلسلة Falcon3 إلى 14 تريليون رمز، وهو أكثر من ضعف نظيره في سلسلة Falcon2. تعتمد السلسلة بنية وحدة فك التشفير فقط وآلية انتباه الاستعلام المجمعة لتقليل استخدام الذاكرة مع تحسين كفاءة الاستدلال. يدعم Falcon3 أربع لغات، بما في ذلك الإنجليزية والفرنسية والإسبانية والبرتغالية، وهو مزود بنافذة سياق بحجم 32 كيلو بايت يمكنها التعامل مع نص الإدخال الطويل وتلبية احتياجات الصناعات المختلفة.
قال TII إن النموذج الأساسي لـ Falcon3 مناسب للمهام ذات الأغراض العامة، في حين تم تحسين إصدار الأوامر لمهام المحادثة مثل خدمة العملاء والمساعدين الافتراضيين. سيؤدي إطلاق هذه السلسلة إلى تعزيز تطوير الحوسبة المتطورة والتطبيقات الحساسة للخصوصية، ودعم السيناريوهات مثل التوصيات الشخصية، وتحليل البيانات، والتشخيص الطبي، وتحسين سلسلة التوريد.
يتم إصدار جميع طرز Falcon3 بموجب ترخيص TII Falcon 2.0، وهو ترخيص متساهل يعتمد على Apache 2.0 الذي يدعم تطوير ونشر الذكاء الاصطناعي المسؤول. ولمساعدة المطورين والباحثين على البدء، أطلق معهد دراسات الترجمة أيضًا بيئة اختبار Falcon Playground، حيث يمكن للمستخدمين تجربة هذه النماذج قبل دمجها.
إن ميزات المصدر المفتوح والأداء الفعال لسلسلة Falcon3 تجعلها خيارًا مثاليًا لتطبيقات الذكاء الاصطناعي خفيفة الوزن، ومن المتوقع أن تعمل على تسريع تعميم تكنولوجيا الذكاء الاصطناعي وتطبيقها في مختلف المجالات وتعزيز المزيد من ديمقراطية تكنولوجيا الذكاء الاصطناعي. كما يشير أدائها الممتاز الذي يفوق المنافسين في اختبارات قياس الأداء المتعددة إلى أن نماذج اللغات الصغيرة تتمتع بإمكانات كبيرة للتطوير المستقبلي.