أطلقت Hugging Face نموذج لغة مضغوط جديد ، SMOLLM2 ، وهو اختراق مثير. يحتوي SMOLLM2 على ثلاثة إصدارات مختلفة لحجم المعلمة توفر أداءً قويًا حتى على الأجهزة المقيدة للموارد ، والتي لها أهمية كبيرة لتطبيقات الحوسبة والتطبيقات المحمولة. يتفوق في معايير متعددة ، متجاوزة نماذج مماثلة ، مما يدل على مزاياه في التفكير العلمي ومهام الحس السليم. كما أن ترخيص SMOLLM2 مفتوح المصدر وترخيص Apache 2.0 يسهل الوصول إليه والتطبيق.
تم إصدار Hugging Face اليوم SMOLLM2 ، وهي مجموعة جديدة من نماذج اللغة المدمجة التي تحقق أداءً مثيرًا للإعجاب مع طلب موارد حوسبة أقل بكثير من النماذج الكبيرة. يتم إصدار النموذج الجديد بموجب ترخيص Apache 2.0 ويأتي بثلاثة أحجام - معلمات 135 مترًا و 360 مترًا و 1.7 ب - مناسبة للنشر على الهواتف الذكية وأجهزة الحافة الأخرى ذات القدرة المحدودة للمعالجة والذاكرة.
يتفوق نموذج SMOLLM2-1B على نموذج META LLAMA1B في العديد من المعايير الرئيسية ، وخاصة في التفكير العلمي ومهام الحس السليم. يتفوق هذا النموذج على نماذج منافسة كبيرة على معظم المعايير المعرفية ، باستخدام مجموعة متنوعة من مجموعات البيانات بما في ذلك FineWeb-EDU ومجموعات البيانات الرياضية والترميز المتخصصة.
يأتي إطلاق SMOLLM2 في لحظة حرجة عندما تكافح صناعة الذكاء الاصطناعى من أجل التعامل مع الحوسبة التي تحتاج إلى تشغيل نماذج لغة كبيرة (LLMS). في حين تستمر شركات مثل Openai والأنثروبور في دفع حدود حجم النموذج ، هناك اعتراف متزايد بالحاجة إلى الذكاء الاصطناعي الخفيف الخفيف التي يمكن أن تعمل محليًا على الأجهزة.
يوفر SMOLLM2 نهجًا مختلفًا لجلب إمكانيات AI قوية مباشرة إلى الأجهزة الشخصية ، مشيرًا إلى المستقبل حيث يمكن لمزيد من المستخدمين والشركات استخدام أدوات AI المتقدمة ، وليس فقط عمالقة التكنولوجيا مع مراكز بيانات ضخمة. تدعم هذه النماذج مجموعة من التطبيقات ، بما في ذلك إعادة كتابة النصوص ، والملخص ، ومكالمات الوظائف ، المناسبة للنشر في السيناريوهات التي تجعل قيود الخصوصية أو الكمون أو الاتصال حلول AI المستندة إلى مجموعة النظراء.
في حين أن هذه النماذج الأصغر لا تزال لديها قيود ، فإنها تمثل جزءًا من اتجاه واسع في نماذج الذكاء الاصطناعى الأكثر كفاءة. يوضح إصدار SMOLLM2 أن مستقبل الذكاء الاصطناعي قد لا ينتمي فقط إلى نماذج أكبر ، ولكن إلى بنيات أكثر كفاءة يمكن أن توفر أداءً قويًا بموارد أقل.
لقد فتح ظهور SMOLLM2 إمكانيات جديدة لتطبيقات الذكاء الاصطناعي الخفيف ، مما يشير إلى أن تقنية الذكاء الاصطناعى ستستخدم على نطاق أوسع في مختلف الأجهزة والسيناريوهات ، مما يجعل المستخدمين تجربة أكثر ملاءمة وفعالية. كما عززت ميزات المصادر المفتوحة المزيد من التطوير والابتكار لمجتمع الذكاء الاصطناعي. في المستقبل ، من المتوقع أن نرى نماذج منظمة العفو الدولية أكثر كفاءة وضغوط ناشئة ، مما يعزز تعميم تقنيات الذكاء الاصطناعي والتقدم.