أصدر فريق Hugging Face نموذجين من الذكاء الاصطناعي خفيفة الوزن: SMOLVLM-256M و SMOLVLM-500M ، مع معايير 256 مليون و 500 مليون على التوالي. هذان النموذجان مناسبان بشكل خاص للأجهزة التي تحتوي على أقل من 1 جيجابايت من الذاكرة ، مما يوفر للمطورين حلول معالجة البيانات منخفضة التكلفة وعالية الكفاءة. يتجاوز أدائها الفعال العديد من النماذج الكبيرة في المعايير المختلفة ، وخاصة في التعامل مع مخططات علوم المدارس الابتدائية ، مما يدل على إمكاناتها الهائلة في التعليم والبحث.
في الآونة الأخيرة ، أصدر فريق Hugging Face ، وهو منصة لتطوير الذكاء الاصطناعي ، نموذجين جديدين من الذكاء الاصطناعي ، SMOLVLM-256M و SMOLVLM-500M. يزعمون بثقة أن النموذجين هما إلى حد بعيد أصغر نماذج الذكاء الاصطناعى القادرة على معالجة الصور ومقاطع الفيديو القصيرة والبيانات النصية في وقت واحد ، وخاصة مناسبة للأجهزة التي تحتوي على أقل من 1 جيجابايت من الذاكرة ، مثل أجهزة الكمبيوتر المحمولة. يتيح هذا الابتكار للمطورين تحقيق كفاءة أعلى بتكلفة أقل عند معالجة كميات كبيرة من البيانات.
تبلغ معايير هذين النموذجين 256 مليون و 500 مليون ، مما يعني أن قدرتها على حل المشكلات قد تحسنت أيضًا وفقًا لذلك. تتضمن المهام التي يمكن لسلسلة SMOLVLM تنفيذها وصف الصور أو مقاطع الفيديو ، والإجابة على الأسئلة حول مستندات PDF ومحتواها ، مثل مسح النص والرسوم البيانية. هذا يجعلهم لديهم مجموعة واسعة من آفاق التطبيق في العديد من المجالات مثل التعليم والبحث.
أثناء تدريب النموذج ، استفاد فريق Hugging Face على 50 مجموعة بيانات عالية الجودة ونصًا تسمى "The Cauldron" ، بالإضافة إلى عمليات مسح الملفات ومجموعات بيانات الاقتران التفصيلية التي تسمى DocMatix. تم تطوير كلتا المجموعتين من خلال Hugging Face's M4 وركزت على تطوير تقنية AI متعددة الوسائط. تجدر الإشارة إلى أن SMOLVLM-256M و SMOLVLM-500M يتفوق على العديد من النماذج الأكبر في الاختبارات القياسية المختلفة ، مثل IDEFICS80B ، وخاصة في اختبارات AI2D ، تؤدي بشكل كبير في القدرة على تحليل المخططات العلمية لطلاب المدارس الابتدائية.
ومع ذلك ، على الرغم من أن النماذج الصغيرة بأسعار معقولة وتنوعية ، فقد لا تؤدي النماذج الكبيرة بالإضافة إلى نماذج كبيرة على مهام الاستدلال المعقدة. أظهرت دراسة من Google DeepMind ومعهد Microsoft Research ومعهد ميلا في كيبيك أن العديد من النماذج الصغيرة كانت تؤدي بشكل مخيب للآمال على هذه المهام المعقدة. يتكهن الباحثون بأن هذا قد يكون بسبب ميل النماذج الصغيرة إلى تحديد السمات السطحية للبيانات ، ويبدو أنها عديمي الضمير عند تطبيق هذه المعرفة في المواقف الجديدة.
عانق عائلة SmolvLM من النماذج ليست فقط أدوات صغيرة من الذكاء الاصطناعي ، ولكنها تُظهر أيضًا قدرات رائعة عند التعامل مع مختلف المهام. هذا بلا شك خيار جيد للمطورين الذين يرغبون في تحقيق معالجة بيانات فعالة بتكلفة منخفضة.
جلب ظهور سلسلة النماذج SMOLVLM إمكانيات جديدة لتطبيقات الذكاء الاصطناعى الخفيف. على الرغم من أنه لا يزال هناك مجال للتحسين في المهام المعقدة ، إلا أن عتبةها المنخفضة والكفاءة العالية تجعل من الخيار أن يستحق العديد من المطورين الاهتمام. في المستقبل ، نتطلع إلى رؤية التطبيق ومزيد من التحسين لنماذج سلسلة SMOLVLM في المزيد من الحقول.