تقارير محرر الرموز السفلية: MiniCPM-V2.6، هذا النموذج متعدد الوسائط ذو المعلمة 8B من OpenBMB، حقق مؤخرًا نتائج مبهرة على GitHub وHugging Face، حيث تم تصنيفه بين أفضل 3، وتجاوز عدد نجوم GitHub 10000، وعدد التنزيلات تجاوز المليون! إنه يتفوق بشكل شامل على GPT-4V من حيث فهم الصورة الواحدة والصور المتعددة والفيديو، ولأول مرة يدمج الوظائف المتطورة مثل فهم الفيديو في الوقت الفعلي والفهم المشترك للصور المتعددة. إن أدائها الفعال وطريقة نشرها المريحة تجعلها مقياسًا مهمًا للحد من قدرات النموذج النهائي، الأمر الذي اجتذب اهتمامًا واسع النطاق في دائرة التكنولوجيا العالمية.
منذ صدوره، ارتفع الإصدار 2.6 الأحدث من سلسلة MiniCPM-V سريعًا إلى أعلى 3 في قوائم الاتجاه لـ GitHub وHuggingFace، المجتمعات الرائدة مفتوحة المصدر في العالم، وقد تجاوز عدد نجوم GitHub 10000. منذ ظهورها لأول مرة في 1 فبراير، تم تنزيل سلسلة MiniCPM أكثر من مليون مرة، لتصبح مقياسًا مهمًا لحدود إمكانيات النموذج من جانب العميل.
يحقق MiniCPM-V2.6 تحسينات شاملة في الأداء في فهم الصورة الفردية والصور المتعددة والفيديو من خلال معلمات 8B، متجاوزًا GPT-4V. يدمج هذا النموذج متعدد الوسائط من الجانب النهائي وظائف متطورة مثل فهم الفيديو في الوقت الفعلي، والفهم المشترك للصور المتعددة، وICL متعدد الصور لأول مرة. فهو يشغل فقط 6 جيجابايت من الذاكرة على الجانب الخلفي الكمي، وتصل سرعة الاستدلال على الجانب النهائي إلى 18 رمزًا/ثانية، وهو أسرع بنسبة 33% من طراز الجيل السابق. وهو يدعم llama.cpp وollama وvllm الاستدلال، ويدعم لغات متعددة.
وقد أثار هذا التقدم التكنولوجي استجابة حماسية في دائرة التكنولوجيا العالمية، وأظهر العديد من المطورين وأعضاء المجتمع اهتمامًا كبيرًا بإصدار MiniCPM-V2.6.
في الوقت الحالي، تم الإعلان عن عناوين GitHub وHugging Face مفتوحة المصدر لـ MiniCPM-V2.6 للجمهور، كما تم توفير روابط إلى دروس نشر llama.cpp وollama وvllm.
عنوان MiniCPM-V2.6GitHub مفتوح المصدر:
https://github.com/OpenBMB/MiniCPM-V
MiniCPM-V2.6Hugging Face عنوان مفتوح المصدر:
https://huggingface.co/openbmb/MiniCPM-V-2_6
عنوان البرنامج التعليمي للنشر llama.cpp، ollama، vllm:
https://modelbest.feishu.cn/docx/Duptdntfro2Clfx2DzuczHxAnhc
يوفر المصدر المفتوح لـ MiniCPM-V2.6 للمطورين أدوات قوية ودروس نشر ملائمة، ويُعتقد أنه سيعزز تطوير تقنية النماذج متعددة الوسائط في المستقبل ويجلب إمكانيات مبتكرة لمزيد من سيناريوهات التطبيق. سيستمر محرر Downcodes في الاهتمام بالتقدم اللاحق، لذا ترقبوا ذلك!