أطلق فريق OpenCompass التابع لمختبر شنغهاي للذكاء الاصطناعي Sinan وModelScope بشكل مشترك تحديثًا رئيسيًا لمنصة المنافسة ذات النماذج الكبيرة متعددة الوسائط Compass Multi-Modal Arena! تهدف المنصة إلى تزويد المستخدمين بمنصة ملائمة لتجربة ومقارنة مختلف النماذج الكبيرة متعددة الوسائط السائدة، وفي النهاية مساعدة المستخدمين في العثور على النموذج الذي يلبي احتياجاتهم على أفضل وجه. سيقدم لك محرر Downcodes هذا التحديث المثير بالتفصيل.
أعلن فريق OpenCompass التابع لمختبر شنغهاي للذكاء الاصطناعي Sinan وModelScope مؤخرًا أن منصة تقييم النماذج الكبيرة الخاصة بهم Compass Arena قد خضعت لتحديث مهم وأطلقت قسمًا جديدًا للمنافسة على النماذج الكبيرة متعددة الوسائط Compass Multi-Modal Arena. يوفر هذا القسم الجديد منصة للمستخدمين لتجربة ومقارنة تأثيرات مجموعة متنوعة من النماذج الكبيرة متعددة الوسائط السائدة، مما يساعد المستخدمين في العثور على النموذج الذي يناسب احتياجاتهم على أفضل وجه.
تم فتح الموقع الرسمي وصفحة ModelScope الخاصة بـ Compass Multi-Modal Arena للجمهور، مما يوفر واجهة بسيطة وسهلة الاستخدام ويمكن للمستخدمين تحميل الصور وإدخال الأسئلة، وسيقوم النظام بترتيب نموذجين كبيرين مجهولين ومتعددي الوسائط لتوليد الإجابات بناءً على محتوى الإدخال. يقوم المستخدمون بإجراء تقييمات ذاتية بناءً على جودة المحتوى الذي تم إنشاؤه، واختيار النموذج الذي يعتقدون أنه يحقق أداءً أفضل. بعد اكتمال التقييم، يمكن للمستخدم رؤية اسم كل نموذج.
تحتوي المنصة أيضًا على بنك أسئلة خاص مدمج، وهو مناسب للمستخدمين لاستخدامه عندما يكون تحميل الصور غير مريح. يركز بنك الأسئلة على مهام الأسئلة والأجوبة المرئية الذاتية، مثل فهم الميمات، وتقدير الأعمال الفنية، وتقدير التصوير الفوتوغرافي. يهدف هذا التصميم إلى تقييم الأداء وتجربة المستخدم للنماذج الكبيرة متعددة الوسائط في المهام الذاتية.
الموقع الرسمي لـ Compass Multi-Modal Arena
https://opencompass.org.cn/arena?type=multimodal
صفحة ModelScope:
https://modelscope.cn/studios/opencompass/CompassArena
صفحة تعانق الوجه
https://huggingface.co/spaces/opencompass/CompassArena
أداة تقييم الوسائط المتعددة OpenCompass رابط مفتوح المصدر:
https://github.com/open-compass/VLMEvalKit
بشكل عام، يوفر تحديث Compass Multi-Modal Arena منصة جديدة ومريحة لتقييم واختيار النماذج الكبيرة متعددة الوسائط، والتي تستحق تجربة المستخدم والاهتمام. ونحن نتطلع إلى التحديثات المستمرة لهذه المنصة في المستقبل لتقديم المزيد من المفاجآت للمستخدمين!