L'équipe OpenCompass du laboratoire d'intelligence artificielle de Shanghai Sinan et ModelScope ont lancé conjointement une mise à jour majeure de la plateforme de compétition multimodale de grands modèles Compass Multi-Modal Arena ! La plate-forme vise à fournir aux utilisateurs une plate-forme pratique pour découvrir et comparer divers grands modèles multimodaux grand public, et finalement aider les utilisateurs à trouver le modèle qui répond le mieux à leurs besoins. L’éditeur de Downcodes vous présentera en détail cette passionnante mise à jour.
L'équipe OpenCompass du laboratoire d'intelligence artificielle de Shanghai Sinan et ModelScope ont récemment annoncé que leur plate-forme d'évaluation de grands modèles Compass Arena a subi une mise à jour importante et a lancé une nouvelle section de compétition multimodale de grands modèles Compass Multi-Modal Arena. Cette nouvelle section fournit une plate-forme permettant aux utilisateurs d'expérimenter et de comparer les effets d'une variété de grands modèles multimodaux traditionnels, aidant ainsi les utilisateurs à trouver le modèle qui répond le mieux à leurs besoins.
Le site Web officiel et la page ModelScope de Compass Multi-Modal Arena ont été ouverts au public, offrant une interface simple et facile à utiliser. Les utilisateurs peuvent télécharger des images et saisir des questions, et le système organisera deux grands modèles multimodaux anonymes. pour générer des réponses basées sur le contenu d’entrée. Les utilisateurs effectuent des évaluations subjectives basées sur la qualité du contenu généré, choisissant le modèle qui leur semble le plus performant. Une fois l'évaluation terminée, l'utilisateur peut voir le nom de chaque modèle.
La plate-forme dispose également d'une banque de questions spéciale intégrée, qui est pratique pour les utilisateurs lorsque le téléchargement d'images n'est pas pratique. La banque de questions se concentre sur les tâches de questions et réponses visuelles subjectives, telles que la compréhension des mèmes, l'appréciation des œuvres d'art et l'appréciation de la photographie. Cette conception vise à évaluer les performances et l'expérience utilisateur de grands modèles multimodaux sur des tâches subjectives.
Site officiel de Compass Multi-Modal Arena
https://opencompass.org.cn/arena?type=multimodal
Page ModèleScope :
https://modelscope.cn/studios/opencompass/CompassArena
Page Câlins
https://huggingface.co/spaces/opencompass/CompassArena
Lien open source de l’outil d’évaluation multimodale OpenCompass :
https://github.com/open-compass/VLMEvalKit
Dans l’ensemble, la mise à jour de Compass Multi-Modal Arena fournit une nouvelle plate-forme pratique pour l’évaluation et la sélection de grands modèles multimodaux, qui mérite l’expérience et l’attention des utilisateurs. Nous attendons avec impatience les mises à jour continues de cette plateforme à l'avenir pour apporter plus de surprises aux utilisateurs !