Das OpenCompass-Team des Shanghai Artificial Intelligence Laboratory Sinan und ModelScope haben gemeinsam ein großes Update der multimodalen Wettbewerbsplattform für große Modelle Compass Multi-Modal Arena gestartet! Ziel der Plattform ist es, Benutzern eine praktische Plattform zum Erleben und Vergleichen verschiedener gängiger multimodaler Großmodelle zu bieten und ihnen letztendlich dabei zu helfen, das Modell zu finden, das ihren Anforderungen am besten entspricht. Der Herausgeber von Downcodes wird Ihnen dieses spannende Update ausführlich vorstellen.
Das OpenCompass-Team des Shanghai Artificial Intelligence Laboratory Sinan und ModelScope gaben kürzlich bekannt, dass ihre Plattform zur Evaluierung großer Modelle, Compass Arena, einem wichtigen Update unterzogen wurde und einen neuen multimodalen Wettbewerbsbereich für große Modelle, Compass Multi-Modal Arena, eingeführt hat. Dieser neue Abschnitt bietet Benutzern eine Plattform zum Erleben und Vergleichen der Auswirkungen einer Vielzahl gängiger multimodaler Großmodelle und hilft Benutzern dabei, das Modell zu finden, das ihren Anforderungen am besten entspricht.
Die offizielle Website und die ModelScope-Seite von Compass Multi-Modal Arena wurden der Öffentlichkeit zugänglich gemacht und bieten eine einfache und benutzerfreundliche Oberfläche. Benutzer können Bilder hochladen und Fragen eingeben, und das System wird zwei anonyme multimodale große Modelle arrangieren um Antworten basierend auf dem Eingabeinhalt zu generieren. Benutzer nehmen subjektive Bewertungen auf der Grundlage der Qualität der generierten Inhalte vor und wählen das Modell aus, von dem sie glauben, dass es die bessere Leistung erbringt. Nachdem die Bewertung abgeschlossen ist, kann der Benutzer den Namen jedes Modells sehen.
Die Plattform verfügt außerdem über eine integrierte spezielle Fragenbank, die für Benutzer praktisch ist, wenn das Hochladen von Bildern unpraktisch ist. Die Fragenbank konzentriert sich auf subjektive visuelle Frage- und Antwortaufgaben wie das Verständnis von Memes, die Wertschätzung von Kunstwerken und die Wertschätzung von Fotografien. Dieses Design zielt darauf ab, die Leistung und Benutzererfahrung multimodaler großer Modelle bei subjektiven Aufgaben zu bewerten.
Offizielle Website der Compass Multi-Modal Arena
https://opencompass.org.cn/arena?type=multimodal
ModelScope-Seite:
https://modelscope.cn/studios/opencompass/CompassArena
HuggingFace-Seite
https://huggingface.co/spaces/opencompass/CompassArena
Open-Source-Link zum multimodalen Bewertungstool OpenCompass:
https://github.com/open-compass/VLMEvalKit
Alles in allem bietet das Update der Compass Multi-Modal Arena eine neue und praktische Plattform für die Bewertung und Auswahl multimodaler Großmodelle, die Benutzererfahrung und Aufmerksamkeit verdient. Wir freuen uns auf weitere Updates dieser Plattform in der Zukunft, um den Benutzern weitere Überraschungen zu bieten!