大模型評測平台Compass Arena新增多模態大模型競技版塊

作者：Eve Cole 更新時間：2024-12-06 20:48:02

上海人工智慧實驗室司南OpenCompass 團隊與魔搭ModelScope 攜手推出多模態大模型競技平台Compass Multi-Modal Arena 的重大更新！該平台旨在為用戶提供一個便利的平台，體驗和比較各種主流多模態大模型，最終幫助用戶找到最符合自身需求的模型。 Downcodes小編將為您詳細介紹這項令人興奮的更新。

上海人工智慧實驗室司南OpenCompass 團隊與魔搭ModelScope 最近宣布，他們的大模型評測平台Compass Arena 進行了重要更新，推出了全新的多模態大模型競技版塊Compass Multi-Modal Arena。這個新版塊為使用者提供了一個平台，可以體驗並比較多款主流多模態大模型的效果，幫助使用者找到最適合自己需求的模型。

Compass Multi-Modal Arena 的官網和ModelScope 頁面已向公眾開放，提供了一個簡單易用的介面，使用者可以上傳影像並輸入問題，系統會安排兩個匿名的多模態大模型根據輸入內容產生答案。使用者基於生成內容的品質進行主觀評估，選擇他們認為表現較出色的模型。評估完成後，使用者可以看到每個模型的名稱。

平台也內建了特色題庫，方便使用者在不便上傳影像時使用，題庫著重於主觀視覺問答任務，如迷因理解、藝術品賞析和攝影作品賞析等類型。這項設計旨在評估多模態大模型在主觀任務上的表現和使用者體驗。

Compass Multi-Modal Arena 官網

https://opencompass.org.cn/arena?type=multimodal

ModelScope 頁面:

https://modelscope.cn/studios/opencompass/CompassArena

HuggingFace 頁面

https://huggingface.co/spaces/opencompass/CompassArena

OpenCompass 多模態評測工具開源連結:

https://github.com/open-compass/VLMEvalKit

總而言之，Compass Multi-Modal Arena 的更新為多模態大模型的評估和選擇提供了一個全新的、便利的平台，值得廣大使用者體驗和關注。期待未來該平台能持續更新，為用戶帶來更多驚喜！