上海人工智慧實驗室司南OpenCompass 團隊與魔搭ModelScope 攜手推出多模態大模型競技平台Compass Multi-Modal Arena 的重大更新!該平台旨在為用戶提供一個便利的平台,體驗和比較各種主流多模態大模型,最終幫助用戶找到最符合自身需求的模型。 Downcodes小編將為您詳細介紹這項令人興奮的更新。
上海人工智慧實驗室司南OpenCompass 團隊與魔搭ModelScope 最近宣布,他們的大模型評測平台Compass Arena 進行了重要更新,推出了全新的多模態大模型競技版塊Compass Multi-Modal Arena。這個新版塊為使用者提供了一個平台,可以體驗並比較多款主流多模態大模型的效果,幫助使用者找到最適合自己需求的模型。
Compass Multi-Modal Arena 的官網和ModelScope 頁面已向公眾開放,提供了一個簡單易用的介面,使用者可以上傳影像並輸入問題,系統會安排兩個匿名的多模態大模型根據輸入內容產生答案。使用者基於生成內容的品質進行主觀評估,選擇他們認為表現較出色的模型。評估完成後,使用者可以看到每個模型的名稱。
平台也內建了特色題庫,方便使用者在不便上傳影像時使用,題庫著重於主觀視覺問答任務,如迷因理解、藝術品賞析和攝影作品賞析等類型。這項設計旨在評估多模態大模型在主觀任務上的表現和使用者體驗。
Compass Multi-Modal Arena 官網
https://opencompass.org.cn/arena?type=multimodal
ModelScope 頁面:
https://modelscope.cn/studios/opencompass/CompassArena
HuggingFace 頁面
https://huggingface.co/spaces/opencompass/CompassArena
OpenCompass 多模態評測工具開源連結:
https://github.com/open-compass/VLMEvalKit
總而言之,Compass Multi-Modal Arena 的更新為多模態大模型的評估和選擇提供了一個全新的、便利的平台,值得廣大使用者體驗和關注。 期待未來該平台能持續更新,為用戶帶來更多驚喜!