대형 모델 평가 플랫폼 Compass Arena, 복합형 대형 모델 경쟁 섹션 추가

저자：Eve Cole 업데이트 시간：2024-12-06 20:48:02

Shanghai Artificial Intelligence Laboratory Sinan의 OpenCompass 팀과 ModelScope가 공동으로 다중 모드 대형 모델 경쟁 플랫폼 Compass Multi-Modal Arena의 주요 업데이트를 출시했습니다! 이 플랫폼은 사용자에게 다양한 주류 다중 모드 대형 모델을 경험하고 비교할 수 있는 편리한 플랫폼을 제공하고 궁극적으로 사용자가 자신의 요구에 가장 적합한 모델을 찾을 수 있도록 돕는 것을 목표로 합니다. Downcodes 편집자가 이 흥미로운 업데이트를 자세히 소개할 것입니다.

Shanghai Artificial Intelligence Laboratory Sinan과 ModelScope의 OpenCompass 팀은 최근 대형 모델 평가 플랫폼인 Compass Arena가 중요한 업데이트를 거쳐 새로운 다중 모드 대형 모델 경쟁 섹션인 Compass Multi-Modal Arena를 출시했다고 발표했습니다. 이 새로운 섹션은 사용자가 다양한 주류 다중 모드 대형 모델의 효과를 경험하고 비교할 수 있는 플랫폼을 제공하여 사용자가 자신의 요구에 가장 적합한 모델을 찾는 데 도움을 줍니다.

Compass Multi-Modal Arena의 공식 웹사이트와 ModelScope 페이지가 대중에게 공개되어 간단하고 사용하기 쉬운 인터페이스를 제공합니다. 사용자는 이미지를 업로드하고 질문을 입력할 수 있으며 시스템은 두 개의 익명의 다중 모드 대형 모델을 배열합니다. 입력 내용을 기반으로 답변을 생성합니다. 사용자는 생성된 콘텐츠의 품질을 기반으로 주관적인 평가를 내리고 성능이 더 좋다고 생각하는 모델을 선택합니다. 평가가 완료되면 사용자는 각 모델의 이름을 볼 수 있습니다.

플랫폼에는 또한 이미지 업로드가 불편할 때 사용자가 사용하기 편리한 특수 질문 은행이 내장되어 있습니다. 질문 은행은 밈 이해, 작품 감상, 사진 감상 등 주관적인 시각적 질문 및 답변 작업에 중점을 둡니다. 이 디자인은 주관적인 작업에 대한 다중 모드 대형 모델의 성능과 사용자 경험을 평가하는 것을 목표로 합니다.

Compass Multi-Modal Arena 공식 웹사이트

https://opencompass.org.cn/arena?type=multimodal

모델 범위 페이지:

https://modelscope.cn/studios/opencompass/CompassArena

HuggingFace 페이지

https://huggingface.co/spaces/opencompass/CompassArena

OpenCompass 다중 모드 평가 도구 오픈 소스 링크:

https://github.com/open-compass/VLMEvalKit

전체적으로 Compass Multi-Modal Arena 업데이트는 사용자 경험과 관심을 끌 만한 다중 모드 대형 모델의 평가 및 선택을 위한 새롭고 편리한 플랫폼을 제공합니다. 앞으로도 이 플랫폼을 계속 업데이트하여 사용자에게 더 많은 놀라움을 선사할 수 있기를 기대합니다!